合成生物学允许科学家对细胞进行生物工程设计,以合成新的有价值的分子,如可再生生物燃料或抗癌药物。然而,传统的合成生物学方法涉及到特殊的工程研究与实践,导致研发周期很长。
2020年9月25日Nature Communication报道,美国能源部劳伦斯伯克利国家实验室的科学家们开发了一种自动推荐工具(Automated Recommendation Tool,ART),使机器学习算法适应合成生物学的需要,系统地指导工程细胞的开发。这一创新意味着科学家们将不必花费数年时间对细胞的每个部分以及细胞的功能进行细致的了解,然后才能对其进行操作。结合机器学习,通过有限的训练数据集,ART能够预测细胞的DNA或生物化学变化将如何影响其行为,然后对下一个工程周期提出建议,并对实现预期目标的概率进行预测。
在优化色氨酸代谢的实验中,研究者选取了酿酒酵母的5个基因,每个基因由不同的基因启动子和细胞内的其他机制调控,总共涉及近8000种潜在的生物途径组合。研究人员利用其中250条路径的实验数据进行算法训练,ART工具就能够推断出剩余的7000多个组合如何影响色氨酸的产生,最终推荐的设计方案比表现最好的参照菌株增加了106%的色氨酸产量,比用于训练模型的最佳设计增加了17%。