序言

想必大家对“淀粉”完全不陌生,它是生活中最常见的多糖之一。无论是面包还是馒头,无论是面条还是米饭,其中的主要成分基本都是淀粉,因此可以说淀粉为国人膳食宝塔打下了坚实根基。

近日,一篇名为“Cell-free chemoenzymatic starch synthesis from carbon dioxide”[1](无细胞化学酶法二氧化碳制淀粉)的论文轰动全网,引发了人们对未来农业变革的激烈讨论。这篇论文目前已经被各大媒体所广泛报道,网络上也有不少文章较为详细地介绍了论文的相关研究内容、研究方法和最终结论。

在近几天看到这条新闻以后,我第一反应就是赶快去拜读一下这篇论文。为了让感兴趣的同学更好理解这一重大突破,我和小伙伴们半人工地将这篇论文翻译成了中文(译文在第二条推文)。鉴于该实验的背景资料和实验结论已被各大媒体介绍的足够清楚,在这里便不多做赘述。在阅读论文后,我更想给大家详细地介绍该工作所采用的一些有趣的实验工具。

在这项科研工作中,计算机辅助合成设计、模块化组装和替代、蛋白质工程是最重要的三个工具,从这三个工具中,我们能够窥见跨学科研究成果对现代化学的意义。这一篇文章我就主要给大家介绍一下这三个工具是如何应用到本实验中的。

计算机辅助合成设计

Computational Pathway Design

计算机辅助合成设计(直译为计算路径设计)是一种通过计算路径成本、热力学及动力学可行性等数据来筛选合理可行的反应路径。据我个人理解,这个过程一般会依托于一个含有较多反应数据的数据库运行。

对此,给大家举个例子,使用过Reaxys(https://www.reaxys.com/)的同学们都知道,这个网站包含合成路径设计(Synthesis Planner)功能,每一步反应都可以根据需求筛选,其筛选条件不仅包括反应物、催化剂及溶剂的选定,还包括反应原料是否为商业化产品。

计算辅助合成设计的强大之处在于可以帮助我们筛掉许多不理想的路线,大大减少了试错实验的成本,为最终合成路线的设计提供借鉴。

在淀粉合成路线的研究工作中,实验团队采用的方法有些许不同,他们选用的不是Reaxys数据库,而是MetaCyc(https://metacyc.org/)(图1)和ATLAS(http://lcsb-databases.epfl.ch/pathways/atlas/)(图2)。

从二氧化碳制淀粉,看跨学科研究对化学的意义!,图片,二氧化碳,淀粉,模块化组装和替代,跨学科研究成果,农业变革,第1张

图1. MetaCyc

从二氧化碳制淀粉,看跨学科研究对化学的意义!,图片,二氧化碳,淀粉,模块化组装和替代,跨学科研究成果,农业变革,第2张

图2. ATLAS

与Reaxys相比,Metacyc和ATLAS主要包含的是生物酶促反应,而且这两个数据库都有自研的路径设计软件,更适合在体外模拟生物代谢过程时使用。

在工作中,作者采用了两个数据库的6568个主要反应集、包含甲酸酯的15个反应集和包含甲醇的8个反应集。

在此基础上,利用组合算法、简明的通量平衡分析的组合方法(comb-FBA)和Python的COBRApy工具箱,以甲酸或甲醇为起点,起草了最初步的淀粉合成途径。(在此之前,第一步合成是将二氧化碳转化为一碳中间体甲酸或甲醇)

 模块化组装和替代

“模块化”的概念相信大家不是第一次听说,模块化建筑、模块化主机的概念在近几年十分流行,但是将化学合成的过程模块化,对这一概念,我个人也还是第一次在研究论文中看到。

在本研究中,研究人员将这种新兴概念引入,将每一步重要反应过程都分为模块,每个模块有各自指定的输入(反应物)和输出(产物),最终连在一起就可以得到完整的自CO2至淀粉的合成路径。(图3)

从二氧化碳制淀粉,看跨学科研究对化学的意义!,图片,二氧化碳,淀粉,模块化组装和替代,跨学科研究成果,农业变革,第3张

图3. CO2至淀粉的合成路径

如图所示,本研究将二氧化碳到淀粉分为了四个大模块,分别是以CO2制备甲醇的一碳反应C1模块、由甲醇制备3-磷酸甘油醛的三碳反应C3模块、由3-磷酸甘油醛制备6-磷酸葡糖的六碳反应C6模块以及由6-磷酸葡糖至淀粉的n碳反应Cn模块。

将反应分为四个模块后,模块之间的反应物、催化剂(酶)不会发生相互作用,可以避免因组分复杂导致的底物错配等问题。同时,将反应过程模块化后,可以单独根据每个模块的输出产率对模块进行改进,每次只需要替换更合适的模块,而无需每次从头搭建反应。文中记录了各模块的改进过程,其中一个过程是这样的:

“尽管C1a,C1b和C3a模块在单独使用时都展示出了各自的功能,C1a或C1b和C3a的组合却并没能将甲酸或甲醇转化为可探测到的C3化合物。

我们推测这种节能但热力学不利的C1模块产生的边际甲醛可能无法为C3a模块中fls的关键反应提供原料。我们因此构建了一个热力学更有利的级联反应作为C1的替代方案。

其中热力学最有利的C1e模块与C3a模块成功组装,并从甲醇中获得了相当高的C3化合物产率。”

每一次组装对于实验团队来说其实都类似一个“适配”的过程,所选的模块都是能单独完成指定任务的,但考虑到每个模块输出的不只是指定的产物,还有未完全反应的残留反应物和部分催化剂,因此不得不在实践中对下游模块进行进一步的修正,以达到理想的效果。

蛋白质工程

从名字上看,“蛋白质工程”像是对蛋白质直接通过化学或者生物方法加以修改的一种工程,但事实并非如此。蛋白质工程是一种利用中心法则,通过化学、物理和分子生物学的手段进行基因修饰或基因合成,以达成对蛋白质的改造,或制造一种新的蛋白质的工程。

其实现流程大致为:确定所需蛋白质的功能和性质;由性质反推结构,得到所需蛋白质的结构,并确定氨基酸序列;由氨基酸序列反推DNA序列。

得到DNA序列后,再通过构建载体将DNA代入大肠杆菌等生物体内进行表达,就可以得到人为设计的、可能是自然界中从来未存在过的目标蛋白质。

前文提到,模块之间需要“适配”才能更好使用,而“适配”的主要方法就是对反应的催化剂——酶进行进一步修饰。

因此在本研究中,蛋白质工程被用于制备“更适配”的酶。通过蛋白质工程,可以使酶更好地适应上游模块的化学环境,甚至可以使酶有选择性地提高其针对某种特定底物的活性。

结语

计算辅助合成设计最早可以追溯到上世纪六十年代,蛋白质工程在上世纪八十年代才被提出,模块化组装和替代也是近十年才被引入化学化工学科。

如果没有计算辅助合成设计,合成化学将因合成路径长、需要大量试错等因素而遇到瓶颈,科学家需要花费更多资金购置化学品、消耗更多精力尝试不同方法以得到更高产率。

如果没有蛋白质工程,那么想大批量生产人工合成的蛋白质则会难于上青天,具体难度可以参见“人工合成牛胰岛素”。

如果没有模块化组装和替代,科学家在面对这样较长路径的反应进程时,可能难以对反应现象进行评估和分析,难以找到真正的“病根”,反复重新搭建反应还将会大幅降低实验效率。

现代化学中的新方法、新手段,在不断提高化学实验的可靠性,加快化学研究的进程,同时也在不断降低化学研究的成本。

如果我们把视角拉高来看,就能发现现在的跨学科发展有多么重要——计算辅助合成设计离不开计算机和网络的发展、蛋白质工程离不开分子生物学、化学生物学等生命科学的发展、模块化组装和替代理论离不开化学工业研究思路的进步。

反过来看,化学化工学科的发展对其他学科也存在促进作用。现在的化学已经和一百年前的化学大有不同了——以前的化学往往局限于研究单一物质或者单一现象,而现在的化学则更多地注重实际,研究如何更好创造一个能为某个领域服务的新物质或者发掘一个旧物质在某个领域的新应用,因此现代化学离不开其他学科的发展,其他学科也离不开现代化学的发展。

本篇文章所引的“二氧化碳合成淀粉”就是一个将二氧化碳应用于生物化学、甚至是农业领域的新应用典例。

在这样的“跨学科”时代中,我们也许就不能只局限在自己专业的舒适圈内,而是应该多了解其他学科的基本原理和发展状况,尝试结合所学促进各学科综合发展。