《Science论文解读!通过对病毒表面蛋白进行建模,确定流感病毒、HIV和冠状病毒的进化和逃逸突变,从而为开发通用疫苗奠定基础》

  • 来源专题:生物安全知识资源中心 | 领域情报网
  • 编译者: hujm
  • 发布时间:2021-01-20
  • 制造针对某些病毒(包括流感病毒和HIV)的有效疫苗如此困难的原因之一是,这些病毒变异非常迅速。这使得它们能够通过一种称为 “病毒逃逸”的过程,逃避特定疫苗产生的抗体。

    在一项新的研究中,来自美国麻省理工学院的研究人员如今设计了一种新的基于最初为分析语言而开发的模型的方法,可在计算上构建病333毒逃逸的模型。该模型可以预测病毒表面蛋白的哪些部分更有可能发生突变,从而使得病毒逃逸,它还可以识别出不太可能发生突变的部分,使其成为开发新疫苗的良好靶标。相关研究结果发表在2021年1月15日的Science期刊上,论文标题为“Learning the language of viral evolution and escape”。

    麻省理工学院计算机科学与人工智能实验室计算与生物学小组负责人Bonnie Berger说,“病毒逃逸是一个大问题。流感病毒的表面蛋白和HIV的包膜表面蛋白发生的病毒逃逸,都是导致我们没有通用的流感疫苗和HIV病毒疫苗的原因,这两种病毒每年都会造成数十万人死亡。”

    在这项研究中,Berger和她的同事们鉴定出用于开发针对流感病毒、HIV和SARS-CoV-2的疫苗的潜在靶标。自从这篇论文被接受发表后,这些研究人员还将他们的模型应用于最近在英国和南非出现的SARS-CoV-2新变种。他们说,这一尚未经过同行评审的分析表明应当对这种病毒变种的基因序列进行进一步调查,以确定它们是否有可能逃脱现有疫苗的影响。

    Berger和麻省理工学院生物工程助理教授Bryan Bryson是这篇论文的通讯作者。论文第一作者为麻省理工学院研究生Brian Hie。

    蛋白语言

    不同类型的病毒获得基因突变的速度不同,HIV和流感病毒属于突变最快的病毒之一。这些突变要想促进病毒逃逸,它们必须帮助病毒改变其表面蛋白的形状,使抗体不能再与之结合。然而,蛋白发生的变化不能使其失去功能。

    这些研究人员决定使用一种称为语言模型的计算模型来对这些标准进行建模,这种计算模型来自自然语言处理(NLP)领域。这些模型最初是为了分析语言中的模式,特别是与某些词一起出现的频率。然后,这些模型可以预测哪些词可以用来完成一个句子,比如“Sally吃鸡蛋是为了......”。所选的词必须既在语法上正确,又有正确的含义。在这个例子中,NLP模型可能会预测“早餐”,或者“午餐”。

    这些研究人员的关键见解是,这种类型的模型也可以应用于生物信息,如基因序列。在这种情况下,语法类似于决定特定序列编码的蛋白是否具有功能的规则,而语义类似于蛋白是否可以采取新的形状,帮助它逃避抗体。因此,能够使病毒逃逸的突变必须保持序列的语法性,但要以有用的方式改变蛋白的结构。

    Hie说,“如果病毒想要逃避人类免疫系统,它又不想让自己突变,那么它就会死亡或无法复制。它想要保持适应度,但要把自己伪装得足够好,以便它无法被人类免疫系统检测到。”

    为了对这一过程进行建模,这些研究人员训练了一种NLP模型来分析在基因序列中发现的模式,这使得它能够预测具有新功能但仍然遵循蛋白结构的生物学规则的新序列。这种建模的一个重要优势是,它只需要序列信息,而序列信息比蛋白结构更容易获得。该模型可以在相对较少的信息量上进行训练---在这项研究中,他们使用了6万个HIV序列、4.5万个流感病毒序列和4000个冠状病毒序列。

    Hie说,“语言模型是非常强大的,这是因为它可以学习这种复杂的分布结构,并仅仅从序列变化中获得一些对功能的见解。我们有针对每个氨基酸位置的病毒序列数据的这个大的语料库,这种模型可以在训练数据中学习氨基酸共发生和共变异的特性。”

    阻断病毒逃逸

    一旦这种模型得到训练,这些研究人员就用它来预测冠状病毒刺突蛋白、HIV包膜蛋白和流感病毒血凝素(HA)蛋白的序列,这些序列或多或少会产生逃逸突变。

    对于流感病毒来说,该模型显示,最不可能发生突变和产生病毒逃逸的序列是HA蛋白的柄部。这与最近的研究结果---针对HA蛋白柄部的抗体(大多数感染流感病毒或接种流感疫苗的人不会产生这类抗体)可以对任何流感病毒株提供近乎普遍的保护---是一致的。

    这种模型对冠状病毒的分析表明,刺突蛋白中称为S2亚基的的一部分最不可能产生逃逸突变。SARS-CoV-2病毒变异的速度有多快仍是个问题,因此当前部署的抗击COVID-19大流行的疫苗能保持多久的有效性还是个未知数。初步证据表明,该病毒的变异速度不像流感病毒或HIV那样快。然而,科学家们最近发现了在新加坡、南非和马来西亚出现的新突变,他们认为应该对潜在的病毒逃逸进行调查(这些新数据还没有经过同行评审)。

    在对HIV的研究中,这些研究人员发现,包膜蛋白的V1-V2超变区有很多可能的逃逸突变,这与之前的研究结果一致,他们还发现了一些逃逸概率会比较低的序列。

    这些研究人员正在正与其他人合作,利用他们的模型来鉴定刺激人体自身的免疫系统来消灭肿瘤的癌症疫苗的潜在靶点。他们说,这也可以用来设计可能不太容易引发抗药性的小分子药物,用于治疗结核病等疾病。

    Bryson,“有很多机会,最美妙的事情就是我们所需要的是很容易产生的序列数据。”

  • 原文来源:https://science.sciencemag.org/content/371/6526/284;https://science.sciencemag.org/content/371/6526/233;https://phys.org/news/2021-01-viruses-immune.html;https://news.bioon.com/article/6783149.html
相关报告
  • 《Science论文解读!通过对病毒表面蛋白进行建模,确定流感病毒、HIV和冠状病毒的进化和逃逸突变,从而为开发通用疫苗奠定基础》

    • 来源专题:中国科学院病毒学领域知识资源中心
    • 编译者:malili
    • 发布时间:2021-02-01
    • 2021年1月19日讯/生物谷BIOON/---制造针对某些病毒(包括流感病毒和HIV)的有效疫苗如此困难的原因之一是,这些病毒变异非常迅速。这使得它们能够通过一种称为 “病毒逃逸”的过程,逃避特定疫苗产生的抗体。 在一项新的研究中,来自美国麻省理工学院的研究人员如今设计了一种新的基于最初为分析语言而开发的模型的方法,可在计算上构建病毒逃逸的模型。该模型可以预测病毒表面蛋白的哪些部分更有可能发生突变,从而使得病毒逃逸,它还可以识别出不太可能发生突变的部分,使其成为开发新疫苗的良好靶标。相关研究结果发表在2021年1月15日的Science期刊上,论文标题为“Learning the language of viral evolution and escape”。 麻省理工学院计算机科学与人工智能实验室计算与生物学小组负责人Bonnie Berger说,“病毒逃逸是一个大问题。流感病毒的表面蛋白和HIV的包膜表面蛋白发生的病毒逃逸,都是导致我们没有通用的流感疫苗和HIV病毒疫苗的原因,这两种病毒每年都会造成数十万人死亡。” 在这项研究中,Berger和她的同事们鉴定出用于开发针对流感病毒、HIV和SARS-CoV-2的疫苗的潜在靶标。自从这篇论文被接受发表后,这些研究人员还将他们的模型应用于最近在英国和南非出现的SARS-CoV-2新变种。他们说,这一尚未经过同行评审的分析表明应当对这种病毒变种的基因序列进行进一步调查,以确定它们是否有可能逃脱现有疫苗的影响。 Berger和麻省理工学院生物工程助理教授Bryan Bryson是这篇论文的通讯作者。论文第一作者为麻省理工学院研究生Brian Hie。 蛋白语言 不同类型的病毒获得基因突变的速度不同,HIV和流感病毒属于突变最快的病毒之一。这些突变要想促进病毒逃逸,它们必须帮助病毒改变其表面蛋白的形状,使抗体不能再与之结合。然而,蛋白发生的变化不能使其失去功能。 这些研究人员决定使用一种称为语言模型的计算模型来对这些标准进行建模,这种计算模型来自自然语言处理(NLP)领域。这些模型最初是为了分析语言中的模式,特别是与某些词一起出现的频率。然后,这些模型可以预测哪些词可以用来完成一个句子,比如“Sally吃鸡蛋是为了......”。所选的词必须既在语法上正确,又有正确的含义。在这个例子中,NLP模型可能会预测“早餐”,或者“午餐”。 这些研究人员的关键见解是,这种类型的模型也可以应用于生物信息,如基因序列。在这种情况下,语法类似于决定特定序列编码的蛋白是否具有功能的规则,而语义类似于蛋白是否可以采取新的形状,帮助它逃避抗体。因此,能够使病毒逃逸的突变必须保持序列的语法性,但要以有用的方式改变蛋白的结构。 Hie说,“如果病毒想要逃避人类免疫系统,它又不想让自己突变,那么它就会死亡或无法复制。它想要保持适应度,但要把自己伪装得足够好,以便它无法被人类免疫系统检测到。” 为了对这一过程进行建模,这些研究人员训练了一种NLP模型来分析在基因序列中发现的模式,这使得它能够预测具有新功能但仍然遵循蛋白结构的生物学规则的新序列。这种建模的一个重要优势是,它只需要序列信息,而序列信息比蛋白结构更容易获得。该模型可以在相对较少的信息量上进行训练---在这项研究中,他们使用了6万个HIV序列、4.5万个流感病毒序列和4000个冠状病毒序列。 Hie说,“语言模型是非常强大的,这是因为它可以学习这种复杂的分布结构,并仅仅从序列变化中获得一些对功能的见解。我们有针对每个氨基酸位置的病毒序列数据的这个大的语料库,这种模型可以在训练数据中学习氨基酸共发生和共变异的特性。” 阻断病毒逃逸 一旦这种模型得到训练,这些研究人员就用它来预测冠状病毒刺突蛋白、HIV包膜蛋白和流感病毒血凝素(HA)蛋白的序列,这些序列或多或少会产生逃逸突变。 对于流感病毒来说,该模型显示,最不可能发生突变和产生病毒逃逸的序列是HA蛋白的柄部。这与最近的研究结果---针对HA蛋白柄部的抗体(大多数感染流感病毒或接种流感疫苗的人不会产生这类抗体)可以对任何流感病毒株提供近乎普遍的保护---是一致的。 这种模型对冠状病毒的分析表明,刺突蛋白中称为S2亚基的的一部分最不可能产生逃逸突变。SARS-CoV-2病毒变异的速度有多快仍是个问题,因此当前部署的抗击COVID-19大流行的疫苗能保持多久的有效性还是个未知数。初步证据表明,该病毒的变异速度不像流感病毒或HIV那样快。然而,科学家们最近发现了在新加坡、南非和马来西亚出现的新突变,他们认为应该对潜在的病毒逃逸进行调查(这些新数据还没有经过同行评审)。 在对HIV的研究中,这些研究人员发现,包膜蛋白的V1-V2超变区有很多可能的逃逸突变,这与之前的研究结果一致,他们还发现了一些逃逸概率会比较低的序列。 这些研究人员正在正与其他人合作,利用他们的模型来鉴定刺激人体自身的免疫系统来消灭肿瘤的癌症疫苗的潜在靶点。他们说,这也可以用来设计可能不太容易引发抗药性的小分子药物,用于治疗结核病等疾病。 Bryson,“有很多机会,最美妙的事情就是我们所需要的是很容易产生的序列数据。”(生物谷 Bioon.com) 参考资料: 1.Brian Hie el al. Learning the language of viral evolution and escape. Science, 2021, doi:10.1126/science.abd7331. 2.Yoo-Ah Kim el al. The language of a virus. Science, 2021, doi:10.1126/science.abf6894. 3.Model analyzes how viruses escape the immune system https://phys.org/news/2021-01-viruses-immune.html
  • 《流感病毒上的“小尾巴” 或让通用流感疫苗成真》

    • 来源专题:生物安全知识资源中心—领域情报网
    • 编译者:hujm
    • 发布时间:2022-02-24
    • 作为RNA病毒的流感病毒可谓非常“善变”。不过近日传来一个好消息,美国斯克利普斯研究所、芝加哥大学和西奈山伊坎医学院的科学家们发现了流感病毒的一个“阿喀琉斯之踵”,这也为他们寻求通用流感疫苗方面的研究带来了帮助。研究人员在《自然》杂志上报告称,即便病毒每年都发生变异,但关注病毒长期被忽视部分的抗体(研究人员称之为锚抗体),有可能识别出各种各样的流感毒株。   流感病毒为何如此“善变”   虽然都被称为感冒,但流感可比普通感冒“破坏力”大多了。感染流感病毒后,患者会突发高热、咳嗽、头痛、全身无力、肌肉疼痛等。而且流感很容易引发各种严重的并发症,包括肺炎、中耳炎、心肌炎、脑膜炎等。   据世界卫生组织(WHO)2015年统计的数据,全球每年约有5%—10%的成人和20%—30%的儿童罹患季节性流感,导致全球出现300万—500万重症病例。每年约有25万—50万人因流感而死亡。   不过幸运的是,流感可以通过接种疫苗预防。只是流感疫苗不像水痘、白喉等疾病的疫苗一样,接种一两次就可以一劳永逸,流感疫苗需要每年接种。其中一个重要原因就是流感病毒发生突变的频率较高。   “流感病毒是RNA囊膜病毒,可分为甲、乙、丙、丁四型。其中甲型与乙型会在人类中引起较严重的疾病,是造成人类疾病的主要病原。”湖北大学生命科学学院教授陈纯琪介绍,由于流感病毒的基因组是RNA,因此在复制的过程中其非常容易发生突变。   在流感病毒外壳上的血凝素蛋白与神经氨酸酶,不但是病毒的主要抗原,更与病毒的感染和复制息息相关。   “这两个蛋白质就像是流感病毒感染细胞时一进一出的两把钥匙。”陈纯琪解释说,流感病毒感染细胞时,需要血凝素蛋白与细胞表面受体结合,而当病毒在细胞内完成复制扩增,要去感染更多细胞的时候,则需要神经氨酸酶的作用。   以病毒种类繁多且经常发生变异的甲型流感病毒为例,目前已经被鉴定出来的甲型流感病毒血凝素蛋白有18种,根据发现时间先后编号,分别被命名为H1到H18,而神经氨酸酶有11种,被命名为N1到N11。比如新冠病毒暴发前,让人类如临大敌的猪流感H1N1就携带了一号血凝素蛋白(H1)和一号神经氨酸酶(N1)。   “流感病毒的变异也不是随心所欲的,像甲型流感有小变异和大变异两种,其中造成抗原小变异的抗原漂移,只在原先的基因上发生点突变,产生局部的改变。而大变异则是造成抗原大变异的抗原转变,这种变异影响范围大,可以把整个血凝素蛋白和神经氨酸酶彻底换成别的种类,比方说H1换成H3,N1换成N2。”陈纯琪说。   血凝素蛋白位于病毒颗粒最外层,又与病毒感染细胞有关,所以人体免疫系统只要能够产生中和抗体来识别并阻挡血凝素的作用,就能够有效防止病毒感染。   “然而流感病毒能够通过抗原变异的过程来改变血凝素蛋白,以此逃脱免疫系统的识别与攻击,因此,尽管都是H3N2病毒株,也有可能在病毒的基因发生了一些突变之后,出现感染过H3N2病毒株的人再次受到感染的情况。”陈纯琪表示,这便是每年反复发生季节性流感的原因。   小变异发生的频率较高,属于量变,可引起流感的中、小型流行。抗原大变异发生的频率较低,大概每隔十几年才出现一次。但如果发生了抗原转变导致新亚型出现,或者是较长时间没有出现的旧亚型再度出现,大部分的人群在这种情况下缺乏相对应的免疫力,就可能会发生流感的大流行。   下季流行流感病毒株需预测   因为流感病毒容易发生变异,所以每一年造成季节性流感的病毒或多或少都有些差异。   现行的流感疫苗涵盖了H1N1以及H3N2这两个主要的甲型流感病毒以及一或两个乙型流感病毒。陈纯琪介绍,包含一种乙型流感病毒的称为三价疫苗,包含两种乙型流感病毒的称为四价疫苗。   根据流感病毒的变异,每年接种的流感疫苗都会做出相应的改变。WHO每年都会分析探讨如何选用下一季流行的流感疫苗株。   WHO通过分析全球的数据来预测下一季可能流行的流感病毒株;而后将新的病毒株与标准病毒株进行基因重组和驯化,制造出可用于生产的新病毒疫苗株。该疫苗株要带有变异病毒的外壳蛋白(即血凝素蛋白与神经氨酸酶)来引起人体的抗体保护反应,同时又要保有大部分标准病毒株的基因,如此才能很好地在受精鸡胚中扩增;再将疫苗病毒株注射至受精鸡胚中以培养扩增,之后收集病毒并进行活化;最后经检验合格,制成流感疫苗。   目前各大疫苗制作厂多使用受精鸡胚来大量制造流感病毒疫苗。“这种制造流感疫苗的技术稳定成熟,但制作需要使用大量合格的新鲜受精鸡胚,对鸡蛋严重过敏的人不可接种。”陈纯琪介绍,整个疫苗制作周期至少20周,如果突发流感疫情可能会供不应求。最关键的是如果一开始的预测不准确,便会影响整季的疫苗接种效果。   锚抗体或能识别多种流感病毒   尽管流感病毒很狡猾,但也并非无懈可击。   “流感病毒靠外壳上的血凝素蛋白来感染人体细胞,而针对血凝素蛋白产生的抗体也是阻挡病毒感染最重要的免疫反应。”陈纯琪解释,血凝素本身是一个长条型的蛋白质,形状和功能都像一把钥匙,最前端是负责与细胞受体结合的头部结构域,接着是一段长柱状的茎部结构域,最后端则有一个锚钉结构域,如此整个血凝素蛋白才能够固定在病毒的外壳上。   头部结构域是人体的中和抗体主要攻击的部位,但是头部区也最容易发生突变,变异之后就能够逃逸人体免疫系统的识别。相对于头部区,茎部较不容易发生突变,所以针对茎部区所产生的抗体可以对抗多种变异的流感病毒株,这就为设计通用流感病毒疫苗开启了一个新的思路。   科学家们将不同的头部区域与H1茎部区融合在一起,做成了嵌合型的血凝素蛋白,然后同样使用受精鸡胚来生产疫苗毒株。前期的临床试验已经证实,这种新型的疫苗是安全的,接种之后可以有效引发人体产生对抗病毒的抗体。   在《自然》近期发表的最新研究中,科研人员分析了358个不同的人源单克隆抗体,这些人都接种过传统或新型通用疫苗,或者是感染过流感病毒,所以体内带有对抗流感病毒的抗体。   “这些抗体有的可以识别血凝素头部区,有的可以识别茎部区,而其中有一组是可以识别锚钉部的抗体,作者称之为锚抗体,这是首次鉴定出的可以识别血凝素蛋白头部和茎部以外区域的抗体。”陈纯琪介绍,科研人员进一步测试这些锚抗体是否可以识别不同的流感病毒,结果发现锚抗体不但能中和多种H1变异病毒,也能中和H2以及H5病毒株。   科研人员更进一步使用小鼠的动物模型证实,这种抗体对三种不同的H1流感病毒株都有保护效果。由此证明,锚抗体具有预防病毒感染的效力。“而这些发现也说明了血凝素的锚钉区,是一个能够诱发保护性抗体的抗原,所以未来的通用流感疫苗制造应重点考虑将锚钉区纳入设计。”陈纯琪说。   最后陈纯琪表示,开发通用流感疫苗来对抗所有变异毒株,是所有设计流感病毒疫苗科学家共同的目标。理论上,只要在疫苗的成分中包含一个或多个不易变异又能够引起保护性中和抗体的区域,就能够达到预防大部分流感病毒的效果。科学家们一直在努力寻找这样的有效抗原区域,而近期的这篇论文正是证明了这个方向的可行性,并且为设计更加有效的通用流感疫苗提供了一个新的思路。