人体的每个细胞都被一种叫做抗原的蛋白质碎片所覆盖,这种蛋白质碎片可以告诉免疫系统细胞内的情况。抗原存在于被外来入侵者感染的细胞上,或已成为恶性肿瘤的细胞上,引发免疫攻击。这些抗原通常被用于疫苗中,以刺激免疫系统对流感等病毒的反应。但要制造出有效刺激癌症攻击的疫苗,研究人员需要准确预测哪些肿瘤特异性抗原将显示在肿瘤细胞上,因此将是最好的癌症疫苗。
现在,麻省理工学院布罗德研究所、哈佛大学、达纳-法伯癌症研究所和麻省总医院的科学家们开发了一种新的计算工具,可以帮助完成这项任务。研究人员转向机器学习,分析了他们发现的18.5万多种人类抗原,并生成了一套新的规则,预测哪些抗原出现在人体细胞表面。这项研究结果发表在今天的《自然生物技术》杂志上,它可能有助于开发新的治疗方法,刺激免疫系统攻击癌症以及病毒和细菌。
“我们的目标是能够在个性化水平上精确预测抗原,”布罗德研究所(Broad Institute)细胞回路中心(Center for Cell Circuits)联席主任、麻省总医院(Massachusetts General Hospital)癌症免疫学中心(Center for Cancer Immunology)主任、该研究的联合高级作者尼尔·哈科亨(Nir Hacohen)说。“我们现在离这个目标更近了,但这个领域还有更多的工作要做。”
抗原多样性
弄清楚一个人的肿瘤抗原是很困难的,因为它们因人而异。一种被称为抗原呈递系统的细胞程序通过切割任何给定细胞内的蛋白质来产生抗原,然后使用人类白细胞抗原(HLA)蛋白质与这些碎片结合并在细胞表面显示这些碎片的一小部分。但HLA基因是人类最多样化的基因,导致人类中有超过10,000种不同的HLA类型。这就导致了最终在细胞表面的蛋白质片段的多样性。
研究人员可以使用简单的血液测试来确定一个人的HLA类型。但人与人之间的癌症差异如此之大,仅知道一个人的HLA类型还不足以预测肿瘤细胞表面的情况。
“如果你可以把一个人的数据和他们的癌症,并能够预测显示肿瘤特异性抗原,可以帮助我们与那些抗原诱导免疫反应,通过一种疫苗或找到其他机制,”凯瑟琳说,肿瘤学家,部门的首席干细胞移植和细胞疗法丹纳-法伯癌症研究所,研究所成员广泛的研究所,和文章的第二作者的论文。
在这项新研究中,吴和哈考恩与布洛德癌症研究所(Broad)的蛋白质组学高级主任史蒂文·卡尔(Steven Carr)、达纳-法伯癌症研究所(Dana-Farber Cancer Institute)的德林·凯斯金(Derin Keskin)等人合作。该团队从95个人类细胞系中分离出所有HLA相关蛋白片段,这些细胞系在不同人群中分别代表常见和罕见的HLA类型。然后研究人员用质谱法来表征这些抗原。得到的数据集包含186,464个蛋白质片段或多肽序列。该团队寻找HLA类型和肽之间的关系,但意识到他们需要复杂的工具来系统地解决这个问题。
“我们研究了数据中的各种模式,”Hacohen实验室的研究生、这篇新论文的共同第一作者塞西·萨尔基佐娃(Sisi Sarkizova)说。“但我们需要借助机器学习来更好地预测是否会出现一种新的、看不见的抗原。”
调用计算机
利用机器学习的方法,研究小组将每个抗原序列,以及抗原来源的细胞的HLA类型输入电脑程序。该程序对数据进行分析,并确定新的规则,规定每种HLA类型呈现哪些抗原。影响细胞表达何种多肽的关键因素包括多肽的长度、表达水平、与HLA蛋白结合的特异性序列以及其他化学性质。
研究小组还发现,某些肽可由一种以上的HLA类型显示。Keskin说:“这是我们没有预料到的事情,这对疫苗的开发非常有好处,因为一种疫苗可以潜在地覆盖更多带有相同抗原的人。”
为了测试新规则的有效性,研究小组从11个人类肿瘤样本(3个慢性淋巴细胞白血病、1个卵巢、3个胶质母细胞瘤和4个黑色素瘤)中输入了第二组数据到模型中。“它识别出的抗原数量几乎是之前方法的两倍,并且准确预测了使用质谱法检测到的超过75%的hla结合肽,”卡尔的研究组博士后研究员、该研究的共同第一作者苏珊·克拉格(Susan Klaeger)说。
新模型将免费提供给其他研究人员使用,不仅可以帮助研究人员设计出更好的癌症疫苗,还可以帮助他们设计出针对病原体的疫苗,如人类免疫缺陷病毒(HIV),这种病毒在人与人之间迅速变异。
研究人员正在努力进一步提高模型的准确性,并将其整合到正在进行的癌症疫苗临床试验中,以更有效地将疫苗与患者匹配。
吴教授说:“我们已经证明,通过预测个性化水平上的抗原,可以诱发抗肿瘤免疫反应。”Keskin补充说,“我们的新方法将帮助我们做得更好,我们对95种常见和罕见的HLA等位基因的分析将使预测全世界大多数人群的肿瘤抗原成为可能。”