《腾讯AI Lab研究团队发布scBERT模型,攻克单细胞测序数据分析痛点》

  • 来源专题:生物安全网络监测与评估
  • 编译者: 闫亚飞
  • 发布时间:2022-11-25
  • 据生物世界公众号9月27日消息,腾讯AI Lab研究团队研发出关于单细胞注释的 scBERT 算法模型,实现了高解释性、高泛化性、高稳定性的单细胞类型注释技术。该团队研发的基于大规模预训练语言模型的单细胞转录组细胞类型注释算法“scBERT”将自然语言处理算法经典计算单元transformer运用到单细胞转录组测序数据分析领域,并基于BERT范式,将细胞中基因的表达信息转化成可被计算机理解、学习的语言对细胞进行精准标注。该模型通过了覆盖17种主要人体器官的50万个细胞和主流测序技术组成的大规模benchmarking测试数据集,其优越性均得以验证。该成果对单细胞转录组测序数据分析领域未来研究具有深远意义。相关研究成果发表于Nature Machine Intelligence期刊。
  • 原文来源:https://mp.weixin.qq.com/s/dGNeXmK1v7uZBYsQIzwG-w
相关报告
  • 《单细胞转录组测序数据分析COVID-19患者恢复期的免疫细胞》

    • 来源专题:实验室生物安全
    • 编译者:苑晓梅
    • 发布时间:2020-05-28
    • 单细胞转录组数据:分别从10个COVID-19和5个健康个体中获得PBMC细胞后,进行单细胞转录组分析,同时分析了BCR和TCR,患者来自于恢复期患者。根据基因的特异性表达,将PBMC中的细胞分为三种来源的免疫细胞:髓系细胞、NK和T细胞以及B细胞。进一步对其进行划分,共计获得20种不同的免疫细胞cluster。 首先对三种大类免疫细胞在COVID-19患者中的变化进行分析,结果表明相对于健康个体,患者中髓系细胞的比例显著增加,NK和T细胞的比例降低,同时发现在恢复后期患者中B细胞以及NK和T细胞的比例高于恢复早期患者,但是髓系细胞的比例低于恢复早期患者。以上结果表明在感染患者PBMC中淋巴细胞和髓系细胞的比例具有显著的变化。同时作者分析了在感染前后不同免疫细胞的基因表达差异分析,结果表明在患者免疫细胞中炎症因子和趋化因子显著增加。 接下来作者对髓系细胞进行分析,根据特异性基因的表达,将髓系细胞分为6种细胞,分别命名为Classical CD14++ monocytes (M1),non-classical CD16++ (FCGR3A) CD14−/+ monocytes (M2),intermediate CD14++ CD16+ monocytes (M3),CD1C+ cDC2 (M4), CLEC9A+ cDC1 (M5)和 pDC(CLEC4C+CD123+) (M6) 。接下来作者分别对比了不同髓系细胞在感染前后的变化,结果发现M1在恢复早期患者种显著高于健康个体,同时发现CD14+细胞中IL-1β和TNF显著增加。进一步发现在患者中促炎因子和干扰素刺激基因显著增加,但是一炎基因显著降低。同时对比了恢复前后期IL-1β的变化情况,结果表明在前期显著增加,后期降低。同时对M1高表达基因进行功能通路富集,发现与细胞因子信号和炎症因子激活相关。 接下来作者对NK细胞和T细胞进行分析,根据基因表达差异分析,将其分为 不同的10个细胞亚群,包括2种不同的NK细胞亚群和8种不同的T细胞。分别比较了在感染前后不同细胞亚群的变化情况,在患者中效应CD8+ T细胞核NK细胞显著降低,CD4+ T细胞比较稳定。接下来作者分析了在不同NK和T细胞中基因表达差异,发现在感染患者中炎症相关因子和干扰素刺激基因显著增加,与髓系细胞类似。同时根据TCR测序分析发现在恢复早期患者中T细胞的增殖显著降低。 接下来作者对PBMC中B细胞亚群进行分析,根据基因特异性表达,将B细胞分成4个不同的cluster,并根据基因表达进行定义,并对比了患者和健康个体之间的差异,发现浆细胞在患者中显著增加,但是naive B细胞显著降低。同时发现在恢复早期患者的MPB细胞中B细胞活化相关基因在感染患者中显著增加,在浆细胞和抗体分泌细胞中也存在相同的现象,说明抗体分泌细胞在病毒感染过程中发挥关键的功能。同样的,作者分析了不同B细胞亚群基因表达分析,发现相对于健康个体,患者中炎症因子显著增加。 最后作者研究在感染患者中PBMC中各种细胞之间的相互关系来分析以上发现的在患者中不同细胞亚群发生的变化。在感染患者中发现了单核细胞活化,增殖以及炎症相关的信号,同时发现T细胞-单核细胞之间的相互作用可能在提高患者免疫应答中发挥重要作用。
  • 《腾讯AI Lab的目标是Make AI everywhere》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-01-16
    • 在腾讯众创空间CES之夜中,腾讯AI Lab副主任、杰出科学家俞栋介绍了腾讯AI Lab的战略布局及最新进展。 “在腾讯,我们的AI战略是AI in ALL,我们想把AI用在所有的应用场景中,并通过‘基础研究——场景共建——AI开放’三层架构推进AI战略的实施。” 最近几年,AI已成为全球热词,俞栋认为主要有两方面原因:“一方面原因在于人工智能的技术得到了飞速的发展,另外一方面是因为我们看到在越来越多的场景里人工智能确实能够提升我们的生产力。比如,日常生活中的人机交互场景、真实物理世界中的需要自主决策和自主控制的应用场景,以及工业领域里机械性的、重复性的工作场景,都可以通过AI大大提升效率。” 就腾讯而言,AI已经有了较为广泛的应用,这些应用增进了用户体验。据俞栋介绍,腾讯 AI Lab在研究层面,重点关注机器学习的基础理论研究、计算机视觉、语音识别以及自然语言处理四个方向。在应用领域,结合腾讯的业务重点发展游戏AI、社交AI、内容AI和平台型AI。 俞栋在当天的演讲中着重介绍了腾讯 AI Lab的最新进展:“腾讯 AI Lab的目标是Make AI everywhere,也就是AI in All的另外一种表述。” 在游戏AI方面,俞栋表示:“我们不仅研究棋类游戏AI,同时也做智能体和人工环境交互情境下的一些游戏AI研究。因为游戏也是一个训练AI与环境交互,AI与人交互和博弈的重要途径,通过研究游戏AI,我们可以研究如何实现真正的通用AI。” 俞栋还介绍了腾讯在社交AI、内容AI中的最新进展。 据他介绍,腾讯的社交AI通过提升用户与用户之间交互的体验,来增加人与人交互的便利性,同时提供更多人与人的交互方式。通俗讲,就是通过技术手段,使得人与人之间的交互变得便利。比如有些人只懂某种语言,社交AI可以通过语言之间的翻译,让大家能够听懂并交流。 内容AI不仅能理解文本信息,也能理解图像和视频信息。比如,给系统一些图,它可以根据图片生成歌词并唱出来。再如,让AI通过跟踪人的肢体动作来判断对某些要求的动作、规范是否做得到位,可以产生一些更有趣的体验。此外,内容AI还可以做个性化的推荐。以文本推荐为例, AI利用文本本身的信息(比如新闻的信息)、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。 近年,AI+医疗已成为很重要的AI应用场景。俞栋表示,腾讯AI Lab 也做了很多尝试,尤其是在医疗影像和AI辅助诊疗方面,腾讯觅影可以非常准确地识别食道癌和肺癌病灶。在AI辅助诊疗方面,通过分析医学论文和医疗记录等,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的疗法下会有什么样的结果,然后半自动地构建一个知识库。“利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。” 俞栋表示。 “AI的发展是一个系统工程,不是一家公司或者几家公司可以独立发展的,我们的AI战略还包括AI开放,即平台型AI。”据俞栋介绍,在场景共建层面,腾讯AI Lab通过AI开放战略赋能合作伙伴,助力AI技术在更多场景的应用转化。 据了解,作为AI开放战略的载体,腾讯AI开放平台汇聚了行业顶尖的AI技术能力、专业人才和产业资源,并依托腾讯AI Lab、优图实验室、WeChat AI等团队的技术能力以及腾讯云的计算能力,升级锻造创业项目。该平台已开放超过60个API接口,为合作伙伴提供自然语言处理、计算机视觉、语音识别能力等技术支持,全方位扶持创业者的发展。 而作为腾讯AI开放平台与合作伙伴桥梁的腾讯AI加速器,也在当天宣布面向全球招募第二期学员。AI加速器将重点聚焦零售、医疗、翻译、硬件、内容等领域,招募全球范围内拥有独特的技术能力,或拥有垂直的行业资源,或拥有独特行业解决方案的天使-B轮的创业公司。腾讯AI加速器将通过提供技术、资源、导师、市场、投资等五大层面的扶持助力AI创业者,帮助入驻企业在AI技术及产品寻找到更多的应用场景,促进AI技术在各行各业的落地应用,与合作伙伴一起实现AI in ALL。