《Cell丨开发细胞类型标准化算法以整合单细胞图谱》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2023-12-22
  • 2023年12月21日,来自英国Sanger研究所Sarah Teichmann团队的许川及合作者在Cell上发表了题为Automatic cell-type harmonization and integration across Human Cell Atlas datasets的文章。

    研究人员开发了用于细胞类型标准化的算法CellHint。CellHint主要包含四个功能:1)定量细胞与细胞间的转录组相似性;2)标准化不同数据集的细胞命名差异;3)重构不同细胞类型的层级结构;4)基于2和3整合单细胞数据。

    通过CellHint来标准化五批免疫细胞数据集后发现,原先需要大量人力来注释和调和的细胞类型在CellHint的算法下都得到了快速的验证。另外,CellHint也适用于疾病数据集。例如,当研究人员把CellHint应用于8种导致肺纤维化的疾病数据后,不同的细胞类型和疾病类型都得到了区分。跨数据集比较的其中一个好处在疾病数据中也得到了体现:在不同细胞类型构成的树状层级图里,肺纤维化的程度与细胞类型的连接也是直接相关的。

    将不同数据集间的细胞类型进行标准化和整合还可以实现稀有细胞类型的富集。当作者团队利用CellHint来标准化不同物种的海马体(颞叶内侧的双层灰质结构)单细胞数据后,一细胞簇(约含1600细胞)得以富集。基于这类细胞的基因表达模式和功能富集情况,他们很可能代表了不成熟的神经元或成神经细胞。跨物种间的标准化也进一步揭示了此类细胞在不同物种间的相对保守性。

    此外,鉴于其数据集自动标准化的特性,CellHint也可用于自动化(或半自动化)的图谱绘制和整合。在此流程中,细胞标准化和数据整合都可以利用CellHint快速完成,最后辅以手动的校验和更正,能够产生高质量的细胞图谱。

  • 原文来源:https://www.sciencedirect.com/science/article/pii/S0092867423013120
相关报告
  • 《Nature | 水稻单细胞多组学图谱》

    • 来源专题:战略生物资源
    • 编译者:朱晓琳
    • 发布时间:2025-07-14
    • 发表机构:中国农业科学院生物技术研究所 作    者:谷晓峰,梁哲(通讯作者)     水稻作为全球重要粮食作物,提升单产是育种核心目标。我国水稻单产虽高于全球平均水平,但仅为全球最高单产国家的60%左右,且近年增长放缓。传统育种手段已难以满足需求,亟需借助新兴测序技术挖掘产量相关关键基因,而单细胞测序技术以高通量和高分辨率优势,为探究单细胞分子机制提供新途径,但植物领域尚未开展全面的单细胞多组学研究。     长期以来,科研人员通过全基因组、群体遗传等手段挖掘了水稻重要性状调控基因,但对基因在特定细胞类型中的作用及单细胞水平参与组织发育的机制缺乏系统认识。水稻产量与品质依赖根、茎、叶、种子等器官的发育功能,解析单细胞水平的基因调控模式成为突破瓶颈的关键。     研究团队利用10x Genomics单细胞多组学平台,在水稻中首次实现单一细胞水平同步刻画基因表达与染色质调控状态。通过对根、茎、幼叶、旗叶、茎尖、分蘖芽、幼穗和种子8个主要器官的研究,获取超11万个细胞的RNA表达与染色质可及性数据,结合大量原位杂交试验验证,鉴定出54个细胞类型,全面解析了水稻组织层面的功能细胞组成,构建起全球首个水稻多器官单细胞多组学数据库。     该研究开发了水稻细胞命运扰动模拟算法,基于CellOracle算法在不同细胞类型中进行虚拟敲除,预测基因扰动后的细胞轨迹变化。例如模拟RSR1基因敲除,成功预测皮层细胞命运改变并经实验验证,为无需基因编辑分析基因功能提供了智能预测手段。     在转录调控研究方面,团队建立了染色质可及性区域DNA序列motif富集度与转录因子表达趋势相结合的预测流程,系统区分不同细胞类型中转录因子的激活或抑制类型,大规模识别出 250余个关键转录因子调控模式,如ARF8的激活型预测与已有报道高度一致,显著提升了转录调控研究的效率与准确性。     通过单细胞转录组数据的共表达网络分析,研究将水稻基因划分为9个功能模块,其中M2模块与光合作用相关、M4模块参与氮代谢,各模块在不同细胞类型中的富集差异为解析代谢调控网络提供了新思路。     研究进一步整合群体GWAS结果,建立“基因 - 细胞类型 - 性状”三维关联图,发现分蘖数与分蘖芽细胞、粒重与种胚细胞、抗病性与叶表皮细胞等核心性状的精准对应关系。该研究构建的智能预测和设计技术,实现了从单细胞到性状设计的精准对接,为作物智能育种提供了单细胞水平预测设计的新范式,推动水稻高产育种进入精准分子设计新阶段。 发表日期:2025-07-09
  • 《研究重点: 人类细胞图谱》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-10-30
    • 人类细胞图集项目汇集了生物学家,临床医生,技术人员,物理学家,计算科学家,软件工程师和数学家组成的国际社区。 这个由不同专业知识的科学家组成的社区拥有共同的目标,即创建所有人类细胞的全面参考图谱,作为了解人类健康以及诊断,监测和治疗疾病的基础。 如果没有不同细胞类型的图谱,它们在体内的位置以及它们表达的基因,我们将无法描述所有的细胞活动并无法理解指导它们的生物学网络。 最近,诸如单细胞基因组学之类的新工具首次使这一目标得以实现。 全面的细胞图谱将使对人体中所有类型甚至亚型的细胞进行分类,识别它们在体内的位置,甚至区分不同的分化阶段和细胞状态(例如免疫细胞激活)成为可能。地图集还使研究人员可以绘制细胞谱系图,例如从骨髓中追溯到红血球直至其干细胞起源。 细胞图谱具有将我们的生物医学方法转变的潜力。这将有助于识别不同疾病的标记和特征,发现用于治疗干预的新靶标,并提供体内人类生物学的直接视图,从而消除了细胞培养的失真方面。 广泛的新闻发布和新闻报道 国际人类细胞图集计划正在进行中 本周在伦敦举行的一次国际会议上,正在讨论一项雄心勃勃的全球倡议,以创建人类细胞图集-将人体中的每个细胞描述为参考图,以加快生物医学科学的发展。最终,《人类细胞图谱》将彻底改变医生和研究人员如何理解,诊断和治疗疾病。 国际人类细胞图谱发布了战略蓝图;宣布前一百万个细胞的数据 蓝图描述了对人体中每个细胞进行分类的途径。细胞数据发布,可供研究社区使用。 Human Cell Atlas迈出了了解人类早期发育的第一步 从一系列人类组织中测序出的前250,000个发育细胞。 研究人员在“人类细胞图集”在线门户网站上发布了半百万个人类免疫细胞的遗传图谱 在发布之前,研究人员可以在Data Coordination Platform的预览版上编译原始数据并使其公开访问。 研究人员发现新型肺细胞,对囊性纤维化的重要见解 在人体组织中经过验证的对小鼠气道细胞的全面单细胞分析显示了对理解肺部疾病至关重要的分子细节。 单细胞图谱揭示了溃疡性结肠炎的潜在基础 成千上万的结肠细胞为炎症性肠病出了什么问题以及为什么某些患者对药物没有反应的原因提供了新的线索。