《专家指南:如何高效地分析lncRNA》

  • 来源专题:生物安全知识资源中心 | 领域情报网
  • 编译者: hujm
  • 发布时间:2018-09-21
  • 长链非编码RNA(lncRNA)参与了多个生物学进程。因此,lncRNA的表达分析有助于了解基因如何表达和调控。同时,与mRNA相比,lncRNA可以作为一种更特异的生物标志物。那么,如何高效分析lncRNA?且听Arraystar资深科学家Yanggu Shi支招。

    Shi博士认为,芯片是lncRNA表达分析的首选平台。由于lncRNA的表达丰度比mRNA低得多,因此RNA测序可能掩盖其真实表达水平。从RNA测序的短序列中重建转录本也存在一定难度,因此只有不到35%的RNA转录异构体能够正确重建。

    通过采用剪接点特异性或外显子特异性的探针,Arraystar LncRNA芯片能明确可靠地检测RNA的转录水平。RNA目标是通过T7启动子驱动的线性扩增而产生的,更好地保留天然的RNA丰度,同时避免RNA测序过程中因PCR指数扩增而引入的失真。

    当前挑战

    Shi博士表示,利用RNA测序来分析lncRNA的表达水平存在一些挑战,其中包括NGS测序读长短,覆盖剪接点lncRNA的序列丰度低,以及处理选择性剪接时的生物信息学分析复杂。

    利用现有的RNA-seq比对软件HISAT2、TopHat2以及Mapsplice2,在参考转录组的辅助下检测lncRNA转录异构体的灵敏度低于20%。在寻找新的转录异构体时,需要对测序序列进行从头组装,然而,从头组装软件在转录异构体上表现不佳,只能检测少量的lncRNA。

    之前一篇发表在《Nature Biotechnology》上的文章就指出了转录本特异性分析的挑战:“选择性转录本的表达谱分析需要了解基因的所有选择性转录本,并且需要组合各个转录本的信息”,“对于全基因组范围的RNA-seq而言,这一点特别困难,因为许多转录本的少量序列存在采样噪音。”显然,人们需要一种新方法来开展转录本特异性的lncRNA研究。

    基于对GENCODE转录本的分析,lncRNA的表达水平约为mRNA的十分之一。许多lncRNA在每个细胞中仅存在几个拷贝。尽管它们的丰度很低,但是lncRNA仍能有效运作。例如,一些lncRNA被拴在邻近基因上,显著改变它们的表达。

    lcnRNA芯片

    Arraystar LncRNA基因表达芯片在同一芯片上分析lncRNA和整组已知的mRNA。通过剪接点特异性探针或独特的外显子序列,它可靠地检测每条RNA转录本及其异构体。 Arraystar LncRNA实验方案已经过优化,可产生灵敏、可靠和准确的数据,包括芯片原始数据处理、数据质量控制、基因表达聚类和热图、差异表达的lncRNA和mRNA、lncRNA亚类、lncRNA与mRNA之间的调控关系,以及通路分析。

    Arraystar LncRNA芯片依赖于那些经过全面注释和实验验证的lncRNA,而不是那些“无名的”部分降解的RNA片段。这些全长lncRNA已经过鉴定,至少有一篇Pubmed研究论文发表,因此代表了lncRNA的金标准。全面注释越来越被视为了解lncRNA生物学功能的最短途径。

    Arraystar LncRNA芯片有着丰富的注释和分析,它们专门针对非编码调控lncRNA,与传统的编码mRNA分析大不相同。

    案例研究

    多年来,Arraystar芯片一直伴随着lncRNA的研究人员。在一篇去年发表在《Nature Cell Biology》的文章中,Arraystar LncRNA芯片帮助研究人员分析总RNA以及与脂质结合的RNA,以鉴定对三阴乳腺癌有病理学意义的lncRNA。

    在这项研究中,MD安德森癌症研究中心的林爱福研究团队从三阴乳腺癌病人的组织中,鉴定到9个能与脂质结合的长链非编码RNA。其中,LINK-A的表达水平最高且最特异,被选中作为研究模型。研究表明,LINK-A在AKT激活中发挥重要作用,有望成为癌症治疗的新靶点。

    早前,这个研究团队还在《Cell》杂志上发表文章,利用Arraystar LncRNA芯片发现晚期乳腺癌中lncRNA-BCAR4的差异表达,表明lncRNA在侵袭性乳腺癌进展中发挥了调控作用。

    通过Arraystar lncRNA芯片筛查,研究人员发现lncRNA-BCAR4在乳腺癌病人组织中表达显著上升,并且随着肿瘤转移,上升趋势明显。通过进一步研究,他们发现BCAR4是GLI2控制的基因激活的必要条件。这是研究人员首次了解乳腺癌中lncRNA与hedgehog这一经典信号转导通路的联系。

    结语

    RNA转录组中的大多数是非编码的,因此lncRNA对细胞的调控机制给出了独特的观点。 不过,NGS在分析和鉴定lncRNA上缺乏足够的覆盖度、灵敏度和准确性,来阐明它们在疾病和健康上的生物学作用。

    Arraystar LncRNA芯片克服了NGS的缺点,其探针能够灵敏地捕获和测定低丰度的lncRNA。因此,Shi博士认为芯片可作为研究lncRNA的首选方法。

  • 原文来源:http://www.ebiotrade.com/newsf/2018-9/2018920172329958.htm
相关报告
  • 《院士专家解读大数据AI如何抗“疫”》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2020-08-03
    • 7月30日,北京市政府新闻办举行发布会,发布第二批30项应用场景建设项目。其中,面向城市管理,提升城市精细化管理水平,推动技术服务疫情防控是重要方面。 实际上,自6月11日新发地发生聚集性疫情,到7月20日,仅仅34天,北京新冠肺炎疫情防控从二级调至三级。首都安澜,大数据人工智能(AI)技术功不可没。 专家认为,超大型国际化大都市利用大数据快速锁定病例行动轨迹,圈定密切接触者等高风险人群,对于预警管控、迅速切断传播渠道至关重要。 那么,大数据人工智能是如何“参战”并在战“疫”中守护隐私的,对于不断突发的“疫情”,如何能做得更好? 精准画像 “一个都不能少” 自新冠肺炎疫情发生以来,北京AI疫情追踪项目迅速启动,中国人民大学高瓴人工智能学院院长文继荣团队参与建立了新冠肺炎防控智能追踪服务系统。 “我们必须通过大数据把确诊人员的行动轨迹全部刻画出来,每一处遗漏都是隐患,这个过程非常复杂。”文继荣在日前召开的2020北京智源大会上表示。 文继荣介绍,疫情追踪分为4部分。首先需要多家互联网企业合作,进行重点疫区14日内互动态势分析。其次根据确诊人员信息,结合互联网企业上报的“信息点”等,将多个互联网渠道提供的确诊人员活动轨迹进行整合和串并分析,然后绘制确诊人员的活动圈。 接下来,要根据确诊人员的活动轨迹图,结合互联网公司等收集的确诊人员近距离接触信息,筛查出密切接触风险人员及其活动轨迹。最后综合分析这些传染风险人员的活动行为,评估传染风险人员的风险度,为疫情分析、防控和预警提供支持。 疫情防控取得一定胜利后,复工复产成为迫切问题,然而,楼宇内的一些隔离措施成为重要阻碍。“楼宇内GPS信号弱,人员的行动轨迹无法确定,一人确诊、整体封楼这种粗放式的隔离方式不太合理,严重影响整个社会的复工复产节奏。”文继荣说。 为了更科学、更智能、更精准的疫情防控和人员隔离,“疫情实时风险预警系统”上线。它基于蓝牙、局域网信号、气压计等信号,引进智能算法进行时空轨迹数据分析,研究人群时空轨迹,追溯近距离接触人员,做到智能防控、精准隔离,有效降低隔离成本,护航复工复产。 对于能否将所有数据拿来统一分析,文继荣认为:“这个方法不太现实。集中进行数据分析需要非常大的算力,这需要几千甚至几万台服务器。此外,集中管理数据容易引发商业隐私等方面的问题。” 公共利益和隐私保护“两全” 隐私问题一直是AI发展的短板。中国工程院院士高文认为,根据我国技术和社会发展现状,想让技术和社会和谐快速发展,隐私得到很好保护,诚信非常重要。 当新冠肺炎疫情威胁人类生存、危害人们公共利益时,隐私保护应该做出让步吗? “完全的隐私保护是不可能的。”文继荣说,“当今世界正在从物理世界走向数字世界,随着跟踪设备和数据收集的增加,以及数据处理能力的强化,隐私保护的问题不可避免,变得越来越重要。” 在文继荣看来,东西方看待隐私保护的观点是不同的。北京大学副教授边凯归也表示认同:“我国民众在政府利用个人数据方面的配合度很高,而一些西方国家的配合度相对较低,这也导致国外疫情防控出现了诸多问题。当然,我们也在不断迭代技术方案,尽量保护数据隐私。” “我们在鼓励使用数据进行创新和促进社会发展的同时,也应该公开讨论隐私保护的风险和问题,探讨从技术、政策等方面如何做得更好。”文继荣说,“为保证数据安全可靠,可以建立数据分级分类管理机制、数据加密机制、关键数据传输协议及安全通道。” 中国科学院院士张钹也认为中西方存在隐私保护的差异。“我国隐私保护的核心问题是不滥用个人信息。避免滥用包括两个方面,一方面是制定法律、规则,限制滥用行为;另一方面是发展安全、可靠、可信赖、可扩展的AI技术。”张钹说。 平战结合 “数战数决” 实际上,如何应对突发性高传染病毒疫情等重大突发公共卫生事件,一直是国际社会面临的共同难题。下一次疫情到来时,我们可以更好地利用大数据吗? 精鼎医药亚太区真实数据负责人冯胜参与了新冠临床试验数据分析工作,他回忆道:“很多数据处于零散阶段,是疫情期间大数据利用的一个重要问题。” 文继荣也认为这种“数据孤岛”应该被打破,“与公共卫生事件相关的很多数据散落在各个政府部门、互联网、电信运营商、物流等企业,以及民航、高铁、公交车、网约车等公共出行系统中,未能得到有效汇总和利用”。 此外,文继荣还提出:“数据的动态性、安全性和决策的及时性,都是疫情期间制约大数据发挥作用的因素。” 为打造重大突发公共卫生事件大数据服务平台,文继荣认为,首先要实现公共信息互通共享,打破各部门“信息孤岛”,实现计算、数据等资源完全共享,形成统一的数据标准、数据对策模块化。其次要适应数据海量增长,有效满足需求,提供充足资源。此外要实施精确的数据分析和智能决策,探索国家突发公共卫生事件的预警模型,建立突发公共卫生事件的数字信息预警体系。 当前疫情还未获全胜,如何运用大数据服务突发公共卫生事件,是摆在国家乃至世界面前需要长远考虑的“必答卷”。 “要通过‘平战结合’的思路,建立多种数据采集渠道,围绕关键数据的采、治、用、管、研,建立应对公共卫生事件和应急事件的完善系统和规范工作流程。”文继荣表示。
  • 《如何选择和理解患者报告结果的指南:对现有指南的范围审查》

    • 来源专题:重大疾病防治
    • 编译者:蒋君
    • 发布时间:2024-03-25
    • 背景 在过去的几十年里,患者报告结果(PROs)已被用于更好地了解患者的健康状况。因此,已经制定了许多PRO措施(问卷)和指导方针或指南。然而,从众多可用指南中选择目标指南并理解所选指南具有挑战性。本研究全面收集了现有的临床试验或研究和实践的PRO指南,以支持学术界、行业、临床实践以及监管和报销决策中的新手PRO用户。 方法 对于范围审查,我们搜索了2009年至2023年的MEDLINE、Embase、Google Books、WorldCat和国家医学图书馆(NLM)书架数据库。资格标准是临床试验、临床实践或应用(如卫生技术评估)的PRO指南。这些指南涵盖了生活质量(QOL)、PRO、健康相关QOL、健康状态实用性、心理测量要求、实施方法、分析和解释或临床实践应用等方面。在系统搜索后,三名研究人员分别审查了收集的数据,并使用相同的标准对审查的文章和书籍进行了仔细审查。 后果 我们收集了2009年至2023年间发表在文章和书籍中的PRO指南。从数据库搜索中,共识别出1455篇文章和387本书,其中1本书和33篇文章最终被选中。收集的PRO指南分为PRO措施的采用、使用PRO的试验或研究的设计和报告、临床试验或研究或临床实践中PRO评估的实施、PRO的分析和解释以及PRO评估的应用。基于这种分类,我们建议新手如下:在选择指南时,新手应明确使用指南的“地点”和“目的”。此外,他们应该知道,与PRO相关的术语以及PRO的范围和期望因“地点”和“目的”而异。 结论 通过对现有PRO指南的范围界定审查,我们提供了总结和注意事项,以帮助新手选择符合其目的的指南并理解它。