《NIST工具将使数学研究论文更容易在线查看》

  • 来源专题:计量基标准与精密测量
  • 编译者: 李晓萌
  • 发布时间:2024-01-24
  • 几十年来,科学家们在撰写以数学公式为特色的论文时,通常使用LaTeX,这是一种旨在以静态形式生成打印页面的语言,如PDF。NIST开发的一种工具可以将这些论文转化为网页,在不同的设备上更容易地查看,并满足有视觉无障碍需求的读者的长期要求。预印本服务器arXiv已经开始使用该工具以PDF和网页格式提供数百万篇论文。

    物理、数学和工程论文中的复杂公式对一些人来说可能是极其困难的读物,但也有很多人一开始就很难看到它们。近日,美国国家标准与技术研究院(NIST)已经创建了一种工具,使这些论文更容易被视障人士看到,并且即将在很大程度上被采用。

    该工具可以将一种常用的数学公式显示格式转换为另一种格式,有助于让所有人都能访问最新、最棒的研究论文。大多数新的研究论文都是以PDF文件的形式分发的,研究界的许多人都很难阅读。

    根据世界卫生组织的数据,世界上超过四分之一的人口被诊断为视力障碍,耶鲁大学阅读障碍和创造力中心报告称,在美国,20%的人患有阅读障碍。在最近一项对以PDF形式分发的科学论文的研究中,研究人员发现,他们抽样的文件中只有2.4%符合其可访问性标准。

    “如果你不是一个一生都在努力发表数学论文的人,你可能会想为什么这是一个问题,”NIST的布鲁斯·米勒说,他是一名受过训练的物理学家,专门研究数学软件。“PDF在打印页面上看起来很棒。但如果你想大声读出数学公式,或者在平板电脑或手机等不同尺寸的屏幕上清晰可见,这种不匹配可能会很痛苦。你不能轻易地将PDF重新用于其他媒体。”

    PDF通常是如何生成的?科学家在创作使用许多公式的论文手稿时,通常会使用LaTeX(发音为“lay tech”)或其近亲之一来呈现公式。LaTeX自20世纪80年代以来一直在使用,并因其创造的高质量排版而广受尊敬,但它的设计目的是以静态形式生产打印页面。

    自20世纪90年代以来,网页创建者一直使用HTML,这使得根据上下文调整显示文本的外观、行为和布局成为可能。如果你曾经将网页拖动到不同的大小,并看到其文本平滑地重新定位以适应新矩形的边界,你就会看到视力残疾读者想要的功能。

    现代HTML包含的扩展不仅允许这种“重新流动”类型的能力,还允许那些自己无法阅读文本的人通过机器大声阅读数学公式。这些特性使HTML成为创建可访问文本的理想选择,但多年来一直没有有效的方法将LaTeX转换为HTML。这给Miller带来了一个问题,他需要一种方法将NIST久负盛名的1000多页《数学函数手册》带入数字领域。

    他说:“当时,一些程序声称要将LaTeX转换为网页,但没有一个效果足够好。”。“我想,让我们试着自己做吧。”

    由此产生的NIST工具是LaTeXML,它读取LaTeX源文件并构建文档的表示形式,可以将其转换为HTML。LaTeXML是创建在线数学函数数字库的关键,几年后,一个主要在线资源的管理人员意识到它也可以帮助他们。

    这个资源是arXiv(发音为“archive”),是一个尚未在科学期刊上发表的学术文章的存储库。arXiv由康奈尔大学维护,目前拥有200多万篇文章,可以作为PDF免费查看和下载。服务器已经成为一个重要的中转站,作者可以在这里发布研究结果,并在正式宣布之前与同行讨论。

    “根据arXiv在2022年进行的一项调查,只有30%的依赖辅助技术的用户可以在没有帮助的情况下访问他们需要的所有研究。同一项调查发现,PDF格式是最大的障碍,”arXiv无障碍报告的首席研究员、HTML论文项目经理Shamsi Brinn说。

    Brinn说,这将随着arXiv使用LaTeXML转换器而改变。服务器将生成HTML版本的论文,并在下载PDF的链接旁边包含HTML版本。

    arXiv存储库将滚动转换论文,于2023年12月提供第一个。东北ADA中心助理主任Joe

    Zesski表示,此举遵循了一个更广泛的趋势,即需要可访问的网络和电子信息。这一变化不仅有助于科学界遵守白宫关于免费提供联邦资助研究的最新政策,而且还将使使用电子资源长大的年轻科学家能够获得信息。

    Zesski说:“在教育中,人们越来越依赖网络和电子信息,同时也越来越期望残疾青年能够平等获得教育。”。“采取措施使这些学生能够访问和使用他们需要的信息是很重要的。”

相关报告
  • 《美国国家标准与技术研究院(NIST)研究人员发现了一种更便宜、更方便的石棉检测方法》

    • 编译者:李晓萌
    • 发布时间:2024-07-26
    • 几十年来,一种被称为透射电子显微镜(TEM)的实验室程序一直被用于检测建筑工地样本中的石棉。 1989年,美国环境保护局(EPA)要求大多数正在进行石棉减排的学校在重新开放前使用TEM测试空气样本中是否存在石棉纤维。几个州要求或建议使用TEM进行测试,作为商业建筑中石棉清除的一部分。 但是TEM必须在专业实验室由训练有素的工作人员进行,而且费用可能很高。另一种方法,相位对比显微镜,更容易、更便宜,但精度较低。 近日,美国国家标准与技术研究所院(NIST)的研究人员已经确定,第三种选择,扫描电子显微镜(SEM),可以获得与TEM大致相当的结果。NIST研究人员Jason Holm和Elisabeth Mansfield在《Analytical Methods》期刊上发表的一篇新论文中写道,SEM是“目前石棉识别和分类监管方法的可行替代方案”。 由于在许多情况下,SEM比TEM更便宜、更方便,这一发现可能会加快并减少美国石棉修复的费用,估计每年要花费30亿美元。 石棉是一种天然矿物,其纤维用于隔热、防风雨、防火和加固建筑材料。20世纪70年代,随着研究人员意识到其健康风险,包括与癌症的联系,其使用量开始下降。3月,环保局禁止了仍在使用的最后一种石棉。 顾名思义,TEM和SEM都是电子显微镜的类型。在这两种方法中,技术人员都将电子束聚焦在微观量的材料上。电子与材料相互作用,产生关于材料成分、结构和形状的高度详细的信息。 在TEM中,电子穿过样品,而在传统的SEM中,电子从表面反射。这使得TEM能够产生更详细的图像并探测表面的内部。TEM还提供了比SEM更好的空间分辨率,即区分非常靠近的物体的能力。 但近年来,SEM制造商已经提高了该技术的成像能力和其他能力。现在有几家公司生产桌面SEM,使其有可能在现场使用该技术,而TEM仍必须在实验室中进行。霍尔姆说,使用和操作SEM设备的培训可以在几个月内完成,而“TEM的专业知识可能需要数年时间才能建立。” Holm说:“TEM有一些SEM没有的能力,但我们认为SEM足够好”,可以用于石棉减排。 为了测试石棉的SEM,Holm和Mansfield使用了NIST标准参考物质(SRM)1866,这是该机构为实验室生产的石棉纤维样品,用于对其设备和测试程序进行基准测试。SRM提供了大量表征材料特性的数据。 利用扫描电镜,研究人员分析了SRM 1866。他们的结果与SRM文件中列出的结果非常一致,表明了该方法的准确性。 Holm和Mansfield总结了SEM的潜在优势,他们写道,与TEM相比,SEM可以降低设备成本、降低操作员培训要求、增加样品吞吐量和扩大视野。 文章信息:Jason D. Holm and Elisabeth Mansfield. Transmission electron imaging and diffraction of asbestos fibers in a scanning electron microscope. Analytical Methods. Published online June 24, 2024. DOI: 10.1039/D4AY00555D
  • 《研究重点: CRISPR技术》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-10-30
    • 精确编辑活细胞基因组的能力具有巨大的潜力,可以加快生命科学研究,改善生物技术甚至治疗人类疾病。 用于基因组编辑的方法-主要是锌指核酸酶和类似转录激活因子的效应器(TALE)核酸酶-已经存在了几年,但是在2013年,被首次设计的CRISPR-Cas9系统的效率,有效性和精度迅速使它们黯然失色。博德研究所(Broad Institute)和麻省理工学院(MIT)的张峰(Feng Zhang)利用其进行哺乳动物基因组编辑。 CRISPR系统 像锌指和TALE一样,CRISPR系统也是天然产物。然而,CRISPR-Cas在一个关键方面与锌指和TALE不同,这使其在基因组编辑应用中具有优势:而锌指和TALE通过直接的蛋白质-DNA相互作用与DNA结合,需要针对每个新靶点重新设计蛋白质DNA位点,CRISPR-Cas通过小的RNA可以实现靶标特异性,可以很容易地将其交换为靶向新位点的其他RNA。 在自然界中,CRISPR-Cas系统可帮助细菌防御攻击性病毒(称为噬菌体或噬菌体)。它们由两个组件组成,CRISPR(聚簇的,规则间隔的回文重复序列)阵列和Cas(与CRISPR相关的)蛋白。 CRISPR序列可阻止细菌从入侵的噬菌体复制而来的短片段DNA,从而保留了过去攻击它们的病毒的记忆。然后将这些序列转录为短RNA,将Cas蛋白引导至匹配的病毒序列。 Cas蛋白通过切割来破坏匹配的病毒DNA。自然界中存在许多不同类型的CRISPR-Cas系统,它们的组成各不相同。 CRISPR-Cas9系统仅使用一种蛋白质Cas9来发现并破坏目标DNA。在2015年,Zhang和同事成功地利用了另一个名为CRISPR-Cpf1的系统,它具有用于更简单,更精确的基因组工程的潜力。 工程CRISPR工具箱 2011年初,张峰刚刚在Broad大学和MIT成立了自己的研究小组,在那里他是McGovern脑科学研究所的研究员,并且是脑与认知科学和生物工程系的教职员工。在广泛会议的一次科学会议上了解了现有的CRISPR研究之后,他很快意识到具有单个RNA引导蛋白的系统可能会改变基因组编辑技术。他已经在研究DNA靶向方法,并曾作为哈佛的初级研究员帮助开发TALE系统。该系统可以靶向并激活哺乳动物基因组中的基因。 Zhang和他的团队专注于利用CRISPR-Cas9在人类细胞中使用。 2013年1月,他报告了在人类细胞中基于Cas9的基因组编辑的首次成功演示,该论文已成为被引用最多的CRISPR论文(Cong等,Science,2013)。哈佛大学乔治·丘奇实验室的研究人员在同一期《科学》上也报道了类似的发现(Mali等,《科学》,2013年)。 Zhang和Church的论文表明,Cas9可以靶向人类基因组中的特定位置,并在那里切割DNA。然后通过插入由研究人员提供的新的DNA片段修复被切割的DNA,从而基本上实现了人类基因组的“查找和替换”功能。 2015年9月,Zhang和合作伙伴介绍了另一种系统Cpf1,该系统似乎对研究和治疗具有重要意义。 Cpf1系统更简单,因为它仅需要一个RNA。 Cpf1酶也比标准SpCas9小,从而更易于传递到细胞和组织中。