《超级计算机创造有史以来最逼真的虚拟大脑》

  • 编译者: 苑亚坤
  • 发布时间:2025-11-25
  • 研究人员通过结合庞大的生物数据集与日本富岳超级计算机的强大性能,创造了有史以来最细致的虚拟鼠标皮层模拟之一。数字大脑就像一个活生生的系统,拥有数百万个神经元和数百亿个突触,使科学家能够一步步观察阿尔茨海默病或癫痫等疾病的发展。该项目为研究大脑功能、追踪损伤如何遍及神经回路以及验证曾经需要无数真实组织实验的理论开辟了新途径。
相关报告
  • 《Wrangler超级计算机加速了大数据:数据密集型超计算机为用户带来了高性能科学计算》

    • 来源专题:宽带移动通信
    • 编译者:gaof
    • 发布时间:2016-05-23
    • 综述: 根据一项特别报道,新型超级计算机Wrangler正帮助研发人员加速大数据发展和取得新发现。超级计算机Wrangler设计的更加用户友好型,用网页驱动的方法实现高性能的计算,包括数据分析。 处理大数据有时候对需要快速和超级计算的研究人员来说就像没有铺平的道路。 “当你处于数据的世界,路上充满了岩石和碰撞,有许多事情需要关心,”前哈勃太空望远镜科学家现在是德克萨斯高级计算中心(TACC)数据密集计算小组的领导的Niall Gaffney如是说。 Gaffney努力使新的超级计算机Wrangler上线,像以前驯服野马的西部牛仔一样,Wrangler驯服的是大数据,比如包含分析成千上万文件的计算问题,这些文件需要快速打开检查并相关分析。 Wrangler填平了由(NSF)美国国家科学基金支持的XSEDE(极端科学和工程发现环境)的超级计算资源的缺陷,XSEDE是先进数字资源的集合,科学家们可以共享这些数字,分析产生于每一个领域研究的大规模数据集。2013年,NSF奖励TACC和它的学术合作伙伴印第安纳大学和芝加哥大学1120万美金,用以建立和经营Wrangler,处理数据密集高性能计算的超级计算机。 Wrangler被设计用来与Stampede超级计算机密切合作的,根据每年两次的500强排名,Stampede超级计算机能力排名第十,并且是奥斯丁德克萨斯大学TACC的旗舰产品。自2013年上线以来,Stampede完成了开放科学600万次计算工作。 “我们保持了与Stampede系统很好的兼容性,” Gaffney说:“但是添加了一些新的东西,比如超大规模闪存系统、超大规模分布式旋转光盘存储系统和高速网络访问,这使得那些有不能被如Stampede和Lonestar系统解决的问题的人能够用他们之前没尝试的方法解决。” Gaffney做了一个对比,Stampede那样的计算机像赛车跑车,神奇的计算引擎最优化以在光滑的跑道上快速前进,另一方面,Wrangler更像是拉力赛车,在没有铺平的崎岖的道路上快速行进。 “如果你开一辆法拉利参加越野赛,会想改变道路,” Gaffney说:“你想改变整辆车组装在一起的方式,即使使用相同的组件,要适合于人们不同的用途。” Wrangler的核心是600兆兆字节的闪存,通过其超过3000个Haswell计算核心PCI(外部控制器接口)互联共享。Gaffney说:“系统的所有部分都可以访问相同的存储空间,他们可以在这些数据上进行并行操作,这些数据存储在这个高速存储系统中,以获得他们在其他地方不能获得的结果。” 这些大量的闪存来自于DSSD,DSSD是由Sun Microsystems的Andy Bechtolsheim联合创立的公司,2015年5月获得了EMC。 Bechtolsheim在TACC的影响追溯到他领导的‘Magnum’无线网络带宽交换机,是为了Stampede的前身已经退役的Ranger超级计算机设计的。 DSSD在CPU和数据之间选择了一个捷径,这一点是比较新颖的,“计算机的大脑直接连接到存储系统,中间没有转接,” Gaffney说:“它实际上允许使用一些你能轻松得到的快速存储器直接计算,两个之间没有问题。” 加速了基因分析途径 Gaffney回想起了科学家们面对OrthoMCL时遇到的问题,OrthoMCL可以分析来自于从看似不相关的物种发现相似的基因血统的DNA序列,问题就是OrthoMCL会像一匹难以驯服的野马一样释放数据。 “它产生了海量的数据,外部运行计算程序,而且必须与这些数据进行交互,” 德州大学奥斯汀分校综合生物学系和计算生物学及生物信息学中心的生物学家Rebecca Young说。她补充道:“这不是Lonestar、Stampede以及其他一些TACC的资源设立的目的。” Young讲述了如何第一次借助网络资源使用OrthoMCL,她只能从10个物种中找出350条类似的基因,“当我在Wrangler上运行OrthoMCL时,我能在这些物种中得到差不多2000个类似的基因,” Young说,“从已经能达到的程度来说这是一个巨大的进步,我们使用OrthoMCL的目的就是允许我们在关注这些4.5亿年进化过程中分离的相异的古老的物种时可以得到越来越多相似的基因。” “现在我们可以在任何地方15分钟到6小时之间完成这些任务了” Gaffney说:“Wrangler改变了游戏规则。” Gaffney补充说快速得到结果使科学家们通过分析大数据探索新的和更深的问题,驱动之前不能得到的发现。 优化建筑的能源效率 美国橡树岭国家实验室(ORNL)计算机科学家Joshua New希望利用Wrangler能力的优势驯服大数据。New是Autotune项目的主要负责人,Autotune项目创建了一个建筑物的软件模型,校准来自不同数据源的超过3000个数据输入,比如费用单,生成一个有用的信息,比如最优的节能改造是什么样的。 “Wrangler有足够的马力,我们在一次运行中可以进行许多大量的研究并得到有用的结果,”New说。他最近使用ORNL的Titan超级计算机进行500000次模拟并在68分钟时间内像磁盘写了45TB数据。他说他想扩展他的参数研究,模拟美国全部的1.251亿个建筑物。 “我认为Wrangler为我们提供了一个特殊的有利可图的市场,我们把我们的分析转向了端对端的流程,在这个流程中我们定义我们想改变的参数,”New说:“它生成了采样矩阵,他生成了输入文件,它计算所有计算上有挑战性的任务,并行运行所有的模拟仿真,它生成了输出,然后我们运行我们的人工智能和统计技术,在后端分析数据,在Wrangler以可靠的流程上自始至终做这些工作是我们非常兴奋的。” 当Gaffney说起Wrangler的存储的时候,说是非常大的数据存储空间——10拍字节基于Lustre的文件系统服务器由TACC托管,印第安纳大学有复制品。“我们希望保存数据,” Gaffney说:“Wrangler系统的建立使数据是首要的部分,在这些数据之间人们进行他们的研究,允许我们紧紧抓住数据,并与他人分享,这些正是我们希望Wrangler做的。” 解释暗能量 “数据是我们项目最大的挑战,” 德州大学奥斯汀分校天文学家Steve Finkelstein说。他的国家科学基金项目叫做HETDEX,望远镜暗能量实验。这是所尝试的最大的星系研究,科学家们希望绘制超过100万星系的三维地图,在这个过程中会发现上千个新的星系,主要的目标是研究暗能量,使星系分离的神秘的力量。 Wrangler超级计算机 数据密集型超级计算机系统Wrangler正在部署 “每天晚上我们都观察——我们计划至少三年每晚观察——我们计划得到200GB的数据,”Finkelstein说。每六分钟就会测量天光的34000点的频谱。 “Wrangler是我们的解决通道,” Finkelstein说:“随着数据进来,Wrangler有一个小程序寻找新的数据,每六分钟左右的数据进来,就会处理这些数据,天亮的时候Wrangler就会得到全部的数据,发现新的星系。” 在生化资料中的人类起源 Wrangler支持另一个高性能计算的例子是一个称作PaleCore的国家科学基金支持的科学项目。该项目希望利用Wrangler的数据库的敏捷性为科学家建立一个知识库,科学家们可以在所有与人类起源有关的化石挖掘清晰额地理空间信息。这样能结合以前的数字集合方式比如Excel表单和SQL数据库,使用新的数据收集方法比如从手机或ipad上收集实时化石GPS信息。 “我们正在关联开放数据发现一个巨大的机会,” PaleCore项目负责人Denne Reed说。Reed是德州大学奥斯汀分校人类学系副教授。 关联开放数据允许从看似竟然不同的数据的联系中找寻意义。“Wrangler是一个可以完成这些的平台,” Reed说,“它使我们存储大量的数据,无论是照片图像、卫星图像还是与地理空间数据相关的数据等,它还允许我们开始寻找有效的实时链接存储的其他数据的方法。” 科学数据分析 Wrangler的共享内存支持Hadoop和Apache Spark框架的数据分析,“Hadoop是一个现在所有数据科学的流行词语,” Gaffney 说,“这些我们都有,我们还可以配置这个系统,本质上像现在的谷歌搜索引擎在数据中心,最大的区别就是我们在同一时间服务少量用户,这与谷歌是不同的。” 用户以最快的方式向Wrangler存入取出数据,Wrangler连向Internet2,Internet2是向全国大部分其他学术机构每秒提供100千兆字节吞吐量的光纤网络。 除此之外,TACC有工具和技术并行转换他们的数据。“有点像在超级市场,” Gaffney解释道,“如果只开通一个结账通道,最快也只有一个人结账,但如果你进去并且开通15个结账出口,可以分散人流,可以在更少的时间让更多的人通过。” 超级计算机新的用户群体 生物学家、天文学家、能量效率专家和古生物学家仅仅是Wrangler试图吸引的新用户群体的一小部分。 Wrangler比典型的高性能计算更好的网络功能,门户网站允许用户管理系统,并给比如VNC、RStudio和Jupyter Notebooks的网站界面能力以支持更多类似桌面的用户与系统的交互。 “我们科学需要这些更大的系统,” Gaffney说,“我们需要更多种类的系统,我们需要更多种类的用户。这是我们正要推动这些种类门户的地方,我相信这对许多我们现在正要推进的系统将是新的面孔,更多的网络驱动,更多的图解,更少的命令行驱动。” “国家科学基金会与TACC共同分享Wrangler持续的世界领先的吞吐性能的自豪,特殊性的开放科学社区可利用的运营型资源,推动关注数据的研究,”监督NSF奖的项目官员Robert Chadduck说。 Wrangler正在引领数据密集型科学研究中计算问题,“有一些伟大的系统和伟大的研究人员为了改变我们生活的方式和我们生活的世界,正在做一些与数据有关的开创性的非常重要的工作。” Wrangler正在推进分享这些成果,所以每个人都可以看到正在发生什么。
  • 《ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2023-07-11
    • 虚拟数字人是一种利用计算机技术、人工智能技术和图像学技术的人形虚拟实体,其外部形象和外显行为是通过在虚拟现实环境中使用机器学习、语言生成、模拟对话等数字化技术来模拟真实世界人物的行为来生成的。其具有高度的可定制性、自主和自适应的学习能力、逼真的外貌形象和动作表现、自然而流畅的交互方式以及高效的算力效率等特征。为了实现虚拟数字人的“拟人化”,需要使用模型驱动技术赋予其与人相似的特征。这些驱动技术主要包括三种:第一个是图像迁移技术,也称 CG 建模技术,利用计算机技术进行视觉设计和生产,使虚拟数字人的外观更真实拟人;第二个是自然语言处理技术,训练虚拟数字人的语言对话能力,使虚拟机器人和用户的对话更加人性 化;第三个是 CV 等深度学习模型,通过大量的原始数据训练虚拟数字人,使其不断进行自我进化,完善计量框架等,进一步丰富虚拟数字人的“灵魂”。 虚拟数字人近年来备受关注,作为一种新兴的技术,其在商业活动、文化教育、智慧城市等众多领域发挥作用,图书馆也是虚拟数字人的重要应用场景。在图书馆服务中,虚拟数字人可被视作一种新的交互媒介,其能够模拟和再现真实世界中的各种人类活动和行为,并创造出一些超越现实的全新体验和知识。在元宇宙领域,虚拟数字人作为一种集数据赋权、智能化决策、实时互动、非线性组合和多源交互于一体的新型决策主体,有助于形成特定感知、响应、协调的新型敏捷治理路径。虚拟数字人也是元宇宙中的数字记忆主体,有助于图书馆等文化记忆机构参与构建、长期保存数字记忆和进行服务创新。有学者提出,图书馆有必要将普通虚拟形象升级为虚拟数字人开展服务。 ChatGPT 一经问世便引起信息资源管理领域学者的广泛关注。陆伟等提出,ChatGPT 在支撑算法与技术、信息资源建设、信息组织与信息检索、信息治理、内容安全与评价、人机智能交互与协同等方面都具有深远的影响。目前,ChatGPT 在图书馆领域的应用研究主要集中在以下三个方面:一是智能问答系统,围绕 ChatGPT 的生成能力,快速、准确地回答用户提出的问题,为用户提供更加智能化的服务;二是虚拟助手,通过 ChatGPT 提供更加贴近用户需求的服务,不断优化自身的服务质量,提高用户满意度;三是文献推荐系统,通过分析用户的阅读记录和兴趣偏好,自动生成与用户兴趣相关的文献推荐,提高用户的阅读体验和阅读效率。ChatGPT 的出现为图书馆人智交互提供了更加高效、准确、自然的解决方案,为图书馆的未来发展提供了新的思路和方向。 ChatGPT 在自然语言处理领域取得了显著成果,可实现拟人化交互和更高效地向虚拟个体提供技术基础。ChatGPT 赋能虚拟数字人的相关探索主要有以下几个方向:第一,通过对 ChatGPT 进行微调,使其能够生成更符合人类交互习惯的自然语言,从而使虚拟数字人的语言生成更加自然流畅。同时,将语义理解的知识引入,让虚拟数字人能够更加准确地理解用户的意图,提升交互质量。第二,学者们通过对 ChatGPT进行情感训练,使其能够识别和表达不同情感状态下的语言和行为,从而使虚拟数字人更真实地表现出情感,并能够进行情感识别和反馈。第三,在虚拟数字人的多模态交互方面,学者们将 ChatGPT 与图像、声音等多模态信息进行融合,例如与人脸识别技术相结合,虚拟数字人能够精准识别用户的表情,以理解用户意图并为其提供相应服务。 ChatGPT 赋能虚拟数字人在图书馆领域具有重要的价值和意义,是提升图书馆服务水平、优化服务效率以及推动服务模式创新的必要选择,也是适应信息化时代发展趋势的重要举措。本研究聚焦于 ChatGPT 在图书馆虚拟数字人领域的应用,着重探讨其技术优势、应用场景和实践路径,以更好地推动智慧图书馆的建设和发展。具体来说,ChatGPT 赋能虚拟数字人的优势包括高效的智能模型计算、精准的信息资源服务和人性化的自然语言交互。在应用场景方面,ChatGPT 可以被用于虚拟馆员智能问答、虚拟讲解员、阅读推广服务以及特殊人群无障碍服务等方面。针对这些应用场景,本研究从技术支撑、信息资源、服务场景和管理制度方面提出实践路径,明确图书馆虚拟数字人服务治理发展方向,充分利用 ChatGPT 技术去整合、搜集、加工和应用资源,以实现ChatGPT 赋能图书馆虚拟数字人技术的全面应用。 近年来,人工智能以及元宇宙的快速发展和广泛应用不仅深刻改变了我们的生产和生活方式,也为图书馆事业带来前所未有的机遇和挑战。本文在 hatGPT 赋能图书馆虚拟数字人的技术优势、应用场景与实践路径方面进行了初步的探索,在未来更深入的研究中,将借助 ChatGPT 的插件,构建图书馆虚拟数字人原型系统,探索系统的数据支持、可行性验证和效果评估。通过数字技术和人工智能技术的结合,图书馆虚拟数字人将实现从传统服务模式向智慧化服务模式的跨越,为用户提供更高质、更高效的服务。这也为图书馆学界提供了新的研究支点,共同开创数智融合下图书馆虚拟数字人新进路。 [1]郭亚军,庞义伟,周家华等.ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径[J/OL].图书馆论坛:1-11[2023-07-11].