《科学家发布全球首个多模态地理科学大模型 推动地理学与人工智能深度融合》

  • 来源专题:人工智能
  • 编译者: 高楠
  • 发布时间:2024-09-20
  •       9月19日,中国科学院地理科学与资源研究所正式发布该单位联合中国科学院青藏高原研究所、自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)。
          大模型是指通过海量数据训练的深度学习模型,具备强大的语言理解、信息生成和处理能力。“坤元”是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力。研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。
          在“懂地理”方面,该团队建立了涵盖4大类、16小类的地理全学科语料库,提供了320亿词元供大模型自监督学习,制作了4万余条高质量地理学指令进行模型微调。与通用语言大模型相比,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,并在地理学基准测试集上的准确性提升了31.3%。
          在“精配图”方面,该团队自主研发了面向多层次地图信息的多模态检索技术以及支持地理认知与图形表达的知识推理技术。这些技术使得“坤元”能够在解答地理学提问的同时,可以根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。
          在“知人心”方面,该团队创新性地提出了基于“认知启航-应用智导-前沿研析”框架的用户画像精准判别与响应技术,保证“坤元”能够充分考虑地理知识爱好者、地理学专业学生和科研人员的地理科学知识体系认知和表达差异,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。
          在“智生图”方面,该团队基于“坤元”开发的科研助手,可以根据用户指令完成概念理解、数据获取、信息分析、制图综合等流程,生成用户需要的专业地理图表。
          “坤元”旨在拓宽普通大众的地理视野,解放地理从业者的双手,推动地理智能发展,赋能地理科学研究,加速重要地理科学发现。目前,“坤元”已支撑发表Nature子刊、The innovation、Earth’s Future等高水平学术论文10余篇。未来,研发团队将推进地图大模型与地理推理机研发,以期让地理科学语言大模型读懂地图;将打造地理科研协作大平台,以期让每个科学家和科研团队都可以拥有专属的地理大模型,并能够与数百万科学家通过共享数据、模型、研究思路等方式协同工作。


    责任编辑:侯茜

  • 原文来源:https://www.cas.cn/syky/202409/t20240918_5032137.shtml
相关报告
  • 《百度发布首个量子领域大模型》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-09-27
    • 9月23-24日,以“协同创新 量点未来”为主题,2023量子产业大会在安徽合肥召开。量子领域院士专家、智库机构、产业界嘉宾汇聚一堂,探讨量子产业化之路。 作为主旨报告嘉宾,百度量子计算研究所所长段润尧带来百度量子软硬件和解决方案等方面的最新成果,重磅发布首个量子领域大模型,及百度量子助手和量子写作助手两大AI原生应用,加速量子技术与大模型深度融合。他还发布了量子领域大模型白皮书,展望量子领域大模型的未来发展趋势和技术潜力。 当前,量子计算带来后摩尔时代算力革命,广阔市场空间随之打开。有数据显示,2031年69%的全球大型企业计划将采用量子计算。 依托百度量子平台和文心大模型的双重底座优势,百度发布首个量子领域大模型,旨在芯片层、框架层、模型层及应用层等全栈技术上加速量子技术与大模型深度融合,充分激发两大技术各自的潜力。 据段润尧介绍,该量子领域大模型是在文心一言基础上,使用量子领域高质量数据进行更有针对性的训练和优化而构建的量子领域大模型,能更好地理解量子知识,专业执行量子任务。百度量子领域大模型将充分发挥技术协同效应,在数据、算法和算力等各方面取长补短,实现双向赋能,将在训练速度、模型性能、训练成本、交互效率和数据隐私等各个维度全面加持现有大模型的技术能力。 百度量子助手是依托百度量子知识库与产业级知识增强文心大模型,基于7800万原始数据、22万精调数据训练打造。作为百度量子平台的统一入口,百度量子助手打通了百度量子平台量子硬件、量子软件、量子应用的技术全链条,持续降低百度量子平台的使用门槛。 量子写作助手实现了量子领域知识和技术准确且高效的输出,让量子知识触手可及,降低量子计算学习门槛,提高量子计算科研效率。只需输入6个变量,量子写作助手可在5分钟内撰写一篇13000字符合格式要求的专利文档,高效帮助企业将量子领域的研究成果与知识产权沉淀为企业资产。 段润尧进一步分享,量子领域大模型的未来发展将会呈现出多个代表性阶段。从近期以适配量子领域的行业大模型开始,大幅降低量子教育行业门槛;逐渐过渡为经典和量子混合大模型,再发展到通用量子领域大模型,有望实现大模型技术在数据、算法、算力等各维度的全面量子化;最终,量子领域大模型将会成为新时代的操作系统,在量子互联网的基础上互联互通,成为社会发展的基础设施。 现场,段润尧重磅发布量子领域大模型白皮书。报告指出,量子科技与大模型成为技术变革主引擎,量子计算是有效模拟大规模量子系统的利器,量子领域大模型或将成为量子人工智能的最终形式。交互式机制建立起“能力”传递的纽带,而量子纠缠有望将这种机制发挥至极致。 此外,段润尧公布了百度在量子芯片、软硬一体化解决方案等核心领域的最新进展。 百度量子平台近一年进行了持续大规模更新,在金融科技、光量子和量子芯片三大领域均有新功能发布。在金融科技领域,百度量子计算研究所推出量子金融工具集QFinance,提供全面且多功能的量子期权定价工具,整合众多前沿量子算法,包括量子蒙特卡洛、量子傅里叶变换和量子相位估计算法,既确保了计算的高度准确性,也显著缩短了算法运行时间,为资产配置带来了新的高效解决方案。 在光量子领域,百度推出光量子计算模拟器PQS(Photonic Quantum Simulator),为光量子芯片设计和算法研发提供了宝贵的工具和资源。该模拟器支持基于Gaussian态和Fock态的光量子线路模拟,并包含了近20种量子门和测量操作,可模拟多种光量子计算算法,是国内首款可以自由搭建光量子计算线路的模拟工具。 百度量子瞄准超导量子芯片研发“设计、流片、测控” 闭环中的核心技术,旨在研发具有业界核心竞争力的高性能量子芯片。目前,百度量子已完成一款 2D 含耦合器量子芯片的“流片验证”,以及一款 3D flipchip 含耦合器量子芯片的版图设计和仿真验证。近期,“高性能量子芯片的设计、流片与测控全栈技术” 项目荣获「2023 百度十大科技前沿发明」。高性能量子芯片研发将对人工智能、材料科学、药物研发、金融科技等领域带来高潜价值。 去年8月,百度推出全球首个全平台量子软硬一体化解决方案“量羲”,打造出量子计算产业落地的可行路径。量羲平台与百度云计算进行深度融合,并采纳了"四算合一"的战略布局,实现了量子计算、高性能计算、云计算及人工智能计算的有机融合。这使得平台能够根据不同业务需求,灵活调配算力资源。近期“量羲”已完成首个商业化合同的PoC部署。 在量子生态与知识产权方面,百度已申请高质量专利超过280项,已授权120项,覆盖量子算法与应用、量子通信与网络等热门研究方向。今年3月,百度牵头成立国内首个量子计算产业知识产权联盟,并设立国内首个量子计算专利池,在关键量子专利领域进行布局,以推动量子产业高效发展。 “量子产业化和产业量子化已成为未来发展的必然趋势,量子领域大模型有望进一步加速这些目标的实现。百度将持续为用户开放量子资源,为客户提供量子升级培训,与伙伴一起共创量子生态,期待携手用户、客户、伙伴,一同迈向量子计算产业化之路,实现人人皆可量子的时代。”段润尧表示。
  • 《中国国内首个千亿级多模态电力行业大模型发布》

    • 来源专题:能源情报网监测服务平台
    • 编译者:郭楷模
    • 发布时间:2024-12-23
    • 12月19日,国家电网有限公司在北京发布了“电力知识最全、参数规模最大、专业能力最强”千亿级多模态行业大模型——光明电力大模型。该模型作为能源电力领域的人工智能“专家”,为电网安全稳定运行、促进新能源消纳、做好供电服务提供“超级大脑”。 据了解,为深入贯彻国家“人工智能+”行动,全面落实国家发展改革委专项任务、国资委焕新行动和国家能源局专项部署,国家电网有限公司协同内外部单位,加快推进以大模型为代表的新一代人工智能技术融合应用,推动电力行业数字化智能化转型升级,助力新型电力系统和新型能源体系建设。 国家电网有限公司董事长、党组书记张智刚在发布会上表示,国家电网有限公司着力开展人工智能技术在电力领域应用探索,建成了覆盖公司总部和27家省公司的统一开放人工智能技术创新平台,推动电力与算力协同赋能。光明电力大模型作为千亿级多模态行业大模型,其集成的电力数据、涵盖的应用场景、具备的专业功能在行业内首屈一指,能够面向电力生产、建设、管理、运营、科研、制造、服务等全产业链提供专业化智能化服务,对于推动新型电力系统建设,加快形成新质生产力,更好保障国家能源安全、促进能源绿色转型,具有重要意义。 据了解,光明电力大模型作为电力专家,不仅服务国家电网公司自身,更是一个服务全行业上下游企业、全产业链共建共享的行业级大模型,面向全行业开放共享,支持行业上下游企业和合作伙伴,基于光明电力大模型,快速构建各领域场景和推广应用。 近年来,国家电网有限公司统筹开展“人工智能+”顶层设计,形成以光明电力大模型为核心的“6541”总体规划布局,即全面覆盖规划建设、电网运行、设备管理、作业管控、客户服务、经营管理等6大业务领域600余个场景,着力提升感知智能、认知智能、决策智能、具身智能、科学智能(AI for Science)5项技术能力,持续夯实样本、算力、平台、模型4个核心要素,构建了以光明电力大模型为核心的两级协同运营机制,体系化推进人工智能技术在电力领域落地。 发布会上还举行了签约仪式,国家电网有限公司分别与百度集团、阿里巴巴集团签署战略合作框架协议。国家电网有限公司表示,将与签约各方,共建光明电力大模型,共谋新思路,共创新发展,共启新篇章,携手促进能源电力科技创新与产业创新融合发展,为以中国式现代化全面推进强国建设、民族复兴伟业贡献力量。