2023年对于人工智能产业而言是非常重要的一年,尤其是以GPT-3、ChatGPT为代表的大模型技术所取得的显著成果标志着以专用小模型训练为主的“手工作坊时代”向通用大模型预训练为主的“工业化时代”的人工智能研究范式转变,敲开了通用人工智能的大门。AIGC(AI-Generated Content)指利用人工智能技术(生成式AI路径)来生成内容的新型内容生产方式。AIGC应用创新的技术支撑为“生成对抗网络(GAN)/ 扩散模型(Diffusion)”与“Transformer预训练大模型”的两类大模型分支。在国外AIGC应用展示出大模型的能量的同时,我国企业也加强了相关产品技术布局,云厂商、AI大厂、创企、各行业公司及技术服务商等产业各领域玩家纷纷发布大模型或基于大模型的应用产品及各类技术服务。
从商业化布局角度来看,如今基础大模型厂商可分为三类参与者,分别为云巨头厂商、人工智能公司或创业公司和学术研究机构,在定位有通用能力基座的同时打通向上商业化路径。其中,云巨头厂商将借助云服务及数据库资源,更强调MaaS能力输出。AI公司或创业公司将借助业务积累或生态资源锚定几个典型行业或业务场景展开商业占领。垂直领域厂商将基于开源模型或基模平台开发部署细分领域模型产品,厂商优势在垂类数据与业务理解。通用模型和各领域专有的知识数据结合,未来垂直大模型是重要的发展方向,本文重点讨论大模型在垂直行业部署与细分场景的落地应用现状。大模型在金融领域的应用探索
金融行业作为人工智能应用场景密集的行业,是大模型技术落地的最佳领域之一。以大模型为代表的新一代人工智能技术将加速金融数字化和金融智能化的发展,重塑现有业务流程,改变产业格局。大模型技术可应用于智能客服、投顾、营销、风控、运营、投研、投行、量化交易、低码研发等多个场景。第一是基于大模型的智能客服将超越人工服务,让高质量顾问式金融服务成为可能。在通用大模型的基础上,叠加金融客服领域的数据和专业服务经验,经过垂直领域定向训练后客服机器人既能与用户进行多轮对话,还能提供具体可行的解决方案。
第二是生成式大模型可以成为理财师、经纪人等从业者的“全能业务助理”。基于大模型的业务助理不仅了解国内外的宏观政策、行业信息、产品信息,还可以自动生成文章、报告,提供专业建议和方案辅助交流。
第三是广告和营销内容一键生成,营销效率大幅提升。以ChatGPT为代表的大模型技术,将带来知识型工作者生产效率的二次飞跃。过去,我们需要在海量信息中检索词条,将大量的精力投入到信息的获取、提炼与整合,自己做检索、设计、制作等工作。未来,大模型技术会适应并普及到所有知识型工作行业,例如文案、设计、编程等,人机协作将大幅提高工作效率。
大模型能够凭借强大的信息挖掘能力,唤醒金融机构大量沉积的信息,就像是一块巨大的磁石,做关键信息的抽取,为判别式小模型进行赋能。比如,在风险决策、信用评估、反欺诈等场景下,大模型能丰满信息的维度,挖掘出小模型无法覆盖到的区域。大模型对于小模型并非是替代或“消灭”,相反,两者将是相互协作的关系,大模型与小模型相互搭配,将大大提升金融决策的精准度和效率。
医疗保健行业充斥着各种类型的基于文本的文档,例如患者病历、索赔文件、临床记录、同意书和弃权书等。大语言模型(Large Language Model,LLM)能够快速阅读、解释大量文本并对其采取行动,这意味着他们可以为医疗机构带来优势,使他们能够以独特的方式安全、可靠地工作。医疗保健非常适合利用大型语言模型,因为给定的医疗系统的医疗记录中存在大量的潜在数据。
在这样一个文档密集的行业中,医疗保健领域并不缺乏大型语言模型的应用场景。以下是大型语言模型功能的示例,这些功能在医疗保健环境中应用时,可以简化流程并改进整体工作流程。
临床记录:医疗健康专业人员可以使用LLM创建准确且全面的临床记录,使用LLM分析患者数据并生成相关摘要。这有助于减轻记录负担,同时确保准确记录重要信息。改进信息提取:从非结构化文本(例如患者记录或研究文章)中识别和提取相关信息是LLM的另一个自然应用。这种能力使医疗保健组织能够释放隐藏在庞大数据存储库中的宝贵见解,最终支持更好的决策。高级沟通能力:由于大语言模型擅长理解自然语言,因此非常适合患者与提供者沟通等任务。这些模型可以通过以上下文相关的方式解释和回应患者的询问、担忧或反馈,促进更有效的互动。文件生成和管理:大语言模型可以自动生成重要的医疗保健文件,例如同意书、弃权书和出院摘要。通过从患者记录中提取相关信息并预先填充这些文档,LLM可以节省时间,最大限度地减少错误风险,并使提供者能够让患者感觉他们了解他们,而无需要求重复信息。当纳入智能入院和登记工作流程时,这些工具能够轻松捕获准确的患者信息,从而最大限度地提高临床和财务成果。
大模型在工业领域的应用探索
大模型在工业的应用,目前在生产制造、研发设计和经营管理领域都形成一些场景,但都处于起步和探索阶段。各工业相关领域技术服务商和行业解决方案商也都在积极布局AI大模型的行业应用,以下是大模型技术在工业领域的应用场景方向探索。
其中生产制造的应用包含运营管理,使用自然语言交互方式,分析操作和运营人员的自然语言指令,进行对应数据、信息的查找、呈现和关联分析等,提高信息查找和分析的效率,帮人员更直观快捷的获取所需的信息。质量安检,使用大模型提供更强的视觉检测能力,用于质检、安全监测等,提高模型泛化能力,降低训练样本需求。生成模拟检测图像的缺陷样本,补充小样本的不足,提高模型准确性等。自动对检测的结果进行分析,并生成检测报告等。在计划调度层面,使用大模型进行排产排程优化、生产和物流调度优化,提高算法能力,基于自然语言自动生成PLC控制代码,提高开发效率,降低开发门槛。在自动化控制层面,使用自然语言与机器人交互,对工业机器人进行智能控制,提高机器人场景适应性降低操作难度。
在可见的未来里,相信随着大模型技术的进一步发展,这类生成式AI产品将在工业互联网领域发挥越来越重要的作用,支持更多工业场景需求的落地实现。大模型在交通领域的应用探索
大模型在交通领域应用的优势:一是自然语言处理能力,如和文字相关的交通报告分析、语音识别等;二是轨迹大数据,在交通出行建模、拥堵研判,主流交通路径等方面有所应用;三是多模态,比如如何从视频转化为交通流指标等,都是交通大模型中非常重要的因素;四是计算机视觉模型,在车道线、红绿灯、交通违法事件等交通要素识别方面的应用广泛。
2023年4月,百度基于文心大模型在高速公路领域发布了数字人“简璐璐”,服务于路网监测、应急指挥、养护管理、公众出行全环节,可以结合用户问题,提供全新对话式交互,实时给出精准答复。随后,在交通管理领域发布了全域信控缓堵解决方案,能够提供全域感知、全域优化、全域协同和全域服务四大能力,实现信控优化的代际提升,可实现超千规模路口的全域拥堵治理。
2023年7月19日,北京交通大学联合中国计算机学会智慧交通分会、足智多模公司等正式发布并开源了国内首个综合交通大模型——TransGPT·致远,依托北京交通大学“交通大数据与人工智能”教育部重点实验室科研团队自主研发。与通用型多模态交通大模型产品不同,致远大模型自研发伊始就瞄准交通运输行业中的实际应用需求,基于研发团队长期汇聚积累的综合交通大数据,在交通态势预测、交通规划设计、公共交通服务、智能咨询助手、交通安全教育、交通协助管理、交通事故分析、自动驾驶辅助等方面形成具有实际应用价值的智能化支撑能力。交通态势的全面及时、精准感知是智慧交通的基础,也是一直以来困扰行业的难题。交通事件识别不准的问题在交通行业是普遍存在的。现阶段在应对AI大规模落地应用问题上,预训练大模型借助其通用、泛化能力优势为AI落地提供了新的解决思路。
交通感知方面,大模型可以进行道路路况识别和车辆车流密度检测。基于某帧画面生成当前路况描述并直接发布,这些数据可以连接到情报版或导航软件,将海量的监控图片、监控数据利用起来。此外,大模型在道路分割、服务区、停车场余位识别、交通事件检测等方面也有所应用,可做到让视频监测真正免配置,大幅提升检测准确率。交通治理方面,通过大模型的语义理解、泛化推理、自动取数能力可对历史交通数据和实时交通数据进行分析,精准定位、判断某路段和某区域的交通状况;快速聚焦交通运行核心痛点问题;预测未来交通状况;提供初步、快速的交通决策支持,缓解交通规划方案和治理经验复用高度依赖高阶人才的难题。交通控制系统优化方面,大语言模型通过集成和调度车辆监管、交通信号调整、智能导航、智能停车等多种智能服务,实现交通系统的动态优化和智能化服务,提高交通治理效率和安全性。交通物流行业应用方面,大模型的应用场景可分为两类,一类是人机交互类场景,如数字人、智能客服。面向问答类场景,通过调用大模型的理解能力、推理能力、解决问题的能力,将一个问题拆分成多个任务,由大模型和交通业务系统共同完成,并将语料资源整合成完整的答案交付给用户,从而开发作业系统增强服务、专业咨询引导和内容生产服务。
尽管大模型具有广阔的应用前景,但在实际应用中仍面临一些挑战。产业大模型的综合能力实际上取决于计算能力、行业专业知识和模型精调的结合。其中,行业专业知识至关重要,它涵盖了专家经验、行业数据、组织能力和工程能力,这是垂直企业的核心竞争优势所在。其次在落地应用过程中,如何确保在保障数据安全的前提下释放其价值,如何提高模型的准确性和可靠性,以及如何确保AI生成的内容的安全性、可信性和可靠性,这些都是在推动大模型产业化落地时需要各方共同努力解决的问题。