《客座演讲:针对专业搜索任务的可解释信息检索模型》

  • 来源专题:图书情报
  • 编译者: luoluo
  • 发布时间:2020-11-02
  • 2020年10月29日,威斯康星大学麦迪逊分校(UW-Madison)发布了一场讲座的信息。讲座主题:建立适用于专业搜索任务的可解释信息检索模型,主讲人:王越,讲座时间:2020年11月17日下午15:00,会议地址:https://uwmadison.zoom.us/j/96378926598?pwd=NkNuRjJ3M2FyQlNmT0hzNjBpc2tMZz09

    主讲人相关信息:王越是北卡罗来纳大学教堂山分校信息与图书馆科学学院的助理教授。他的研究兴趣包括文本数据挖掘,机器学习,信息检索,自然语言处理和健康信息学。他最近的工作集中于设计和评估交互式且可解释的机器学习算法,可以帮助科学家从大型非结构化文本中获取知识。这些算法已应用于广泛的数据挖掘任务,包括高检索率搜索、计算机辅助内容分析和临床自然语言处理。他在计算机和信息科学领域的著名场所出版,包括SIGIR,WSDM,ACL,KDD,AMIA和JAMIA。他是WSDM,SIGIR和WWW的常规计划委员会成员。

    讲座的相关信息:在诸如精确医学文献搜索之类的专业搜索任务中,查询通常涉及多个方面。为了评估文档的相关性,搜索者将不遗余力地验证查询中的每个方面,并遵循特定任务的逻辑来做出相关性决策。在这种情况下,我们说搜索者会做出结构化的相关性判断,这与常规的单变量(二进制或分级)相关性判断相反。理想情况下,搜索引擎可以支持搜索者的工作流程并遵循相同的步骤来预测文档的相关性。这种方法不仅可以产生高效的检索模型,而且还为该模型提供了以与搜索者相同的“语言”来解释其决策的机会。在本次演讲中,王医生将讨论可解释的检索模型的最新工作,这些模型可模拟医学专家如何做出结构化的相关性判断。他使用TREC Precision Medicine文献搜索记录(2017-2019)中的数据发现,一个简单,可解释且标签有效的模型可以始终如一地执行复杂,黑匣子和需要数据的学习排名楷模。这些结果表明,利用专业搜索查询中的结构是朝着建立可解释的搜索系统以支持专业搜索任务的方向发展。

相关报告
  • 《人工智能中场之争:大模型在产业变革中的应用探索》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-09-27
    • 2023年对于人工智能产业而言是非常重要的一年,尤其是以GPT-3、ChatGPT为代表的大模型技术所取得的显著成果标志着以专用小模型训练为主的“手工作坊时代”向通用大模型预训练为主的“工业化时代”的人工智能研究范式转变,敲开了通用人工智能的大门。AIGC(AI-Generated Content)指利用人工智能技术(生成式AI路径)来生成内容的新型内容生产方式。AIGC应用创新的技术支撑为“生成对抗网络(GAN)/ 扩散模型(Diffusion)”与“Transformer预训练大模型”的两类大模型分支。在国外AIGC应用展示出大模型的能量的同时,我国企业也加强了相关产品技术布局,云厂商、AI大厂、创企、各行业公司及技术服务商等产业各领域玩家纷纷发布大模型或基于大模型的应用产品及各类技术服务。 从商业化布局角度来看,如今基础大模型厂商可分为三类参与者,分别为云巨头厂商、人工智能公司或创业公司和学术研究机构,在定位有通用能力基座的同时打通向上商业化路径。其中,云巨头厂商将借助云服务及数据库资源,更强调MaaS能力输出。AI公司或创业公司将借助业务积累或生态资源锚定几个典型行业或业务场景展开商业占领。垂直领域厂商将基于开源模型或基模平台开发部署细分领域模型产品,厂商优势在垂类数据与业务理解。通用模型和各领域专有的知识数据结合,未来垂直大模型是重要的发展方向,本文重点讨论大模型在垂直行业部署与细分场景的落地应用现状。大模型在金融领域的应用探索 金融行业作为人工智能应用场景密集的行业,是大模型技术落地的最佳领域之一。以大模型为代表的新一代人工智能技术将加速金融数字化和金融智能化的发展,重塑现有业务流程,改变产业格局。大模型技术可应用于智能客服、投顾、营销、风控、运营、投研、投行、量化交易、低码研发等多个场景。第一是基于大模型的智能客服将超越人工服务,让高质量顾问式金融服务成为可能。在通用大模型的基础上,叠加金融客服领域的数据和专业服务经验,经过垂直领域定向训练后客服机器人既能与用户进行多轮对话,还能提供具体可行的解决方案。 第二是生成式大模型可以成为理财师、经纪人等从业者的“全能业务助理”。基于大模型的业务助理不仅了解国内外的宏观政策、行业信息、产品信息,还可以自动生成文章、报告,提供专业建议和方案辅助交流。 第三是广告和营销内容一键生成,营销效率大幅提升。以ChatGPT为代表的大模型技术,将带来知识型工作者生产效率的二次飞跃。过去,我们需要在海量信息中检索词条,将大量的精力投入到信息的获取、提炼与整合,自己做检索、设计、制作等工作。未来,大模型技术会适应并普及到所有知识型工作行业,例如文案、设计、编程等,人机协作将大幅提高工作效率。 大模型能够凭借强大的信息挖掘能力,唤醒金融机构大量沉积的信息,就像是一块巨大的磁石,做关键信息的抽取,为判别式小模型进行赋能。比如,在风险决策、信用评估、反欺诈等场景下,大模型能丰满信息的维度,挖掘出小模型无法覆盖到的区域。大模型对于小模型并非是替代或“消灭”,相反,两者将是相互协作的关系,大模型与小模型相互搭配,将大大提升金融决策的精准度和效率。 医疗保健行业充斥着各种类型的基于文本的文档,例如患者病历、索赔文件、临床记录、同意书和弃权书等。大语言模型(Large Language Model,LLM)能够快速阅读、解释大量文本并对其采取行动,这意味着他们可以为医疗机构带来优势,使他们能够以独特的方式安全、可靠地工作。医疗保健非常适合利用大型语言模型,因为给定的医疗系统的医疗记录中存在大量的潜在数据。 在这样一个文档密集的行业中,医疗保健领域并不缺乏大型语言模型的应用场景。以下是大型语言模型功能的示例,这些功能在医疗保健环境中应用时,可以简化流程并改进整体工作流程。 临床记录:医疗健康专业人员可以使用LLM创建准确且全面的临床记录,使用LLM分析患者数据并生成相关摘要。这有助于减轻记录负担,同时确保准确记录重要信息。改进信息提取:从非结构化文本(例如患者记录或研究文章)中识别和提取相关信息是LLM的另一个自然应用。这种能力使医疗保健组织能够释放隐藏在庞大数据存储库中的宝贵见解,最终支持更好的决策。高级沟通能力:由于大语言模型擅长理解自然语言,因此非常适合患者与提供者沟通等任务。这些模型可以通过以上下文相关的方式解释和回应患者的询问、担忧或反馈,促进更有效的互动。文件生成和管理:大语言模型可以自动生成重要的医疗保健文件,例如同意书、弃权书和出院摘要。通过从患者记录中提取相关信息并预先填充这些文档,LLM可以节省时间,最大限度地减少错误风险,并使提供者能够让患者感觉他们了解他们,而无需要求重复信息。当纳入智能入院和登记工作流程时,这些工具能够轻松捕获准确的患者信息,从而最大限度地提高临床和财务成果。 大模型在工业领域的应用探索 大模型在工业的应用,目前在生产制造、研发设计和经营管理领域都形成一些场景,但都处于起步和探索阶段。各工业相关领域技术服务商和行业解决方案商也都在积极布局AI大模型的行业应用,以下是大模型技术在工业领域的应用场景方向探索。 其中生产制造的应用包含运营管理,使用自然语言交互方式,分析操作和运营人员的自然语言指令,进行对应数据、信息的查找、呈现和关联分析等,提高信息查找和分析的效率,帮人员更直观快捷的获取所需的信息。质量安检,使用大模型提供更强的视觉检测能力,用于质检、安全监测等,提高模型泛化能力,降低训练样本需求。生成模拟检测图像的缺陷样本,补充小样本的不足,提高模型准确性等。自动对检测的结果进行分析,并生成检测报告等。在计划调度层面,使用大模型进行排产排程优化、生产和物流调度优化,提高算法能力,基于自然语言自动生成PLC控制代码,提高开发效率,降低开发门槛。在自动化控制层面,使用自然语言与机器人交互,对工业机器人进行智能控制,提高机器人场景适应性降低操作难度。 在可见的未来里,相信随着大模型技术的进一步发展,这类生成式AI产品将在工业互联网领域发挥越来越重要的作用,支持更多工业场景需求的落地实现。大模型在交通领域的应用探索 大模型在交通领域应用的优势:一是自然语言处理能力,如和文字相关的交通报告分析、语音识别等;二是轨迹大数据,在交通出行建模、拥堵研判,主流交通路径等方面有所应用;三是多模态,比如如何从视频转化为交通流指标等,都是交通大模型中非常重要的因素;四是计算机视觉模型,在车道线、红绿灯、交通违法事件等交通要素识别方面的应用广泛。 2023年4月,百度基于文心大模型在高速公路领域发布了数字人“简璐璐”,服务于路网监测、应急指挥、养护管理、公众出行全环节,可以结合用户问题,提供全新对话式交互,实时给出精准答复。随后,在交通管理领域发布了全域信控缓堵解决方案,能够提供全域感知、全域优化、全域协同和全域服务四大能力,实现信控优化的代际提升,可实现超千规模路口的全域拥堵治理。 2023年7月19日,北京交通大学联合中国计算机学会智慧交通分会、足智多模公司等正式发布并开源了国内首个综合交通大模型——TransGPT·致远,依托北京交通大学“交通大数据与人工智能”教育部重点实验室科研团队自主研发。与通用型多模态交通大模型产品不同,致远大模型自研发伊始就瞄准交通运输行业中的实际应用需求,基于研发团队长期汇聚积累的综合交通大数据,在交通态势预测、交通规划设计、公共交通服务、智能咨询助手、交通安全教育、交通协助管理、交通事故分析、自动驾驶辅助等方面形成具有实际应用价值的智能化支撑能力。交通态势的全面及时、精准感知是智慧交通的基础,也是一直以来困扰行业的难题。交通事件识别不准的问题在交通行业是普遍存在的。现阶段在应对AI大规模落地应用问题上,预训练大模型借助其通用、泛化能力优势为AI落地提供了新的解决思路。 交通感知方面,大模型可以进行道路路况识别和车辆车流密度检测。基于某帧画面生成当前路况描述并直接发布,这些数据可以连接到情报版或导航软件,将海量的监控图片、监控数据利用起来。此外,大模型在道路分割、服务区、停车场余位识别、交通事件检测等方面也有所应用,可做到让视频监测真正免配置,大幅提升检测准确率。交通治理方面,通过大模型的语义理解、泛化推理、自动取数能力可对历史交通数据和实时交通数据进行分析,精准定位、判断某路段和某区域的交通状况;快速聚焦交通运行核心痛点问题;预测未来交通状况;提供初步、快速的交通决策支持,缓解交通规划方案和治理经验复用高度依赖高阶人才的难题。交通控制系统优化方面,大语言模型通过集成和调度车辆监管、交通信号调整、智能导航、智能停车等多种智能服务,实现交通系统的动态优化和智能化服务,提高交通治理效率和安全性。交通物流行业应用方面,大模型的应用场景可分为两类,一类是人机交互类场景,如数字人、智能客服。面向问答类场景,通过调用大模型的理解能力、推理能力、解决问题的能力,将一个问题拆分成多个任务,由大模型和交通业务系统共同完成,并将语料资源整合成完整的答案交付给用户,从而开发作业系统增强服务、专业咨询引导和内容生产服务。 尽管大模型具有广阔的应用前景,但在实际应用中仍面临一些挑战。产业大模型的综合能力实际上取决于计算能力、行业专业知识和模型精调的结合。其中,行业专业知识至关重要,它涵盖了专家经验、行业数据、组织能力和工程能力,这是垂直企业的核心竞争优势所在。其次在落地应用过程中,如何确保在保障数据安全的前提下释放其价值,如何提高模型的准确性和可靠性,以及如何确保AI生成的内容的安全性、可信性和可靠性,这些都是在推动大模型产业化落地时需要各方共同努力解决的问题。
  • 《再看大模型与知识图谱的融合策略:KnowledGPT–面向知识图谱检索进行大模型增强的框架工作》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-10-10
    • 大型语言模型(LLMs)在自然语言处理领域产生了令人印象深刻的影响,但它们在完整性、及时性、忠实性和适应能力等方面仍存在一些问题。 例如: 首先,LLM在及时更新和特定领域的专业性方面存在局限性。 其次,这些模型可能会产生不真实或"幻觉"的知识,从而带来可靠性和伦理方面的问题。 第三,由于成本和可及性等限制,大模型很难通过持续培训吸收新知识,这阻碍了这些模型适应特定知识需求的能力。 虽然最近的工作重点是将LLM与外部知识源连接起来,但对知识库(KB)的整合研究仍然不足,并面临着一些挑战。 例如, Toolformer通过查询维基百科对相互关联实体的描述来回答相关问题。 Graph-Toolformer和ToolkenGPT使LLM能够对知识图谱(如Freebase)进行推理。 RET-LLM与LangChain和LlamaIndex中KG索引的实际工作并行,利用从过去对话中提取的相关三元组构建个性化KG记忆,以供未来使用。互联网增强语言模型以及NewBing和ChatGPT 用BrowsewithBing插件,使语言学习者能够通过搜索引擎或网络浏览器获取最新信息。REALM、RAG等检索增强方法利用文档语料库增强了LLM,最近的大模型也越来越多地采用这些语料库作为记忆单元。 最近的工作文章《KnowledGPT: Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases》提出了一个将LLM与各种知识库连接起来的综合框架,可同时促进知识的检索和存储。其检索过程采用思维提示方法,以代码形式生成知识库搜索语言,并为知识库操作预设函数。与普通LLM相比,该方案既能利用知识库中已有的知识,也能利用提取到个性化知识库中的知识,从而正确回答更广泛问题。 文章主要介绍了KnowledGPT,该工作将LLM与外部知识库整合在一起的综合框架,可方便LLM在知识库中进行检索和存储。 在检索方面,KnowledGPT采用"思维程序"提示,通过代码生成和执行来检索知识。 在存储方面,KnowledGPT从用户提供的文本中提取各种形式的知识,并将提取的知识填充到个性化知识库中。 KnowledGPT解决了将LLM与知识库集成过程中固有的几个难题,包括复杂的问题解答、实体链接中的歧义以及有限的知识表示形式。 不过,尽管KnowledGPT使LLM能够有效地对外部知识库执行知识库操作,但其目前的形式仍存在一些局限性。 首先,出于效率考虑,检索过程需要单轮代码生成和执行。然而,多轮机制可以更好地让LLM自主探索知识库。由于LLM不了解知识库中的内容,它们可能会生成看似合乎逻辑却没有结果的搜索。例如,像"谁是......中女主角的配音演员"这样的查询,在某些知识库中可能需要对女主角和配音演员这两个关系进行两跳搜索,而在其他知识库中则只需要对主要配音演员这一个关系进行搜索。在这些情况下,多轮机制赋予了LLM自主探查和重新访问知识库的能力,这可能会产生更好的结果,但也会增加成本。 其次,受限于通过API访问GPT-4的费用,在具有代表性但规模较小的数据集上进行了KnowledGPT实验。虽然实验结果验证了KnowledGPT的有效性,但我们希望在完整基准上进行更全面的评估,以便更好地将KnowledGPT与相关方法进行比较。