《哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-12-01
  • 01 引言

    思维链,一种通过逐步思考解决问题的方式,在解决复杂推理任务上展现出了惊人的性能,激起了人工智能和自然语言处理领域近年来的广泛研究和关注。

    然而,目前缺乏一篇针对思维链及其变体的系统性归纳和总结。针对这一问题,本文对现有思维链相关研究进行了广泛调研,对思维链构造方法、思维链增强方法、思维链结构变体进行了归纳和总结,对思维链前沿应用做出了探讨并对思维链未来潜在研究方向进行展望。

    为了与传统链式思维链进行区分,本文提出了泛思维链(X-of-Thought)的概念,其泛指基于思维链核心思想——逐步思考解决问题的方法和变体。在下文中所讨论的思维链均代指广义的泛思维链。我们期望这篇综述能够为研究者和初学者提供参考和启发,激发更多关于思维链推理领域的深入探讨,推动该领域的进一步发展和创新。

    02 背景介绍

    2.1 范式转换

    近年来,随着计算能力的不断提升,大规模语言模型如雨后春笋般涌现,例如 GPT,LLAMA,BLOOM。而随着语言模型规模的不断扩大,涌现出了许多令人惊喜的能力,例如上下文学习和思维链能力。因此,自然语言处理的范式正在从预训练+微调转变为预训练+上下文学习。

    2.2 上下文学习和思维链推理

    上下文学习(In-context Learning)通过在提示文本中添加输入-输出示例,通过少样本学习(Few-shot Learning)的方式让 LLM 模仿已有示例(demonstrations)解决新的问题。通过上下文学习,LLM 无需额外微调即可使用,并且还能取得不错的性能。尽管如此,其在面对复杂数学推理、常识推理等复杂推理任务时表现不佳。

    思维链(Chain-of-Thought)推理要求模型在输出最终答案之前,显式输出中间逐步的推理步骤。这一举措大幅度提高了 LLM 在复杂推理任务上的表现,并且输出的中间步骤方便使用者了解模型的思考过程,提高了大模型推理的可解释性。目前,思维链推理已经成为大模型处理复杂任务的一个常用手段。

    03 章节组织

    我们将从三个角度介绍思维链相关方法,并且在最后进行了方法间的比较和讨论:

    思维链方法(包含思维链构造方法、思维链结构变体、思维链增强方法)

    思维链前沿应用(包含工具使用、决策规划、思维链蒸馏——提高小模型推理能力)

    未来研究展望(包含多模态思维链推理、可信思维链推理——减少幻觉、思维链理论研究)

    04 思维链方法

    4.1 思维链构造方式

    根据模型进行思维链推理所需的推理链条人工标注程度,我们将其分为手动、自动、半自动三种构造方式。

    4.1.1 手动思维链构造

    示例中的推理链条完全由人工标注。优缺点:人工标注推理链条具有较高质量,为少样本学习提供了优质的信号。但是人工标注需要较大的人力成本开销,并且会遇到示例选择难以优化、跨任务迁移困难等问题。

    4.1.2 自动思维链构造示例中的推理链条完全无需人工标注。具体来说,它分为 Zero-shot CoT 和 Auto CoT 两种方式。前者通过特定的提示文本激发模型在没有示例的情况下生成推理链条;后者则是使用前者零样本生成的推理链条,并结合示例选择策略,通过少样本学习的方式生成推理链条。优缺点:自动思维链构造不需要人工标注极大减少了人工成本,并且由于无需针对任务设定示例,在不同任务间可以方便迁移。但是由于缺少高质量人工标注信号,其性能通常较差,时常会出现事实错误、逻辑错误等幻觉现象。

    4.1.3 半自动思维链构造示例中的推理链条少量由人工标注。具体来说,人工标注少量推理链条作为“种子样例”,基于这些种子样例进行拓展得到大量的推理链条,之后通过示例选择通过少样本学习的方式生成推理链条。优缺点:半自动构造方法结合了前二者的优点,在推理性能和人力成本间达到了平衡。少量人工标注提供了高质量的信号从而提高了推理质量,并且自动的推理链条拓展也减少了人工成本,在不同领域间迁移也仅需对种子样例进行重新标注。

    4.2 思维链结构变体最原始的思维链是链式结构,并且以自然语言描述中间推理过程。链式结构过于线性,一定程度上限制了它在复杂任务上的能力,为此许多研究对思维链的结构进行了探索。

    4.2.1 链结构变体链式结构变体主要针对中间推理过程的形式进行修改。程序语言的执行和复杂数学推理的过程十分契合,一些工作提出使用程序语言代替自然语言,通过生成可执行程序作为推理链条,并执行该程序得到最终推理结果,例如 PAL、PoT。此外还有一些其他形式的中间推理过程,例如 Algorithm-of-Thought 将推理链条替换为算法的执行过程,激发大模型内部使用算法推理的能力,Chain-of-Symbolic 在规划任务中使用符号代替了复杂的环境。

    4.2.2 树结构变体链式结构的思维链限制了探索的广度,一些方法显式地构造了树并引入了树搜索算法。结合树结构和树搜索算法可以对不同的推理路径进行探索,并且引入了回溯、自我评估、剪枝的操作,在复杂任务及规划任务上取得优秀表现(Tree-of-Thought)。此外有方法在中间步骤中额外引入了不确定性评估,一定程度缓解了由不确定性带来的推理级联错误(Tree-of-Uncertain-Thought)。

    有些方法通过树结构加快推理速度,通过将问题分解成可以平行解决的子问题并行解码,但这种方法仅限于解决简单任务,无法处理复杂推理任务(Skeleton-of-Thought)。然而,当前的树结构变体方法在任务选择上有较大的局限性,并且需要针对任务设定具体的提示指令,这些困难阻碍了它的广泛应用。

    4.2.3 图结构变体图结构相较于树引入了更复杂的拓扑结构。Graph-of-Thought 在推理中通过环结构引入了自我修复,并根据图拓扑结构引入了信息聚合,在处理复杂任务时有着更较优秀有的表现,但是其面临着和树结构变体类似的问题,阻碍了它的广泛应用。ResPrompt 通过在提示文本中引入了“残差链接”来连接、聚合不同步骤的推理结果,隐式地引入了推理步骤之间地图结构,可以在数学推理等通用任务上使用,并且取得了优秀的效果。

    4.3 思维链增强方法针对思维链进行某一特性的针对性增强,例如添加推理步骤的验证和完善、引入外源知识、问题分解、多次采样并投票、提高效率等。

    4.3.1 基于验证和完善大模型在推理过程中往往会出现幻觉现象,例如事实性错误和逻辑性错误。通过引入针对推理过程的验证来获取反馈信号,并根据该反馈讯号对推理进行完善可以一定程度缓解这种现象。一个简单的思路是对推理步骤进行校验,例如通过演绎推理检验前后推理的一致性(Verify-CoT)、对每一个推理步骤进行细粒度的校验(DIVERSE)。

    事实性错误通常通过引入知识进行缓解,具体来说分为外源知识和内源知识。对于内源知识,模型在回答问题前,首先通过提示指令获取模型内部的知识,并基于这些知识进行推理(SCREWS、Chain-of-Verification、Crystal、Step-Back Prompting),外源知识的引入将会在后续章节中介绍。对于推理一致性,一些方法通过反向推理进行验证。具体而言,他们根据问题和模型的预测来推理问题中的条件,根据推测出的条件和真实条件的一致性来判断推理的正确性(RCoT、FOBAR、Self-Verification)。

    4.3.2 基于问题分解

    模型直接回答复杂问题是十分具有挑战性的,而回答简单问题则得心应手。因此将问题分解成子问题显式地一步步解决是一类有效的方法。

    Least-to-Most 使用了自顶向下的问题分解策略,首先将问题一次性分解成若干子问题,之后逐个解决从而得到最终的答案;Successive Prompting 采取了一种迭代分解策略,每轮迭代分解一个子问题并解答,并使用其促进后续的问题分解和回答;Decomposed Prompting 采取模块化设计,对不同类型的子问题设计专属模块负责解答,提高了子问题解答的准确性。此外,BINDER 采取神经符号的方式,通过程序执行得到最终答案;DATER 则关注表格推理的问题分解,需要同时考虑问题和表格的分解。

    4.3.3 基于外源知识模型内部存储的知识在预训练结束后便会定格,无法获取新的知识,导致知识的匮乏和过时。从维基百科、知识库、词典等途径引入外源知识,能够一定程度缓解这个问题。Chain-of-Knowledge 从知识库中获取结构化知识进行知识指导的推理,并且根据结构化知识对推理链条的真实性和可信性进行验证。KD-CoT 将多跳推理转化为多轮问答形式,在每轮问答中检索相关的事实知识辅助问答。

    4.3.4 基于排序或投票由于语言模型是基于概率采样的,在生成文本时会具有一定的随机性,通过多次采样并对采样结果进行集成,可以有效地缓解这个现象,并显著提高推理的性能。一些工作在推理链条或答案层级进行粗粒度的集成,例如 Self-Consistency、Complex CoT、Verifiers。这种集成粒度过粗没有考虑到推理步骤,为此另一些工作考虑到了中间推理步骤进行细粒度的集成,例如 Self-Check、GRACE。除了通过概率进行采样外,Diversity-of-Thought 通过不同的提示文本来采样多跳推理路径。总的来说,基于多次采样的策略已经成为当前思维链推理中常用的技术。

    4.3.5 效率提升尽管思维链推理已经展现出卓越的性能,其推理速度慢、使用开销大仍是不可忽视的问题。目前工作从减少推理链条标注成本、加快推理时解码速度和降低推理时的多次采样次数开销入手。

    05 思维链前沿应用

    5.1 工具使用

    虽然大模型具有非常强大的知识水平,其依然缺乏对于时效性内容以及领域外知识的更新能力,并且语言模型在数学计算、符号推理上也较为薄弱,在遇到这些问题时往往会产生幻觉现象。

    为此,许多方法探究如何使用外部工具对 LLM 进行增强,通过提示或微调等方式引入使用工具(调用 API)的能力。网页和知识库检索能够让模型获取最新的外部知识,数学计算器与程序执行可以用以处理更为复杂的计算问题,调用其他模型能够获得其他模态(图像、视频、语音)的理解以及生成能力,甚至是与外部环境进行感知与交互,实现具身智能。思维链推理在工具增强方法中起到了非常重要的作用。大多数情况下,模型对于工具调用的需求是隐含的。工具提高了大模型在单步“动作”下的处理能力,而思维链赋予了模型在推理过程中对于问题的分解,工具使用形式的思考以及工具调用结果的追踪处理能力。

    5.2 决策规划

    思维链提供了一种将问题分解为链式子问题的形式,从而处理较为复杂的问题。然而,对于更为复杂的任务,链式的分解形式并不充分。在前文中,我们介绍了将链式推理拓展到树结构、图结构等形式的工作。

    除此之外,LLM+P,LLM+DP 等工作将问题分解为规划领域定义语言(Planning Domain Definition Language, PDDL)的形式,通过外部模块对过程进行规划调度,最终再转换回自然语言形式用 LLM 进行处理。这些方式都提供了更为灵活的分解以及调度过程,增强模型的规划能力。

    在长期规划中,模型产生的错误会进行累积。并且在执行过程中可能会遇到计划外的错误,不断进行重试也无法得到正确的结果。因此需要提高模型在推理过程中对错误处理、总结,以及对计划更新的能力。Self-Refine 能够让模型对结果进行自我反馈以及优化,而 Reflexion 在此基础上加入长短期记忆,根据历史经验进行决策。AdaPlanner 等工作则能够根据环境反馈优化规划过程,提高灵活性。规划增强的方法可以与工具增强、多智能体等方法进行结合,进一步增强大模型在复杂问题上的处理能力。

    5.3 思维链蒸馏

    思维链被视为大模型的一种涌现能力,然而,这种能力在一些规模较小的模型上并不是很显著,限制了小模型在推理时的表现。

    当模型具备一定的思维链能力时,可以通过自监督与自我迭代的方法对推理能力进行强化,例如 LMSI,STaR 等。

    但大多数情况下,小模型的思维链能力较弱,难以输出可靠的推理过程进行自我蒸馏。此时需要依靠具有较强思维链能力的大模型输出推理链条,再蒸馏给小模型,从而让小模型也获得一定的推理能力。一般来说,蒸馏时需要对数据进行筛选,有答案标签的情况下可以通过标注筛选出结果正确的推理过程,而在没有标注时也能通过 self-consistency 等方式投票得出较为可靠的答案。

    除了推理结果的正确性外,推理过程的多样性对于蒸馏的效果也非常重要。SCoTD 发现针对每个样本采样多种推理路径能提高小模型的推理性能,SCOTT 通过对比解码和反事实推理等方式进一步提升思维链质量,缓解小模型学习到推理过程“捷径”的问题。

    思维链的形式也会影响小模型的学习效果。DialCoT 将思维链过程拆解为多轮对话的形式,简化小模型的学习难度。MWPCoT 和 PlanningToken 等工作则在数学推理过程中引入高层次的信息表示,提高模型在推理过程中的一致性以及在不同问题上的泛化性。不过需要注意的是,模型在多维度能力上存在着非常复杂的权衡。虽然通过蒸馏和微调的方式可以提高小模型在专一领域的推理能力,这个过程同时会损害模型在其他通用领域的性能(Specializing-Smaller-LM)。

    06 思维链未来研究方向

    6.1 多模态思维链推理目前的多模态思维链推理主要集中在图文领域,使用小模型进行微调,尚处于早期研究阶段。基于视觉-文本基座大模型和视频推理任务上存在着很大的探索空间。

    6.2 可信思维链推理 | 减少大模型幻觉基于大语言模型的思维链推理存在幻觉,如何减少幻觉,实现可信思维链推理是潜在的研究方向。

    6.3 思维链理论思维链有着惊人的性能,但其背后的原理和能力边界仍处于未知状态。从理论上探究思维链的能力来源、能力边界以及其相较于上下文学习的优点,可以更好地指导并促进思维链应用。

相关报告
  • 《中国国内医学相关的类GPT语言模型》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-12-01
    • 1、华佗GPT 华佗GPT 有免费体验网站,可直接访问对话,无需注册登录账户。目前处于测试阶段,还在不断完善优化中,由香港中文大学(深圳)和深圳市大数据研究院联合开发。 是一个基于大量中文医疗语料训练的大语言模型(LLM),目的是让语言模型具有医生的专业知识和患者的友好态度,为医疗咨询场景提供便捷有效的服务。目前处于测试阶段,生成结果正确性目前没有额外机制保证,结果仅供参考,请遵医嘱。界面中有上传图片和语音按钮,但这两个功能实际效果如何还待验证。 2、左医GPT 左医医疗大语言模型 不免费,但可申请短期体验。该对话页面需要用API key,底部有API key申请平台入口,在平台通过客服或联系电话或企业微信号等多种方式申请可获得key,申请就直接给,会给一个有试用期的API密钥,在左医GPT对话页面输入即可体验。目前主要对医院等医疗相关单位机构合作使用。我上次申请体验的是有2天试用期,不知现在能试用多久。 补充:百度搜索“左医GPT”,有介绍,平台申请直接获得key,因为医疗比较严肃,所以加一道,保证使用安全。——来自本文评论区 张超(左手医生创始人 CEO) 左医GPT不是基于GPT-3的,而是基于Transforme架构的自研模型。听译机器人的底层技术用的是左医GPT,和openAI没有任何关系。可通过语音识别和自然语言理解技术,实时记录医患对话,并自动生成电子病历。还可通过语言模型和知识图谱技术,为医生提供智能辅助功能,如用药指导、诊断建议、随访管理等。左医GPT是左手医生公司的核心产品之一,目前已经部署在全国近百家头部医院,提供智慧服务。 官网产品介绍地址(可申请API key) 左手医生开放平台-助力智慧医疗服务建设 3、岐黄问道GPT 大经中医岐黄问道大模型 (dajingtcm.com) 中医大模型,大经中医出品。目前对医疗机构开放申请内测。三个子模型:基于已确诊疾病的临床诊疗大模型,仅基于症状体征的临床诊疗大模型,中医养生调理大模型。 落地应用:在“学习强国”App中的中医智能健康助手就是基于此模型,只需要选择一些不舒服的表现,就能推荐中医调理方案。广东省中医院、上海中医药大学附属龙华医院等医疗机构单位;南京市江宁区、淄博市高青县等区域中医医联体,上海长宁区“为老服务中心”,下沉到山东吉林等地村卫生室这种基层医疗机构。 训练呢数据集:1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。 大经中医官网:大经中医 (dajingtcm.com) 4、本草(别名华驼,另有Med-ChatGLM) 中医大模型,免费开源,但目前无法直接使用,需下载在高性能计算机上进行复杂本地部署,也没有线上网站可体验。 哈尔滨工业大学开发的一款基于中医药知识图谱的人工智能系统,可提供中医药相关的问答、推理、分析等服务,赋能中医药行业的各个场景。 项目介绍地址(需翻墙才能访问) 本草(华驼) https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese Med-ChatGLM https://github.com/SCIR-HI/Med-ChatGLM 5、医联MedGPT 公司官网 成都医云科技有限公司 (medlinker.com) 个人无法直接使用,目前与各大医院及机构合作面向患者使用。是国内首个进行线下医院实际问诊等流程场景使用测评的大模型。已进入内部测试阶段,2023年5月正式发布。已拥有近3000种疾病的首诊能力,覆盖80%以上的成年人疾病和90%以上的0-12岁儿科疾病。突破AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。MedGPT模型相关介绍文章如下: 文章一:医疗版ChatGPT直播评测!治疗方案与真人医生96%一致 文章二:鏖战一天,与三甲主治医师医学一致性达到96% 医联 MedGPT 通过首次公开大考! 在微信公众号“医联Medlinker”中有个“医联MedGPT 媒体沟通会”的发布会视频,里面详细讲解了模型具体情况。 6、砭石 中医大模型,不免费,可简单体验。智慧眼开发的医疗领域大模型砭石,是一款支持多模态(文本、图像、视频和音频)输入的人工智能医生,可以提供智能问诊、辅助诊断、智能用药等服务,赋能医疗健康行业的各个场景。 体验方法:扫描智慧眼官网上的二维码,体验互联网医院的服务,包括智能导诊、在线问诊、处方流转、药物配送等。扫描后进入小程序进行微信登陆,添加就诊人并实名认证,后自动跳转到“急速问诊”页面,该问诊就是基于砭石模型问答。下次再次使用时在小程序首页上的“问诊购药”或“复诊续方”功能按钮进入问答界面。("砭"读bian一声) 产品介绍官网(页面下滑找到微信小程序二维码) 智慧眼-人工智能/医疗健康-AI计算驱动生命健康 7、京东JDH 京医千询 基于京东自己的言犀大模型打造,投喂了京东互联网医院积累了上亿级的医疗问诊数据。远程医疗两个场景:一是药师的问答;二是医患问答。目前与互联网医院及医疗机构合作面向患者使用,个人目前无法直接使用。没有找到官网相关链接及信息,欢迎评论补充。感兴趣的可通过京东云网站客服等渠道咨询就行。 京医千询_百度百科 (baidu.com) 8、腾讯健康医疗大模型,面向B端医院企业商业,不对个人开放,官网:腾讯健康 9、百度灵医智惠,面向B端医院企业商业,不对个人开放,官网:灵医智惠 10、华为云盘古医疗,网址:盘古大模型_panguLM_大模型_华为云,药物分子大模型,医疗大模型。 11、清华药物研发助手ChatDD,详情介绍网址:水木分子发布ChatDD 新一代对话式药物研发助手,引领药物研发第四范式 将于2023年10月中旬邀请测试基础版本。清华系初创团队水木分子宣布发布新一代对话式药物研发助手ChatDD(Drug Design),覆盖药物立项、临床前研究、临床试验的各阶段,作为制药专家的得力AI助手,提升药物研发效率。千亿参数多模态生物医药对话大模型ChatDD-FM 100B。“制药版 ChatGPT”。兼具多模态和对话双重特点,能给医药界学生“解个惑”。主要给国内医药行业“打辅助”,侧重中文对话能力,融入了更多专家的对话模式和经验。 12、清华BioMedGPT,项目开源地址:https://github.com/taokz/BiomedGPT 生物医药版ChatGPT。清华大学聂再清教授带领团队着手构建的多模态生物医药领域基础模型,旨在将生物世界分子、文本与知识进行统一表示学习以达到在各项下游任务上能力的整体提升。通过打造的干湿闭环和专家在环的双闭环体系,使得BioMedGPT能够从真实世界学习、向人类专家学习有望成为生物医药研发基础大模型,支撑诸如高通量虚拟筛选、分子生成与优化、个性化药物重定位、生物医药知识检索等多项应用。主要用于科研领域,更擅长英文生物医药科研任务,适合直接拿来作为生物医药领域的相关科研任务的基础模型。
  • 《定义同行评审的标准和新兴模型》

    • 来源专题:科技期刊发展智库
    • 编译者:谢鹏亚
    • 发布时间:2023-11-07
    •   严格和公正的同行评审对于维护学术研究的完整性和质量标准至关重要,也是出版过程中不可或缺的一部分。虽然同行评审的早期形式早在17世纪就在欧洲出现了,但它只是在20世纪中后期才变得更加明显,当时出现了“同行评审”一词。20世纪40年代第二次世界大战结束后,随着复印机的出现,同行评审成为一种普遍做法,这使得向同一学科的专家分发论文变得更加容易。该领域的先驱之一是20世纪40年代末的《美国医学会杂志》,并且在接下来的几十年中被其他期刊沿用,包括1964年的《自然》杂志和1976年的《柳叶刀》。   同行评审被称为评估研究的“黄金标准”,不同出版商的同行评审各不相同,以适应他们的政策和偏好,并迎合学术界不断变化的需求。很难理解和评估这些形式的同行评审之间的主要区别,有些常被错误地互换使用。Aries systems在2023年8月17日发布同行评审的标准和新兴模型,下面列出简要概述。 (1)单向盲审   作者没有关于审稿人的信息,审稿人知道作者信息。   优点: ●审稿人因匿名而客观评审 ●审稿人可以参考作者以往研究来判断此研究的深度及可靠性   缺点: ●审稿人可能会对作者存在有意识或无意识的偏见 ●审稿人可能因匿名而对评审不负责任 (2)双向盲审   作者和审稿人互相不能查看信息。   优点: ●减少审稿人和作者有意识或无意识偏见的可能性 ●减少审稿人因发表意见而被评判的风险   缺点: ●审稿人和作者能够根据研究风格和类型来识别彼此 ●审稿人可能因匿名而对评审不负责任 (3)三重盲审   作者和审稿人都不知道对方的信息,编辑也不知道他们的信息。   优点: ●减少审稿人、作者和编辑有意识或无意识偏见的可能性 ●减少审稿人因发表意见而被评判的风险   缺点: ●审稿人、作者和编辑能够根据研究风格和类型来识别彼此 ●审稿人可能因匿名而对评审不负责任 ●因控制各环节匿名可能导致管理成本增高 (4)开放式同行评审   作者和审稿人互相知道身份。   优点: ●提高透明度和问责制,审稿人因互知身份而深思熟虑 ●审稿人可能得到更多认可 ●公开评审可以为作者和别的审稿人提供参考借鉴 ●提高公众/学术界对评审的信任度,增加评审过程的透明度   缺点: ●有些审稿人拒绝暴露自己身份,抗拒公开审稿 ●审稿人和作者可能会存在有意识或无意识的偏见,特别是在地理领域等作者较少的主题领域 (5)透明的同行评审   与论文报告一起发表评审,审稿人可以选择是否公开自己的身份。   优点: ●提高透明度和问责制,审稿人会慎重对待评审过程 ●审稿人可能得到更多认可 ●该领域的专家能够利用评审中的意见   缺点: ●资历较浅的审稿人可能难以对资深作者提出评审意见 (6)协作同行评审:第一类   作者可以在论坛上收到来自审稿人的反馈,并可以实时解决问题。   优点: ●人多力量大 ●可以通过协作的方式更快更好的培训初级审稿人 ●协作的方式可以激发出更多观点 ●资历较浅的研究人员可能比资深研究人员更了解当前研究的最新情况   缺点: ●自动化的审稿系统可能只允许提交一份审稿意见 ●难以评判协作过程中所有审稿人的贡献 ●评审小组的构成不一致会导致评审结果的差异 (7)协作同行评审:第二类   作者可以在论坛上收到来自审稿人的反馈,并可以实时解决问题。   优点: ●缩短评审过程的时间 ●可能不需要编辑充当中间人 ●协作过程中审稿人可以及时解决分歧   缺点: ●审稿人协作情况下可能无法实现审稿人和作者之间的实时讨论,因此需要多个审稿系统 ●编辑无法软化尖锐的评审意见,作者可能无法得到建设性意见之外的细节问题 (8)众审   合格的审稿人尽可能少地(或尽可能多地)评论,不过评审的绝对数量让编辑对论文的优点和缺点有全面的了解。   优点: ●缩短评审过程的时间 ●减少审稿人的工作懈怠 ●增加审稿人的多样性,减少偏见 ●减轻编辑联系审稿人的负担   缺点: ●需要设计专门的评审系统 ●相比于传统形式的同行评审,编辑会收到来自审稿人的更多评审信息 ●仍然是一种较新的同行评审方法 ●存在群体思维的风险 ●难以评判同行评审的可信度