《华为开发人工智能语音助手 支持情感交互》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2018-04-24
  • 华为消费者事业部软件工程副总裁费利克斯·张(Felix Zhang)日前表示,华为希望改变人类与人工智能(AI)语音助手之间的对话方式,以实现情感上的交互。

    当前,智能语音助手主要提供一些实用信息,如“今天的天气怎么样”,或者是执行一些简单的任务,如播放音乐等。但华为希望未来的人工智能助手更进一步,成为用户的语音伴侣,满足人们的情感需要。

    费利克斯·张说:“我们希望提供情感上的交互。”早在2013年,华为就在中国市场推出了一款语音助手。费利克斯·张表示,在不久的将来华为将推出一款支持情感交互的AI软件。

    华为称,目前每天有1.1亿用户使用华为的语音助手。费利克斯·张说:“我们认为,将来我们的所有终端用户都希望与智能助手进行情感上的交互。这也是一个长期的发展方向。”

    除了华为,其他一些科技公司也在利用人工智能来强化其智能助手,以更好地服务用户,如亚马逊的Alexa,三星的Bixby,苹果公司的Siri,以及微软的Cortana。

    调研公司Gartner称,所谓的“情感AI”,就是指一款程序能够检测到用户情绪,然后相应地做出反馈。该技术有望提供更具个性化的用户体验。Gartner称:“添加情感感知功能将允许虚拟助手通过人类的面部表情、语音语调和行为模式来分析数据点。”

    华为消费者事业部AI产品管理总监詹姆斯·刘(James Lu)称,理想中的AI语音助手要尽量保持谈话的持续时间,这样用户就不会感到孤独。要实现这一点,第一步是让AI助手拥有较高的智商,接下来还要赋予它们较高的情商。

    华为还表示,他们的这一灵感源自电影《Her》(她)。在这部电影中,男主人公逐渐和名为“Samantha”的智能语音助手坠入爱河。通过智能手机或平板电脑,随时随地把“Samantha”带在身边。

    费利克斯·张说:“Samantha(指其软件功能)是所有工程师的梦想。就像电影中看到的,你甚至不再需要女朋友。这就是情感服务。”费利克斯·张还表示,将来用户将不再需要触摸智能手机屏幕来控制语音助手,直接使用语音命令即可执行大部分功能。

相关报告
  • 《脑启发设计:人工智能的进化之路》

    • 来源专题:人工智能
    • 编译者:高楠
    • 发布时间:2024-07-08
    • 作者:微软亚洲研究院 编者按:你可以用左手(不常用的那只手)的小指与食指拿起一件物品么?         试完你是不是发现自己竟然可以毫不费力地用自己不常用的手中,两根使用频率相对较低的手指,做一个不常做的动作。这就是人类大脑不可思议之处——无需经过特别的训练,大脑就能够在短时间内以低功耗的方式控制身体完成各种复杂行为,甚至是全新的动作。相比之下,人工智能虽然是人类智慧的产物,但在很多方面还远不及人类大脑。 为此,微软亚洲研究院(上海)团队的研究员们从理解大脑结构与活动中获得灵感,开发了一系列涵盖大脑学习、计算过程不同层级的创新技术,包括模仿脑神经回路连接方式,可高效处理众多任务的 CircuitNet 神经回路网络;可应用于时间序列预测,更适配神经拟态芯片的新型 SNN(脉冲神经网络)框架和策略;以及可为具身智能提供理论指导的贝叶斯行为框架。这些探索为未来的人工智能技术发展提供了新的可能。         从能耗的角度来看,人类大脑只需要大约20瓦的功率即可维持运转,这约等于一个节能灯泡的功耗。但随着人工智能大模型参数和规模的增大,其能源需求远高于传统的数据中心。主流的大语言模型训练过程预计会消耗上千兆瓦的电力,相当于数百个家庭一年的用电量。这种能源消耗的增长趋势显然不利于人工智能技术的可持续发展。那么如何通过新的处理机制解决能耗问题,就成了信息科学领域一个紧迫且前沿的挑战。《千脑智能》一书为我们提供了启示:“要创造出真正智能的机器,我们首先需要对大脑进行逆向工程。我们研究大脑,不仅是为了理解它的工作原理,更是为了探索智能的本质。”其实,人工智能本身就是人类对大脑探索的产物,在计算机诞生之初,人们就已经利用神经连接模式+数字计算的方式模拟大脑。但受限于当时的算力和人们对大脑粗浅的认知,人工智能发展非常缓慢,甚至一度被束之高阁。             近几十年来,随着神经科学家对大脑结构的深入理解和计算资源及相关技术的增强,以脑启发为核心的“人工智能文艺复兴”也掀起了新一轮热潮,促使科研人员重新定位大脑机制对人工智能的作用。来自微软亚洲研究院(上海)的研究员们跨越计算机和脑科学专业知识,深入理解大脑的结构与行为活动,针对大脑学习和计算过程,从神经元、网络层和更高级别的系统层出发,分别设计研发了高性能的脉冲神经网络(SNN)、参数效率更高的回路神经网络(CircuitNet),以及提升决策效率的贝叶斯行为框架,促进了人工智能网络向着更低功耗、更高效率、更好性能的方向良性发展,同时也为具身智能发展提供了理论和方法。 CircuitNet:模拟大脑神经元连接,实现更低功耗与更高性能         人工神经网络(ANN)已经被广泛应用于人工智能的众多领域,包括自然语言处理、机器学习、语音识别和控制系统等。这些应用的成功,很大程度上得益于它们对大脑神经元工作模式的模仿。神经元是大脑最基本的单元,它们之间通过复杂的连接模式相互作用来传递和处理信息。但早期的人工神经网络设计相对简单,仅能模拟一两种连接模式。 随着神经科学的发展,人们发现大脑神经元的连接方式多种多样,其中有四种常见模式:前馈激励和抑制、反馈抑制、侧抑制和相互抑制。然而,现有的许多人工神经网络,如具有残差连接的网络,只能模拟前馈激励和抑制模式。即便是能够模拟循环模式的递归神经网络(RNN),在信息传入前也无法处理上游神经元间的复杂相互作用,从而影响了神经网络在不同机器学习任务中的表现。         生物神经网络与人工神经网络的整体连接模式也大不相同。生物神经网络的一个显著特点是局部密集连接与全局稀疏连接的结合。尽管单个神经元可以有数千个突触,但它们大多数位于一个脑区内,形成针对特定任务的功能集群。只有少数突触作为不同脑区之间的桥梁,延伸到其它功能集群,而人工神经网络通常不具备这样的特性。此外,人工神经网络中的许多参数也被证实是冗余的,增加了网络的复杂性。基于对大脑神经连接的新理解,研究员们提出了新的回路神经网络 CircuitNet,它能够模拟包括反馈和侧向模式在内的多种神经元连接模式。CircuitNet 的设计还借鉴了大脑神经元局部密集和全局稀疏连接的特性,通过不同电路模式单元(Circuit Motif Unit, CMU)的输入端和输出端的稀疏连接,实现了信号在不同 CMU 之间的多轮传输。实验结果表明,CircuitNet 在函数逼近、强化学习、图像分类和时间序列预测等任务中的表现超越了当前流行的神经网络架构。而且,在各种类型的任务中,CircuitNet 在达到与其它神经网络相同性能的同时,具有相当或更少的参数,展示了其在机器学习任务中的有效性和强大的泛化能力。 CircuitNet: A Generic Neural Network to Realize Universal Circuit Motif Modeling https://openreview.net/pdf?id=Fl9q5z40e3 让SNN网络更适用于时间序列预测任务的新框架         脉冲神经网络(SNN)因其能效高、事件驱动范式和生物学上的合理性,正逐渐受到业内的重视。SNN 的设计灵感来源于生物神经网络中神经元间的信息传递方式——神经元不是在每次迭代传播中都被激活,只有膜电位达到特定阈值时才被激活,进行信号传递。这种事件驱动机制使得 SNN 只在接收到有效刺激时才进行信息处理,从而避免了无效计算,极大地提高了运算效率和能效比。然而,研究员们发现,现有的 SNN 设计大多聚焦于其离散的事件驱动特性,有的会忽略其时间属性,有的则为了适应事件驱动范式过程,过度简化序列数据模式。这些方法虽然让 SNN 在图像分类、文本分类和序列图像分类任务上实现了与人工神经网络接近的性能,但并未充分发挥 SNN 在处理时间信号方面的潜力。研究员们认为,时间序列预测是 SNN 一个理想的应用场景。作为现实数据分析的重要组成部分,时间序列预测广泛应用于交通、能源、医疗等领域,旨在基于按时间顺序排列的历史数据来预测未来。但是,将 SNN 应用于时间序列预测还面临两大挑战:         SNN 中脉冲值的离散特性与时间序列数据的浮点属性之间存在巨大的差异,需要一种有效的机制来减少在将浮点值转换为脉冲序列时的信息丢失和噪声。如何选择用于时序数据的 SNN 标准化模型目前还缺少一个指导方针,进而加剧了任务的复杂性,这就需要对 SNN 架构及其参数进行深入探索,以适应不同时间序列数据的特定特征。研究员们提出了一个用于时间序列预测任务的 SNN 框架。该框架充分利用了脉冲神经元在处理时间序列信息上的高效性,成功实现了时间序列数据与 SNN 之间的时间同步。研究员们还设计了两种编码层,可以将连续时间序列数据转换为有意义的脉冲序列。这之后,研究员们又利用多种脉冲化的时间序列模型对脉冲序列进行了建模,得到了最终的预测结果。         通过在多个时间序列预测基准集上的测试,研究员们证实了 SNN 方法在时间序列预测中的有效性。该方法不仅展现出与传统时间序列预测方法相媲美或更优的性能,而且显著降低了能耗。此外,在分析实验中,研究员们还展示了 SNN 如何捕获时间序列数据中的时间依赖性,并发现 SNN 确实能够模拟时间序列数据的内在动态。这项研究为 SNN 领域提供了一个既节能,又符合生物学原理的时间序列预测新方案。 Efficient and Effective Time-Series Forecasting with Spiking Neural Networks https://arxiv.org/pdf/2402.01533 大脑中枢模式发生器与位置编码双加持,让SNN序列预测更上一层楼          尽管 SNN 在多个领域取得了显著进展,但它们在适应不同类型任务时仍面临挑战。SNN 作为事件驱动的系统,缺乏有效机制来捕获索引信息、节奏模式和周期性数据,从而限制了它们处理自然语言和时间序列等数据模式的能力。而且,SNN 依赖于脉冲形式的通信,这使得并非所有适用于人工神经网络的深度学习技术都能直接迁移到 SNN 上。为了克服这些限制,研究员们进一步从生物神经学机制中汲取灵感,基于人类大脑中枢模式发生器(Central Pattern Generator, CPG)和位置编码(Positional Encoding,PE)技术,开发了针对 SNN 的新型位置编码技术 CPG-PE。         中枢模式发生器(CPG):在神经科学中,CPG 是一组能够在不需要节奏输入的情况下,产生有节奏的模式输出的神经元。这些神经回路位于脊髓和脑干中,负责产生控制运动、呼吸和咀嚼等重要活动的有节奏信号。位置编码(PE):PE 是人工神经网络中的一项关键技术,尤其在序列处理任务中尤为重要。通过为输入序列的每个元素赋予位置信息,PE 使神经网络能够识别序列中元素的顺序和相对位置。CPG 和 PE 都能产生周期性输出,CPG 是相对于时间的输出,而 PE 则是相对于位置的输出。研究员们将两者类比,使 CPG-PE 可以编码时间或空间的位置信息,预测神经信号的来源或位置。         在 Metr-la(洛杉矶高速公路平均交通速度数据)、Pems-bay(湾区平均交通速度数据)、Electricity(以千瓦时 kWh 测量的每小时电力消耗数据)和 Solar(太阳能发电数据)四个真实世界数据集上进行的时间序列预测实验表明,采用 CPG-PE 策略的 SNN 在时间序列分析方面显著优于没有 PE 特性的神经网络。同时,CPG-PE 可以无缝集成到任何能够处理序列的 SNN 中,理论上可以实现与 SNN 硬件的兼容,适配各类神经拟态芯片。 Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators https://arxiv.org/pdf/2405.14362 贝叶斯行为框架:为具身智能提供理论指导         在心理学和认知神经科学领域,以人类为代表的智能生物群体被认为会执行两类行为:习惯性行为和目标导向行为。习惯性行为是指为了最大化利益而自动执行的动作,无需意识思考或意图的参与,例如寻找食物和避免危险。目标导向行为是指为了实现特定目标而执行的动作,例如有计划地前往某个地点。传统上认为,在认知科学和机器学习中,习惯性行为和目标导向行为由两套独立的系统控制,因此在建模时,研究人员通常会为这两种行为设计独立的模型。         然而,微软亚洲研究院的研究员们认为,这两种系统应该更紧密地结合,实现协同学习和工作。尽管在大脑中这两种系统之间的相互作用尚未完全明了,但习惯性行为和目标导向行为共享着诸如脑干这样的下游神经回路。两种行为共享低级运动技能,且每个系统都可能利用对方学习到的高级动作。例如,习惯性行为虽然缺乏灵活性,但通过练习可以提供熟练的运动技能,这些技能可以被目标导向行为用于更复杂的任务规划。那么如何在保持两种行为差异的同时实现协同?为此,研究员们提出了一个基于变分贝叶斯方法的理论框架——贝叶斯行为(Bayesian Behavior)框架,用于理解感知运动学习中的行为。其核心创新在于引入了一个贝叶斯“意图”(intention)变量,从而有效地连接了习惯性行为与目标导向行为。习惯性行为由感官输入计算的意图先验分布驱动,无需具体目标。目标导向行为则由一个通过最小化变分自由能推断(active inference)的目标条件意图后验分布引导。         在视觉引导的感知运动任务中进行模拟实验的测试结果显示,贝叶斯行为框架所得出的结论与神经科学和心理学实验的观察数据相吻合。这一发现不仅为认知科学中“行为”的理解提供了新的视角,也为具身智能的构建提供了理论基础。例如,人类能够轻松地用左手食指和小指拿起东西,或者原地转圈,未来的具身智能也可能完成这种未曾学习过的动作,展现出更高的适应性和灵活性。 Synergizing Habits and Goals with Variational Bayes https://www.nature.com/articles/s41467-024-48577-7 该论文已在《自然-通讯》(Nature Communications)杂志上发表。 跨领域研究让人工智能向节能高效进化         从达尔文进化论的角度来看,现在的主流人工智能模型在未来可能会面临淘汰。在生物进化的过程中,物种的基因变异是繁殖下一代时的常态。那些有利于生物适应环境的变异,将通过环境的筛选,以“适者生存”的原则被保留下来。然而,将这一概念应用于人工智能时,我们会发现能耗问题并不利于人工智能的发展和“进化”。         借鉴人脑的工作原理,构建脑启发的人工智能,不失为促进人工智能技术向节能高效方向发展的有效途径。这一趋势已经引发了新的研究热潮,包括对大脑理解的研究、基于神经元构建新的语言模型、根据不同脑区功能设计的 MoE 架构等脑启发人工智能正蓬勃发展。在微软亚洲研究院进行脑启发式人工智能研究的过程中,研究员们更加体会到跨学科、跨领域专家协作支持的重要性。CircuitNet、SNN 时间序列框架、贝叶斯行为框架等创新成果的背后,凝聚了来自复旦大学、上海交通大学及日本冲绳科学技术大学院大学等机构的神经科学和脑科学专家的专业知识和贡献。未来,随着对大脑机理的深入理解和技术的不断创新,我们有望增进对智能本质的理解,构建出更加智能、高效且环保的人工智能技术,更好地服务于人类社会。
  • 《科技巨擘们的人工智能研发都做到什么程度了?》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:姜山
    • 发布时间:2017-11-30
    • AI还没有真正颠覆我们的生活,但AI让人类对文明的争论走到十字路口。 抽象看:一方面基于硅元素的“硅基”文明,正在通过计算力升级互联网,塑造人类超级智能最高权力决策系统,并试图创造智能化独立个体;另一方面被广泛忽略的是——基于碳元素的“碳基”文明,在生物和基因领域势如破竹的突破,试图帮助人类增强能力和修补缺陷,缔造更加完美的自己。“硅基”文明向“碳基”文明学习机制,“碳基”文明努力从“硅基”文明寻找动力。这个十字路口的核心追问是:人类究竟应该相信自己还是相信自身的科技能力? 宏观看,科技精英牵引着人类社会的生产力和价值观,重构文明。国家层面,中国政府2017年将人工智能写进《政府工作报告》,美国白宫2016年就发布了一份名为《时刻准备着:为了人工智能的未来》(Preparing for the Future of Artificial Intelligence)的研究报告,两国都清晰地认为,AI是下一个时代的科技制高点。美国谷歌、亚马逊、苹果、脸书(Facebook)等公司无一例外地用人工智能升级业务和重塑公司,中国以华为为首的技术巨头不仅通过“端管云芯”(终端设备、通讯管道、云端计算和芯片智能)全方位地占领世界性制高点,也包括BAT、联想、TCL等全球化产业集团对AI毫无例外地大手笔投资,对于他们来讲,AI时代是重塑竞争力的重要窗口期,他们渴望一张通向产业未来的门票,新的门票也是对过去的救赎。 和互联网时代不同,大家笃定地认为:这张门票更少的公司可以拥有。 微观角度,公众既有对新时代的期盼,也有对“硅基”文明新科技的恐惧。纷繁复杂的信息中,媒体选择了技术精英的学术科普作为突破口,一时间“自学习”、“算法”、“神经网络”、“计算机视觉“等技术概念涌入了普通人的认知,加上马斯克等国内外科技明星宗教末日般的演绎,和诸多创业公司“人间天国”般的描绘,对比蒸汽机、计算机、互联网带给人类的冲击,AI效应注定冲击更大,层面更广,立意更深。 本文周掌柜战略思想咨询团队将从产业的角度解构AI,我们尽量回避宏观叙事对技术的夸大和情绪化的牵引,通过对华为、BAT、谷歌、微软等公司的顶级科学家的访谈和研究,力求从技术哲学和战略思想层面勾画AI时代的全球产业格局、竞争本质和人文影响。 AI端智能崛起 应该说,中国人工智能领域最有代表性的两位技术决策者是余承东和李彦宏,我们先从他们的战略选择谈起。 余承东作为华为消费者业务CEO,是华为手机业务核心技术商业化的投资者和决策者,同时他被公众广泛忽略的一个角色是“技术创新架构师”,曾经作为华为无线业务的负责人,他主导的分布式基站、SingRAN的颠覆式创新,带领无线业务形成了全球性的竞争力。在AI方面,“聚焦领先别人几条街”的技术是他和华为高层一直追求和提倡的,而围绕“端管云芯”的AI开放生态平台被赋予极高的战略地位,并由此提出Mobile AI战略(移动AI战略)。 李彦宏在公众中拥有广泛的影响力在于技术专家的财富神话和AI时代坚定的领导力,但近些年,公众对百度的道德批判掩盖了其对技术趋势判断的专家能力,面对AI时代他“激流勇退”引入陆奇,本身也是回归技术投资者和决策者的一种努力。正如他所言:“在90年代美国读硕士期间最感兴趣的就是人工智能课程”,拥有互联网基因的李更多强调AI的跨界应用、平台化商业模式的打造。他认为:互联网是前菜,AI是主菜。百度要完成“连接信息”到“唤醒万物”的转变成为“AI企业”。 商界大佬都蓄势待发。但坦率地讲,对于AI这样大跨度多维度的系统性创新,完全不懂技术的管理者很难独立做出系统性判断。余承东和李彦宏的独特技术背景,客观上确实让华为和百度分别占据中国AI领域硬件和软件两个制高点。 从余承东的视角所见华为的AI战略焦点是Mobile AI包括On device(设备端)和Could AI(云端)两个基点,他的看法是:AI赋予了智能手机更加自然交互历史性的奇迹,通过重塑所有智能设备的交互模式,人类的视觉、听觉、知觉和传感器的硬件交互,不仅可以提高用户信息服务的获取效率,也让设备从辅助性决策角度升级为超越“手机通讯”本身的超级智慧终端(个人助理、数字分身),这是拥有硬件基因的华为下一个全球性的战略制高点。 从李彦宏的视角看AI则是对BAT互联网格局的重塑,不仅百度搜索的天然“自学习”智能属性,也包括百度“AI平台”在“百度大脑”和“百度云”的双战略上获得了重塑开发者生态的历史性机遇。李彦宏多次在访谈中谈到“跨界整合”,这体现了以百度为代表的BAT超级巨头看重的是“后互联网”时代的战略性空间。 总结起来:以华为为代表的AI战略坚持以客户体验为中心,坚持客户主体性和用户主体性,“客户主体性”就是帮助运营商等合作伙伴赋能AI,而“用户主体性”就是帮助手机消费者拥有智慧型体验。而以百度为代表的AI战略更多倾向于云端超级智能对客户和用户的场景化渗透和掌控。更精确的表达是:BAT的AI战略简单说是“AI的基础设施”,全场景渗透;华为的战略是“基础设施的AI”,使能业务。以上对比说明AI的创新应用在科技巨头层面已经出现战略选择的明显差异,或者叫“分歧”。 理性的一面,马化腾表示:最值得腾讯大手笔投资的就是AI、云计算以及大数据。未来所有企业基本的形态就是,在云端用人工智能处理大数据。感性的一面,马云说:人类有智慧,机器有智能,动物有本能。人有信仰,人有爱,人有关怀,人有价值观,人有使命感,而机器不可能拥有这些。 但客观讲,AI业务对于这些中国科技巨头来看,并没有外界想象的华丽和从容。腾讯的一位高管私下承认:“AI首先是挑战腾讯传统业务,现在远远没到挑战别人的阶段。通过服务‘+AI’的方式推动自我革命是当务之急,其次才是AI能力生态化分享”。这个评价非常中肯,腾讯和阿里共同的弱点就是科技金融投资的强势弱化了自身科技产业创新能力。 华为负责AI的技术专家Felix的看法从科技巨头的角度也很有代表性:“从2B的视角看,AI商业化的门槛非常高,壁垒主要来自于垂直行业本身而非技术,大公司对于数据、算法、商业模式的立体壁垒并不是创业团队可以简单超越的;2C的层面,大公司会将AI能力越做越简单,并不断开放出来,其中将释放出大量生态化应用的场景支持中小公司创业,但是目前很多另起炉灶的中小型创新未来都可能淹没在科技巨头的新生态里。” 放大以上中国科技公司的共性和分歧,加入美国科技公司做全球性对比,我们有更多发现。如图1:AI全球竞争生态,基于上述的目的,不同公司有着不同的战略布局路径,我们主要分析比较有代表性的谷歌、华为、亚马逊、微软和百度这五家公司: 谷歌:谷歌的AI战略围绕机器学习框架TensorFlow的开源展开,延续了Android时代的开放战略,谷歌的战略思想依然是用“草根开发者”和“草根应用”提供的数据喂养谷歌智能,构建新时代的超级平台。谷歌2B的战略还是以云服务为主,这方面回避了与亚马逊、微软的正面竞争。但亚马逊和微软对AI的C端价值拥有共同认知,在亚马逊的MXNet平台和微软的Cognitive Toolkit平台都无法正面与谷歌竞争的前提下,双方选择了合作开发Gluon平台,并兼容各自系统。这种抱团取暖本身就说明了美国公司对各自能力边界的理性判断。2017年10月份,谷歌开始在中国大力推广AI学习系统TensorFlow,首先纳入的目标用户就是阿里巴巴和腾讯,可见其“AI生态创建者”的决心,谷歌也最有可能成为AI时代的全球领导者。不过谷歌的弱点是中国市场对其的“数据化隔离”可能让其失去全球最有价值的科技市场。 华为:华为在AI战略上的投资,其实最早追溯到2011年底2012实验室的基础研究,最初是围绕数据洪峰对ICT行业冲击所需做的技术储备,诺亚方舟实验室2012年6月的正式成立,应该算华为正式投入AI基础研究的最鲜明信号。而且延续华为持续保持开放合作,产品解决方案上,对于ASR语音识别选择和科大讯飞合作,对于智能翻译在Mate10上选择与微软Translator进行合作。而余承东为代表的华为技术领导者锁定的自身核心竞争优势主要集中在麒麟970人工智能芯片的底层创新以及基于“端智能”的Mobile AI平台化开放解决方案。由此,华为延续了在运营商业务“有所为有所不为”的战略思想,如图,在拥有中央智能、管道智能、AI设备、AI芯片的同时,依然“上不碰应用,下不碰数据”,选择与AI领导者公司合作,为AI中小创业者提供平台,开创了一种升级版的竞合关系。而2B领域,针对下一阶段人工智能的部署,任正非2017年对GTS(全球技术支撑部门)讲话说的非常清楚,核心观点是:第一,改变公司内部作业模式,改善管理;第二,投资完善AI平台;第三,降低成本,解决客户痛点。但华为的挑战主要是如何更加高效的让端智能牵引整体AI能力提升,这需要大象学会跳舞。 亚马逊:客观讲,亚马逊的MXNet平台其实在主战场已经边缘化了,Eco智能音响即使作为成功的AI产品已经有了1万多个Skills(技能),但真正成功获得AI化能力的目前或许只有听音乐、查天气和设置日历这些简单应用。国内跟风亚马逊音箱的创业公司大有人在,大家都期望智能音箱成为家庭场景的AI入口,但产品承载力可能面临挑战,Echo在技术上和Siri及Google assistant并没有跨代创新优势,对于语音入口成熟的时间窗口和技术要求目前看过于乐观了,甚至智能音箱的入口属性远远低于科大讯飞的语音能力。 微软:目前微软的云服务在企业级市场势头非常好,微软也正式凭借云战略的成功,从软件优势的削减中获取了新的增长点。所以微软非常希望AI能成为云战略的使能器,扩大和锁定企业级业务的竞争优势。这方面反而微软企业级业务对标的IBM“认知计算”目前拥有明显的战略瓶颈,应该说IBM的Watson目前只有DeepQA(深度问答)的能力,既不具备深刻平台智能也不具备应用突破的可能性。这导致IBM在AI时代技术积累瓶颈非常明显,微软的AI和云战略很有可能彻底洗掉IBM的企业级市场,这也是微软与亚马逊在C端AI平台合作的原因,其主要战略方向还是2B的核心优势的延续。 百度:百度战略决心、技术储备、应用平台、可扩展性应用都是中国AI企业中最有进攻性的。在中国的平台型AI研发中,百度是毋庸置疑走在前沿。但是百度的弱点也很明显,第一是GMS(account system and service账号系统及服务)能力很弱,这也是百度搜索业务根本性顽疾,一直没有有效解决过,这直接导致了百度AI的生态粘性和应用效率不够。目前李彦宏和陆奇希望走微软的路,但其PaddlePaddle学习平台对于开发者的应用指向性目前并不明显,其有对标谷歌的能力和意愿,能有效依附于目前哪些既有核心竞争力形成突破还是值得观望的。如果百度不能成功的将AI能力平台化,那可能最好的战略选择就是和华为这样的硬件巨头深度合作,像微软和亚马逊一样形成差异化的竞争优势。BAT中的腾讯和阿里其实从能力上讲,在AI开放平台上肯定逊于百度,但腾讯的9亿活跃用户和GMS服务是最可能的AI突破口,主战场应该还是在微信层面,阿里在10月份规划3年投入1000亿的达摩院更是巨资从谷歌、微软挖来AI专家主持阿里AI实验室,最有可能在支付宝和云服务的生态获得重大突破。而且,腾讯阿里在用户云端的数据和计算能力都是领先于缺少GMS系统的百度的。BAT之间在共同互联网生态之间零和博弈也将更加白热化。 其他公司来看,目前美国媒体也多次报道苹果正在研发一款专门处理人工智能相关任务的芯片,他们内部将其称为“苹果神经引擎”(Apple Neural Engine)。这块芯片将能够改进苹果设备在处理需要人工智能的任务时的表现,而其针对的功能目标则是AR(增强现实)和自动驾驶。但不可否认的是:由于AI生态本身就是革苹果生态的命,苹果很难成为AI时代的首要颠覆者。 在目前AI商业模式并没有成熟的情况下,AI生态竞争领域有三个本质的追问:第一是用户主体还是平台主体?背后是“端智能”和“云智能”的竞争;第二是谁是超级智能平台?背后的本质是AI生态竞争;第三是什么是超级智能入口?背后的本质是数据智能和算法智能的竞争。 值得一提的是:在全球AI产业生态中,整体看,端侧2C的智能目前是最稀缺的能力,华为、苹果在这方面无论是布局还是技术突破口都拥有得天独厚的优势。华为的麒麟970芯片作为全球第一款集成NPU神经网络单元的移动芯片问世,代表“端智能”传递出强烈信号——同时发布的HiAI人工智能架构给开发者预留的接口,已经构建了下一代应用系统的出行。加之华为在云端智能、管道智能的能力,已经拥有几亿设备用户的华为手机,未来在全球人工智能领域将获得独特的竞争优势。“端侧智能崛起”可能是全球AI生态竞争最大变量,AI竞争的核心产业价值对于巨头来讲就是生态主导权,对于应用类公司讲就是应用竞争力的延续。 归根结底,全球AI生态竞争的结果很有可能依然延续了移动互联网时代的Android和IOS阵营的对决,只不过加入了AI芯片作为端智能平台的变量,这方面华为的进展值得期待。 AI初级阶段 基于上文对“AI生态“的分析,周掌柜团队认为AI的商业机会主要有三个维度:核心是拥有AI生态平台,主战场是应用创新,最大商业机会应该出现在现有应用的“AI体验升级”。 但我们也坚定的认为:“AI生态”才有可能成为真正的“人工智能”。AI生态最接近于“人工智能”的“神经元系统“,未来最有可能的智能形式是基于“AI生态”下多个智能应用基础上,从“大数据”到“小数据”的搭接。但这种智能形态还是硅基文明复制碳基文明的形态,不可能超越人类。任何一个独立AI应用都不可能真正获得真正意义的“智能”,只可能是高级的“数据智能应用”。如图2,在“AI技术进化阶梯”中,我们部分借鉴了加州大学洛杉分校朱松纯教授的观点,对AI的进化逻辑做了梳理,以便更好的理解AI竞争层次的背景。 AI兴起(1956-1974):AI的理论准备阶段,以命题逻辑、谓词逻辑等知识表达、启发式搜索算法为代表。以数理逻辑的表达和推理为主。 AI初始应用(1980-1990):AI的初始应用阶段,基于决策能力的专家系统、知识工程、医疗诊断等应用,80年代末有短暂的神经元研究热潮。以概率统计的建模、学习和计算为主。 AI生态竞争(2010-2060):新的AI竞争背景是互联网公司智能升级,以及AI平台生态的竞争。AI芯片的研发具备历史性意义,这让AI生态最有可能成为真正的“人工智能”。 AI人格化(2060-未来):为了融合科学界和公众的认知矛盾,我们将AI(Artificial Intelligence)翻译为“人工智力”,提出AC(Artificial Competency)即“机器人格”的新概念,AC时代是AI人格化阶段。人类科技只有解决了知识的多场景推理,理论上突破知识表示问题,AC才能获得真正突破机器的人格边界。而端智能带来的AI和人类平行进化,大脑的智力效率在2060年即未来50年之前应该在相同因素效能对比中继续领先,AI人格化需要新的计算平台和新理论突破。 通过图2的AI历史性分析,我们可以看到AI其实在未来40年时间内应该无法形成人格化的里程碑意义突破(除非AI理论发生颠覆式创新或量子计算、神经元研究等获得实质性突破)才有人格化的可能性。而公众对于“人工智力”、“人工智能”和“机器人格”逻辑层次的混淆是其对AI替代人类忧虑的根本原因。 横向对比人类历史上的重要科学进化步伐来看AI产业准备度,也有利于我们认清AI产业处于研究早期的基本事实。也有利于我们打消顾虑: AI基础理论VS物理学理论:从认识世界的角度,看牛顿、爱因斯坦以来300多年的物理突破,人类基本上勾画了宇宙的原理模型。AI基础理论仅有60年的发展,远远没有完善的系统。 AI基础理论VS生物学理论:从生物学的角度,只有10-25瓦的人类大脑计算力可以比拟大型的数据中心,据统计,目前人脑只开发了大概8%的能力。人类简单的DNA结构,根据科学分析,每一个人拥有400万亿个细胞(皮肤、肌肉、神经等)仅仅用46种染色体可以表达。人类的核心“算法模型”的表达力是惊人的,AI差距很大。 综上所述,对于“AI能否取代人类”这个公众感兴趣的话题,周掌柜团队看法相对保守:目前AI是基于“大数据”的暴力计算逻辑,如果获得智能上的突破,最有可能的突破点在于形成机器的“知识推理”能力,本质是解决知识表达范式的问题。 实际上AC作为人工智能的真正未来确实还没有能力对人类智能形成挑战。正如麒麟人工智能芯片科学家Abner所言:AI的智力、速度、耐力、爆发力人类其他感官能力相比,没有那么时尚和戏剧性,也确实没什么可怕的。 全球格局看,中美无疑将是未来全球AI决战的两个核心国家,目前美国AI基础研究强于中国,中国基于数据开放的应用优势明显好于美国,加上华为终端为代表的中国高端制造在手机领域的全球竞争力,BAT的全球化进程加快,中美的AI企业之间会拥有更加紧密的合作,而这种合作大概率是通过“巨头搭台,创业公司唱戏”的方式展开的。 AI进入了真正的战国时代,与历史上秦国灭亡六国靠法治精神类似,AI巨头能真正统治世界的还应该是新科技文化对“应用领先者”和“草根开发者”的感召,AI的大历史注定由“小人物”创造。虽然最后集大成,形成真正人工智能的公司或许只有谷歌、华为和苹果这样的全球化公司,但AI时代对智能数据的高要求一定会让超级应用获得更大的话语权。 回到公众层面,恐惧表面上源自于人类个体的思想自卑感,但深刻的原因在于我们在AI研究“还处于起点”认识的偏差,以及我们对无限未知的忧虑。 相信技术精英——无论何时,他们也不会放弃这个星球上最美的人格,及无限接近的真理! God bless AI!(天佑AI!) (作者介绍:知名商业战略思想研究专家,聚焦原创商业理论研究,帮助华为等多家全球领先公司解决实战问题。本专栏聚焦全球领先公司有效增长路径研究,呈现专业战略洞察。读者微信号:zhouzhanggui000。本文仅代表作者观点。)