《阿里的人工智能之路,他和谷歌亚马逊有多大差距》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2018-03-15
  • 上海地铁站的自动售票机有着自己的独特之处。走到一台机器前,说出你要去的地方,它会自动为你推荐路线,然后发出一张相应的地铁票。这台售票机还会通过人脸识别查验你的身份。此外,为了减少地铁高峰期的操作时间,系统设置成无需操作按钮,而是通过语音即可完成车票购买。

    更令人印象深刻的是,所有这一切都发生在一个拥挤嘈杂的车站里。每台售票机必须辨别出谁在说话,在人群中提取出购票者的声音,进行转录并解析它的意思,同时还要在几秒钟内通过面部识别系统将用户面部与海量数据库进行比对。

    为了做到这一点,售票机使用了几种尖端机器学习算法。然而,真正有趣的事情不是算法本身,而是它们背后的地方。所有这些图像处理和语音识别功能都是中国电子商务巨头阿里巴巴拥有的云计算系统提供的。

    阿里巴巴已经在使用人工智能和机器学习来优化其供应链,为消费者进行个性化推荐,并构建类似于亚马逊Echo的智能音箱设备天猫精灵(Tmall Genie)等产品。中国的另外两家科技巨头腾讯和百度也在人工智能领域投入巨额资金。中国政府计划在2030年之前打造一个价值约1500亿美元的人工智能产业,并激励国内研究人员能够主导这一领域。

    但阿里巴巴的目标是成为基于云的人工智能行业领导者。像云存储(诸如Dropbox)或云计算(Amazon Web Services)一样,基于云的人工智能将以低廉的价格为任何拥有计算机和互联网连接的人提供强大的资源,使新型业务得以发展。

    这样一来,中国和美国之间人工智能的真正竞争将成为两国大型云公司之间的竞争,它们将力争成为那些要利用人工智能的公司或城市的服务提供商。而且除了阿里巴巴之外,中国的科技巨头已经准备好与谷歌,亚马逊,IBM和微软在人工智能服务市场进行竞争。无疑,在这个行业中占主导地位的公司将在人工智能开发和使用方式有强大的话语权。

    构想更大

    1999年,马云在杭州的公寓里创建了阿里巴巴,当时这只是一个简单的电子商务平台。今天阿里巴巴公司总部由数幢大型建筑组成,数万名员工在内办公。总部正门是阿里巴巴的橙色卡通吉祥物。

    目前阿里巴巴的核心业务仍然是销售商品,并为企业与企业之间的贸易提供平台。但是这已经催生了其他利润丰厚的业务,其中包括物流、发货平台、广告营销网络、云计算以及金融服务。公司无处不在的移动支付应用程序支付宝由姊妹公司蚂蚁金服运营。除支付宝外,蚂蚁金服还有贷款,保险和智能手机投资业务。

    去年11月11日在,阿里巴巴的“光棍节”当天该公司商品销量超过250亿美元。相比之下,在去年全美最大的在线购物日网络星期一(11月27日),所有零售商的总销量也只有65.9亿美元。

    该公司的成功也让杭州成为了一个充满活力的科技城市。现在的杭州市拥有数十个孵化器,部分由政府补贴资助,其中很多企业都是在阿里巴巴工作过的员工这些孵化器中充满了曾在阿里巴巴工作过的企业家。

    而阿里巴巴的创始人显然不认为这是理所当然的。“马云认为,我们之所以的成功是因为良好的商业模式、勤勉的团队加上运营,”公司技术开发总监刘翔文(音译)说。“但在公司激烈竞争的下一个时代,马云认为单纯依赖商业模式不能为像阿里巴巴这样的巨人带来成功。他的信念是技术。”

    去年10月,马云宣布,公司将在未来三年内为旗下名为达摩院的研究机构开支150亿美元。该研究所名字中的达摩是佛教传说中的印度高僧,在公元五世纪将佛教带到了中国。

    中国科技公司早已经摆脱了模仿西方创新的论断。根据经济合作与发展组织(OECD)的数据,2000年至2016年期间中国科技研发支出增长了10倍,从408亿美元增加到现在的4120亿美元。2016年美国研发支出达到了4640多亿美元,但自2000年以来,美国研发支出仅增长了三分之一。

    阿里巴巴已经是中国最大的研发中心,2017年的研发支出为26亿美元。未来达摩院会将其研究预算增加三倍,达到70亿美元以上。这很可能意味着阿里巴巴将超越IBM,Facebook和福特,并缩小与全球领先企业亚马逊和Alphabet在研发投入上的差距。2017年,亚马逊和Alphabet研发方面分别支出161亿美元和139亿美元。

    达摩院旗下涵盖了一批从事区块链,计算机安全,金融科技和量子计算等基础和新兴技术的研究团队。但人工智能是其中的重中之重,而且似乎是最有潜力的。

    达摩院显然是从20世纪那些伟大的商业研究实验室获得了启发。刘提到了AT&T的贝尔实验室,其进行材料,电子和软件方面的基础性研究,从而发明了包括晶体管,激光,数字成像电荷耦合器件等硬件以及UNIX操作系统和编程语言C、C ++等软件应用。刘说,阿里巴巴也受到美国国防部高级研究计划局(DARPA)资助不同团队参与同一项目这种方式的启发。

    阿里巴巴显然也是在向Alphabet和亚马逊这样的公司学习。像这些公司一样,它已经发布了一个云计算机学习平台。这也是第一个由中国公司发布的云计算学习平台,于2015年上线,去年进行了大规模升级。其提供的工具类似于Google Cloud和Amazon Web Services,囊括了诸如语音识别和图像分类之类的解决方案。

    开发这些工具是阿里巴巴的一项重大技术任务,这标志着公司对于人工智能的雄心壮志以及云计算将在其中发挥多大作用。

    另一个信号是,阿里云开始支持其他几家公司的深度学习框架,其中还包括谷歌的TensorFlow和亚马逊的MXNet。深度学习是一种通过将大量数据输入到多层神经网络中,从而训练机器识别事物的技术。其也是人工智能领域中最重要的方法,可用于自动驾驶车辆、语音转录等多个方面。科技公司之所以要花大力气构建自己的深度学习框架,部分是为了吸引用户进入他们的云平台,因为这些框架通常在其基础架构上运行得最好。通过支持其竞争对手的框架,阿里巴巴为开发者提供了使用其平台的更多理由。

    这还不是全部:刘暗示阿里巴巴正在研究自己的深度学习框架,这可能会让更多的工程师着迷于云计算。当被问及阿里巴巴是否会发布其开发的一些代码时,她回答道:“当它成熟的时候会的。”

    聪明答案

    最近阿里巴巴在人工智能方面取得了不少进展。上个月,该公司的一个研究小组发布了一个人工智能程序,该程序能够阅读一段文字,并且回答关于这段文字的简单问题,要比以往任何版本都更准确。

    需要注意的是,这段文字是英文而非中文。因为该程序是在斯坦福问题答疑数据集(SQUAD)上进行的,后者是一个用于测试计算机化问答系统的标准数据集。阿里巴巴的项目应用了几种新颖的机器学习技术,其得分要比微软,三星等公司更高。值得注意的是,它要高于比一般人的得分(虽然这有点欺骗性,但并不意味着该计划真正理解了它正在阅读的内容)。

    不过更值得注意的是,阿里巴巴在人工智能领域前进的速度令人咂舌。该公司在2017年9月才提交了第一次参加SQuAD竞赛的申请。“前十名团队中有不少是中国顶级科研机构,反映了人工智能领域的竞争白热化,”负责SQuAD竞赛的斯坦福大学博士生Pranav Samir Rajpurkar表示。

    该团队的一名成员表示,阿里巴巴已经利用该项目来改进其在线市场上的自动客户服务。阿里巴巴希望在其平台和更多应用上部署最新的语言理解技术。

    阿里巴巴的人工智能研究人员还正在研究其他尖端项目,例如生成对抗网络,也就是GAN。由谷歌研究人员开发的这种令人兴奋的新型机器学习方法中,两个神经网络彼此对抗;其中一个试图声称看起来好像来自真实环境的数据,而另一个试图区分出真假。这项技术可以让计算机从未标记的数据中更高效地学习,也可以用来创建逼真的合成图像和视频。

    收集云数据

    相比于西方世界同行,中国科技公司的一个显著优势是政府支持。使用上海地铁站人工智能技术的智能城市很可能会成为中国的未来。阿里巴巴的云人工智能工具之一是名为城市大脑City Brain的套件,专门用于管理交通数据和分析城市监控视频。

    在西方世界也有这样的实验,比如Alphabet旗下的Sidewalk项目,该项目计划用自动驾驶汽车,投递机器人以及基于人工智能的管理系统改造多伦多郊区。但是中国在人工智能开发方面的规模更大,这将使国内科技公司在全球人工智能领域中占有更多优势。

    得益于庞大的人口基数,中国科技企业的另一个优势是可以获得大量数据。举例来说,蚂蚁金服运营的支付宝拥有超过5.2亿的用户,公司能够通过用户日常的金融交易和社交关系来确定其信誉度。

    现在,阿里巴巴已经在出口自家的人工智能技术。作为仅次于亚马逊,谷歌,微软和IBM的全球第五大云计算提供商,阿里巴巴的云计算机器学习平台有多种语言版本,其中也包括英文版。本周,阿里巴巴推出了面向欧洲开发商和公司的新版本;它还与新加坡南洋理工大学合作成立了一个新的人工智能实验室。

    在某些方面阿里巴巴可以说已经领先于竞争对手。去年12月,它宣布与马来西亚政府合作提供智能城市服务,其中包括可自动检测事故并帮助优化交通流量的视频平台。

    随着中国的科技巨头更加精通人工智能,其将有助于确定这项技术会如何改变世界。而阿里巴巴无疑将成为未来的重要组成部分。

    哈佛商学院(Harvard Business School)中国问题专家威廉·柯比(William Kirby)表示:“在商业环境中,阿里巴巴是一个使用人工智能的重要创新者。在我看来,阿里巴巴在改变中国业务方式方面已经做了很多;他们在每个领域都雄心勃勃。“

相关报告
  • 《2017亚马逊人工智能奖公布:他们的AI有什么不同?》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:姜山
    • 发布时间:2017-12-22
    • 事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器可以完成人脸识别、驾驶汽车、赢得游戏节目和击败大师的世界。调整住宅的照明和温度,增加店内客流量,使用聊天机器人来改善客户服务,促进农村经济发展。人工智能改变了我们做生意的方式。 20多年来,亚马逊一直处于投资人工智能研发领域的前沿。如今,机器学习(ML)算法驱动了许多内部系统,并形成了亚马逊产品和服务的支点。从执行中心的路径优化、亚马逊网站的推荐引擎、Alexa驱动的Echo到无人机送货直升机PrimeAir,甚至是亚马逊无人便利店AmazonGo。如今,这家电子商务巨头正致力于将自己的学习成果和这些功能分享给所有开发者和数据科学家。 作为这一计划的一部分,亚马逊于12月14日和15日在班加罗尔举办了为期两天的亚马逊人工智能会议(Amazon AI Conclave),以此展示人工智能在新兴创业公司中所扮演的日益重要的角色。这次与英特尔合作举办的活动在亚马逊人工智能奖(theAmazonAIAwards)上达到高潮,该奖项旨在表彰人工智能领域最优秀、最具创新性的工作,以及在教育、医疗、零售和电子商务、媒体和娱乐、金融服务、消费者互动、印度语言解决方案、企业、分析和人工智能工具等领域的业务解决方案。 两项特别奖项认可了利用Alexa技能套件和Alexa语音服务解决方案的努力。该奖项面向的是使用人工智能提供B2C和B2B解决方案的公司,同时也面向为亚马逊网络服务(AWS)提供一个或多个人工智能解决方案的公司。 这些入围的公司于12月11日宣布,并有机会在12月14日在评委会面前出席。奖项于12月14日在亚马逊人工智能会议上被颁发给获奖者。 2013年以来,Haptik一直在开发端到端聊天机器人平台。该公司的产品包括机器人制造、机器人分析和用于监控管理的代理面板。Haptik提供了完整的解决方案,包括设计、内容和跨行业的发展,如FMCG(快速消费品)、旅行和医疗行业。 商业与零售:Unbxd Unbxd是一个电子商务产品发现平台,应用先进的数据技术将消费者与其最可能购买的产品联系起来,同时为商品销售提供可预测的以及可操作的洞见。 医疗保健:Niramai Niramai正在开发一种新颖的软件,这个软件可以比传统方法或自我检查更早地发现乳腺癌。核心技术是一个人工智能的诊断平台,利用获得专利的热成像处理技术和机器学习算法来进行可靠和准确的乳腺癌检查。 本地:liv.ai liv.ai利用深度学习来开发产品,这些产品可以取代常规的、重复性的、枯燥的、耗时的任务。liv.ai的语音API可以让开发者通过使用强大的神经网络模型将语音转换到文本。该API可识别9种主要的印度语言——英语、印地语、孟加拉语、旁遮普语、马拉地语、古吉拉特语、卡纳达语、泰米尔语和泰卢固语。 媒体与娱乐:Tessact Tessact的人工智能和数据分析平台主要服务于媒体和娱乐领域。除了视频分析(面部识别、场景检测、字幕提取等),Tessact还使用多种语言的ASR来从音频中提取元数据,自动标记视频。 企业:UncannyVision UncannyVision是一家专注于嵌入式系统的计算机视觉的科技公司。它的软件工具包能够提高计算机视觉算法的性能。该公司的产品包括UncannyCV——一种电脑视觉/图像处理库;UncannyDL——一种用于移动和嵌入式应用的内置深度学习库;以及UncannySurveillance——这是一项基于人工智能的监控解决方案,目标是挑战安全与分析应用。 金融服务:Credit Vidya CreditVidya利用大数据和先进的机器学习技术,提供了一个使用1万多个数据点的替代信用评分平台。该平台还提供验证服务和欺诈检查服务。 分析:boxx.ai boxx.ai是一种商业智能(BI)解决方案,用于销售和营销,以产生领先优势,推广正确的产品和服务,并通过支持人工智能的助理Aida来留住客户。人工智能助理随时监控数据,并推荐根据历史数据、机器学习和实时反馈进行投资计划。 教育:Embibe Embibe是一个人工智能的edtech平台,它可以帮助提高学生的学习成果。它利用了内容智能、用户智能和导师的智慧来传递结果。 胜出者放弃了亚马逊的设备、AWS信贷、第三方创业公司提供的服务、AWS专家的技术咨询,以及由行业专家组成的目标受众和顾问会议。
  • 《谷歌人工智能只是噱头,实为卖云计算?》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2019-02-01
    • 5分36秒,人类认输。 不到三年,谷歌母公司Alphabet旗下独立团队DeepMind再度出手,其开发的人工智能系统AlphaStar于北京时间1月25日凌晨在《星际争霸2》中打败了职业电竞选手。 与国际象棋或者围棋这样的全盘博弈不同,星际争霸显然更加困难,因为人工智能无法通过观察每一颗棋子的移动来计算下一步动作,系统必须实时做出反应。DeepMind工作人员称,AlphaStar与AlphaGo“进化”版Zore的最大差异是引入了模拟学习的方式,因而能解决“不完美的信息”的困境。 但是,有业内人士指出,AlphaStar挑战电竞选手背后,是一个始于人工智能,却落脚在云计算竞争的故事。 “人机大战”背后的云计算 DeepMind团队介绍,为了训练AlphaStar,他们通过谷歌云服务使用了TPU,后者是谷歌针对机器学习而定制的芯片,具有更高的效能。这一点在赛后的分析中,被着重提出,因为是这个芯片让AlphaStar在两周的时间内,完成了上述的训练。 然而,不单独销售TPU的谷歌,一直希望通过其拉动云计算的增长,而人工智能或许只是个噱头。有业内人士评价,谷歌一面训练自己的算法模型,另一面炒作一下市场热点,大家都想通过人工智能作为动力之一,进一步拉动云市场的增长。 新一轮热潮下的人工智能实际上是算法和算力的竞争。所谓算法,就是对问题寻解的过程,这对应的是人工智能的应用,比如语音合成、图像识别和机器翻译;而算力,也就是计算能力,目前是由芯片所主导的。 这轮热潮是由深度神经网算法所引导的变革,而算法背后需要的是并行计算的能力。英伟达的GPU(图形处理器)恰好满足所需,因而英伟达的芯片开始供不应求。但是,很快产业开始意识到,GPU并不能完全满足需求,人们逐步发现定制加速芯片可以提供更强算力。于是,英伟达的竞争对手英特尔开始押注FPGA(可编程阵列)。 而谷歌选择了另一条路。2016年5月,谷歌发布了专门为机器学习优化的处理器TPU(张量处理器),并对外宣布AlphaGo的算力硬件核心基于此。两年时间,谷歌将TPU升级至3.0,声称其可以每秒计算100千万亿次加减乘除。 更重要的是,谷歌将这款芯片与其机器学习开源软件TenserFlow融合,开发者几乎无需修改,就可以将TenserFlow框架下开发的代码在TPU上运行。但谷歌并不对外销售TPU,所以没有成为另一家芯片厂商,而是选择通过自身云服务对外提供算力的方式销售。 因此,谷歌从一开始就将人工智能与云计算紧紧联系在一起。 云竞争中,谷歌不占优势 与搜索引擎和人工智能技术大幅领先业界不同,谷歌在云计算市场一直处于尴尬的境地。长期掌握全球90%搜索引擎市场份额的谷歌,在亚马逊进入云计算市场两年后的2008年,才上线云计算业务。 但此后,谷歌云一直不温不火。直到2015年,谷歌全盘变动,原因是谷歌搜索业务日趋饱和,导致季度净利润同比下滑5%。当年8月,谷歌宣布重组母公司Alphabet,除了搜索、Android和YouTube等业务外,其他业务纷纷独立。 当年11月, 科技公司VMware前CEO Diane Greene加入谷歌,成为云计算业务的CEO。这位“硅谷女王”开始变革谷歌云计算业务。七个月时间,Diane Greene重新打造了谷歌云的业务架构,组建了销售和客服团队,制定了推广计划,以及创建了与大企业合作的联盟计划。 2016年,“Google Cloud”开始启用。从这时开始,谷歌将云计算、人工智能和机器学习融合成为一体,起名为“Cloud AI & ML”。在Diane Greene的计划图中,谷歌的所有技术都应该为云计算服务。 凭借数据分析处理能力,云计算服务商就可以推动更多存储、计算等服务的售卖,甚至是增值应用的销售。但这一次,Diane Greene碰壁了。 微软就是这么做的。CEO纳德拉(Satya Nadella)将“移动为先,云为先”转化为“智能云和智能边缘计算”。截至6月30日的2018财年,智能云业务营收同比增长了23%。纳德拉在财报中称,对智能云的早期投资正在获得回报。 与此同时,亚马逊虽然并未直言智能云,但2018年底,这家公司推出了自研的云服务器芯片,以及用于云端人工智能推理芯片。不过,这款芯片要在2019年底才能上市,而且是通过云业务的模式提供。 市场机构Synergy Research的数据显示,截至2018年第三季度,谷歌云基础设施服务的市场份额只有7%,远低于亚马逊AWS和微软Azure,甚至不如云转型不利的IBM。在一些第三方机构如Gartner的统计中,凭借中国本土市场优势逐步向海外扩张的阿里云也在超越谷歌。 2018年11月,谷歌宣布Diane Greene将在2019年1月离职。 云计算市场中,谷歌还有机会吗? 这并不意味着谷歌没有出路。谷歌CEO Sundar Pichai曾多次对外表示,谷歌未来的成功将基于人工智能。也就是说,DeepMind这些早期投资,最终仍将需要支持Alphabet核心业务发展,也就是谷歌。 2018年10月,英国公司注册署披露的一份文件显示,DeepMind在2017财年税前亏损高达2.81亿英镑,同比增长123%。与此同时,该公司营收仅为5440万英镑,而且来源是通过技术帮助母公司提高数据中心智能系统的效能等服务。 DeepMind在游戏方面的研究并没有直接对应商业的前景,但是它一些其他研究成果开始逐步为谷歌所使用。2016年10月,谷歌宣布在智能助手里使用了DeepMind的模型WaveNet,使得机器的发音更接近于真人。 从AlphaGo到AlphaStar,人工智能技术本身不断提升,这也将给谷歌打开新的业务机会。第三方机构Forrester分析师戴鲲表示,凭借简化云原生应用开发与运维过程,致力于开源技术生态,以及人工智能和机器学习的能力等优势,谷歌云仍存在机会。 人工智能创业公司出门问问CEO李志飞表示,短期内谷歌虽然在市场份额上落后于对手,但技术驱动的谷歌会有更多的贡献。李志飞曾在谷歌工作。 事实上,Diane Greene任职期间,谷歌赢得了包括苹果、Paypal等大公司的公有云订单,而这些成绩并不为外人所熟知。谷歌也在为那些寻求第二供应商的企业提供服务,这包括亚马逊的客户Salesforce和纽约时报。 德意志银行分析报告显示,其预测谷歌的云业务收入2018年将达到90亿美元,同比增长30%。一位不看好谷歌国内市场的投资者告诉记者,人工智能技术将为谷歌的营收带来新的变化,原因是目前组织架构仍在调整。 据了解,谷歌系的高层已经开始接受DeepMind研发。Oriol Vinyals参与了AlphaStar的项目,而他此前是谷歌大脑的团队成员。