《深圳机器人产业规模突破800亿,未来创新公司需发掘新动能》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 姜山
  • 发布时间:2018-01-18
  • 谈及中国机器人产业,深圳是绕不开的地方。据雷锋网了解,在2018年的CES(美国国际消费电子展)展会上,据主办方美国消费技术协会(CTA)的数据显示,约有500家参展公司来自深圳,占所有参展商的10%。

    这是信号侧面展示了深圳机器人产业的强大生产力。1月16日,2018深圳机器人创新与发展论坛在深圳市举行召开,在会议上公布了一项数据 :近几年深圳市机器人产业增速呈双位数,目前产业规模远超800亿元。据雷锋网(公众号:雷锋网)了解:2016年深圳机器人产业白皮书显示,深圳机器人产业的企业数量达469家,产值已达787亿元。其中服务机器人和工业机器人是深圳机器人产业的两个拳头。大族电机、优必选等一批企业都是深圳走出的优秀机器人企业。

    “工业机器人和服务机器人在2017年都火得不行了。”深圳市机器人协会秘书长毕亚雷向雷锋网表示,凭靠深圳雄厚的产业基础、完善的创新要素、高度集中的高端人才和资本市场,依托中国3C产业集聚地——深圳带来的巨大市场需求,深圳机器人产业可谓如鱼得水。目前,机器人产业已步入快速发展阶段,随着人工智能热潮的推动,深圳机器人智能化也在不断提升。

    深圳机器人产业规模突破800亿,未来创新公司需发掘新动能

    在看到机器人行业上升的同时,也需要看到行业未来的发展走向。德国汉堡科学院院士、先进院研究员张建伟院士提到了人工智能是去年的一个关键词,因为人工智能出现了两个关键的新动能,一个是高性价比的计算引擎,三十年前我们在清华大学开始从事人工智能,现在的计算能力是我当年(三十年前)计算能力的一百万倍。另外我们现在通过云计算、大数据、移动互联网和5G通讯,这些高性价比的互联网大数据给人工智能发展带来了无穷多的燃料。

    今天再谈整个的数据驱动的下一个伟大的时代。实际上除了人工智能、材料、能源还有数字创意等等都会给未来的生活场景带来新的解决方案,这其中也包括少人的工厂、老人化的解决方案等等。

    从人工智能的角度,我们更应该强调在物理信息系统下的人工智能在制造、医疗养老、教育和保护环境、交通等方面的人工智能和机器人的应用。人工智能要从现在代码的虚拟世界走向物理世界,进入人类2.0和机器2.0的时代,人工智能应该是以人为本,机器人也应该以人为中心,为人服务,为提高我们的生活质量而服务的。未来的人工智能和物理世界的结合是通过最基础的技术成熟度,深度学习、跨模态学习、强化学习和概率模型、大脑数据和知识表达等等这些关键的技术模块把人工智能和感知技术和人工智能的关键模块技术结合起来,是我们下一代真正产生未来的更大的创新公司的新动能。

    机器人专家孙立宁教授认为孙立宁指出:中国作为一个制造业大国,不得不面临老龄化的问题。到2050年,中国60岁以上的人口达到1/3,再加上劳动力成本的提高、劳动力紧缺,因此中国需要迫切地需要智能制造。

    目前国产机器人实现了30%以上的增长,国产机器人已经开始爆发发展了。但在发展智能制造、人工智能等产业的同时,需要夯实底层的基础技术、同时也要解决操作移动化、人机交互、智能化等关键技术问题。前面的基础得到夯实,整个产业亦将迎来长足的发展。未来的机器人产业还有更大的潜能尚需发掘,走进机器人的快车道。

相关报告
  • 《机器人崛起 实现腾飞亟待突破产业瓶颈》

    • 来源专题:北京市经济和信息化委员会监测服务平台
    • 编译者:yxzhou
    • 发布时间:2018-06-14
    •   喝着送餐机器人送来的咖啡,看人形机器人整齐划一地表演舞蹈,欣赏机器人提笔、沾墨、运笔书写出的书法作品,在唐山新禾智能科技有限公司,记者颇有穿越到未来的感觉。   从搬运、码垛、焊接等生产活动,到读报、陪护等生活细节,再到排雷、战斗等军事需求,随着人工智能技术的进步,河北省围绕工业机器人、服务机器人、特种机器人三大领域,从生产制造、技术研发、产业应用等路径推进构建产业体系。   今年以来,河北机器人产业方兴未艾,呈现出勃勃生机,亮点频出:   5月8日,作为世界工业机器人“四大家族”之一,世界喷涂机器人巨擘的安川都林机器人应用设备(北京)有限公司在香河机器人小镇举行新工厂入驻仪式,并开始投产运营;   5月18日,国际医疗机器人产业基地项目签约落户涿州国际健康产业园,基地将引入以色列Mazor Robotics骨科手术机器人和英国肝脏常温灌注转运机器人OrganOx metra技术,探索医疗机器人技术的研发及应用;   日前,唐山高新区“全国焊接机器人制造产业知名品牌示范区”正式通过国家质检总局验收,成为全国首家以机器人产业命名的品牌示范区:   河北机器人产业的悄然崛起,展现了以传统产业为主的河北经济发展领域正在发生的深刻变化,这也正是河北依托新兴产业重塑产业格局、打开经济发展新空间的一个缩影。   “今年前1至4月份,全省新产品以及附加值高、科技含量高的产品产量保持较快增长,其中工业机器人增长40.6%,数据亮眼。”河北省统计局副局长田艳表示,河北智造机器人的崛起,为全省经济转型发展增添了新动能。   记者还从河北省工信厅了解到,目前,河北省已建成沧州国际机器人产业园区、唐山机器人产业园区、石家庄机器人产业园区、香河机器人产业园区、固安机器人产业园区、衡水冀州机器人产业园区和曲周机器人产业园区七大基地。   “公司研发制造的国内首个专用车车架智能化焊接制造车间已经投产,从生产线的起点上料到钢板变成车架成品的全过程仅需8分钟,期间各个环节全部由机器人完成。”在位于唐山高新区机器人产业基地的唐山开元机器人系统有限公司,技术部部长徐志明告诉记者。   开元集团的焊接机器人在奥运鸟巢、上海世博展馆等留下了匠心制造。世界上最长的跨海桥梁——港珠澳跨海大桥桥梁横隔板的焊接工作就是由开元集团研发生产的U肋定位焊接机器人焊接系统承担。世界首条机器人焊接铝合金自行车生产线、国内第一台多功能六轴工业机器人本体也来自开元。   河北省机器人产业虽然已具有一定规模,但记者在采访中了解到,我省很多机器人制造企业以组装和代加工为主,处于产业链低端,产业集中度低、总体规模小,低端产品产能过剩现象日益突出。同时,机器人产业面临技术瓶颈,缺乏高端机器人自主知识产权,导致高端产能不足。   “河北在焊接机器人、矿用机器人等领域已经取得了国内领先地位,但随着国家有关高端装备制造支持政策的出台,全国各地都在注入资金研发相关产品,而且进展很快。”河北省机械行业协会副会长兼秘书长闫瑞祥认为,能否尽快实现量产,扩大机器人产业规模,成为我省机器人产业亟待解决的首要问题。   如何突破这些瓶颈?闫瑞祥表示,政策、投资公司和企业三方应同时发力,使机器人制造这个新崛起的行业行驶在快速发展的轨道上。政府应当更加关注作为行业“主力部队”的中小企业,并适当向创业型公司倾斜,引导市场进行充分且良性的竞争,尽快出台相应的配套扶持政策及发展规划,引导和支持机器人产业加快发展、加速聚集、增强实力。   如何进一步推进机器人产业迈向中高端?某长期研究机器人产业发展的业内人士向记者表示,河北在发展机器人产业时必须扬长避短,找准定位,重点培育一批具有影响力的龙头企业。企业自身需围绕核心零部件、创新型产品、细分市场、售后服务、资本并购等五个维度进行突破,走“专精特新”发展道路。唯有实现自主创新,掌握高端核心技能,才能从根本上提升核心竞争力,进而在市场上站稳脚跟。   在新机遇的引领下,为促进机器人产业健康发展,我省已陆续出台一系列产业发展促进措施,厚植机器人发展沃土,着力抢占产业发展先机。多个市县把机器人产业作为重点产业进行培育、推进,推动机器人产业集聚发展。   “我们将在香河打造自动化涂装中心,提升中国涂装行业的整体水平。”安川都林机器人应用设备(北京)有限公司总经理宋镇秀表示,香河机器人小镇聚集了众多上下游企业,可以在技术、设备、客户等资源上实现共享和协同,初步形成完整产业链,实现集群发展的良性循环。   日前,河北省制造强省建设领导小组办公室印发《河北省加快智能制造发展行动方案》,提出支持发展焊接、切割、喷涂等工业机器人,着力打造“三中心一平台”(智能制造创新中心、增材制造体验中心、机器人研究中心和智能制造教育平台),到2020年,全省形成较为完整的智能制造产业体系,智能装备产业主营业务收入达到1000亿元。   未来已来,河北正在加速进入机器人时代!    
  • 《AI大模型迈向多模态,助力具身智能与机器人实现创新》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:胡思思
    • 发布时间:2024-10-28
    • 你听过莫拉维克悖论 (Moravec's paradox) 吗?该悖论指出,对于人工智能 (AI) 系统而言,高级推理只需非常少的计算能力,而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源。实质上,与人类本能可以完成的基本感官任务相比,复杂的逻辑任务对 AI 而言更加容易。这一悖论凸显了现阶段的 AI 与人类认知能力之间的差异。 人本来就是多模态的。我们每个人就像一个智能终端,通常需要去学校上课接受学识熏陶(训练),但训练与学习的目的和结果是我们有能力自主工作和生活,而不需要总是依赖外部的指令和控制。 我们通过视觉、语言、声音、触觉、味觉和嗅觉等多种感官模式来了解周围的世界,进而审时度势,进行分析、推理、决断并采取行动。 经过多年的传感器融合和 AI 演进,机器人现阶段基本上都配备有多模态传感器。随着我们为机器人等边缘设备带来更多的计算能力,这些设备正变得愈加智能,它们能够感知周围环境,理解并以自然语言进行沟通,通过数字传感界面获得触觉,以及通过加速计、陀螺仪与磁力计等的组合,来感知机器人的比力、角速度,甚至机器人周围的磁场。 迈入机器人和机器认知的新时代 在 Transformer 和大语言模型 (LLM) 出现之前,要在 AI 中实现多模态,通常需要用到多个负责不同类型数据(文本、图像、音频)的单独模型,并通过复杂的过程对不同模态进行集成。 而在 Transformer 模型和 LLM 出现后,多模态变得更加集成化,使得单个模型可以同时处理和理解多种数据类型,从而产生对环境综合感知能力更强大的 AI 系统。这一转变大大提高了多模态 AI 应用的效率和有效性。 虽然 GPT-3 等 LLM 主要以文本为基础,但业界已朝着多模态取得了快速进展。从 OpenAI 的 CLIP 和 DALL·E,到现在的 Sora 和 GPT-4o,都是向多模态和更自然的人机交互迈进的模型范例。例如,CLIP 可理解与自然语言配对的图像,从而在视觉和文本信息之间架起桥梁;DALL·E 旨在根据文本描述生成图像。我们看到 Google Gemini 模型也经历了类似的演进。 2024 年,多模态演进加速发展。今年二月,OpenAI 发布了 Sora,它可以根据文本描述生成逼真或富有想象力的视频。仔细想想,这可以为构建通用世界模拟器提供一条颇有前景的道路,或成为训练机器人的重要工具。三个月后,GPT-4o 显著提高了人机交互的性能,并且能够在音频、视觉和文本之间实时推理。综合利用文本、视觉和音频信息来端到端地训练一个新模型,消除从输入模态到文本,再从文本到输出模态的两次模态转换,进而大幅提升性能。 在今年二月的同一周,谷歌发布了 Gemini 1.5,将上下文长度大幅扩展至 100 万个词元 (Token)。这意味着 1.5 Pro 可以一次性处理大量信息,包括一小时的视频、11 小时的音频、包含超过三万多行代码或 70 万个单词的代码库。Gemini 1.5 基于谷歌对 Transformer 和混合专家架构 (MoE) 的领先研究而构建,并对可在边缘侧部署的 2B 和 7B 模型进行了开源。在五月举行的 Google I/O 大会上,除了将上下文长度增加一倍,并发布一系列生成式 AI 工具和应用,谷歌还探讨了 Project Astra 的未来愿景,这是一款通用的 AI 助手,可以处理多模态信息,理解用户所处的上下文,并在对话中非常自然地与人交互。 作为开源 LLM Llama 背后的公司,Meta 也加入了通用人工智能 (AGI) 的赛道。 这种真正的多模态性大大提高了机器智能水平,将为许多行业带来新的范式。 例如,机器人的用途曾经非常单一,它们具备一些传感器和运动能力,但一般来说,它们没有“大脑”来学习新事物,无法适应非结构化和陌生环境。 多模态 LLM 有望改变机器人的分析、推理和学习能力,使机器人从专用转向通用。PC、服务器和智能手机都是通用计算平台中的佼佼者,它们可以运行许多不同种类的软件应用来实现丰富多彩的功能。通用化将有助于扩大规模,产生规模化的经济效应,价格也能随着规模扩大而大幅降低,进而被更多领域采用,从而形成一个良性循环。 Elon Musk 很早就注意到了通用技术的优势,特斯拉的机器人从 2022 年的 Bumblebee 发展到 2023 年三月宣布的 Optimus Gen 1 和 2023 年年底的 Gen 2,其通用型和学习能力不断提高。在过去的 6 至 12 个月里,我们见证了机器人和人形机器人领域所取得的一系列突破。 下一代机器人和具身智能背后的新技术 毋庸置疑的是我们在具身智能达到量产方面还有很多工作要做。我们需要更轻便的设计、更长的运行时间,以及速度更快、功能更强大的边缘计算平台来处理和融合传感器数据信息,从而做出及时决策和控制行动。 而且我们正朝着创造人形机器人的方向发展,人类文明数千年,产生出无处不在的专为人类设计的环境,而人形机器人系统由于形体与人们类似,有望能够在人类生存的环境中驾轻就熟地与人类和环境互动并执行所需的操作。这些系统将非常适合处理脏污、危险和枯燥的工作,例如患者护理和康复、酒店业的服务工作、教育领域的教具或学伴,以及进行灾难响应和有害物质处理等危险任务。此类应用利用人形机器人类人的属性来促进人机自然交互,在以人为中心的空间中行动,并执行传统机器人通常难以完成的任务。 许多 AI 和机器人企业围绕如何训练机器人在非结构化的新环境中更好地进行推理和规划,展开了新的研究与协作。作为机器人的新“大脑”,预先经过大量数据训练的模型具有出色的泛化能力,使得机器人能做到见怪不怪,更全面地理解环境,根据感官反馈调整动作和行动,在各种动态环境中优化性能。 举一个有趣的例子,Boston Dynamics 的机器狗 Spot 可以在博物馆里当导游。Spot 能够与参观者互动,向他们介绍各种展品,并回答他们的问题。这可能有点难以置信,但在该用例中,比起确保事实正确,Spot 的娱乐性、互动性和细腻微妙的表演更加重要。 Robotics Transformer:机器人的新大脑 Robotics Transformer (RT) 正在快速发展,它可以将多模态输入直接转化为行动编码。在执行曾经见过的任务时,谷歌 DeepMind 的 RT-2 较上一代的 RT-1 表现一样出色,成功率接近 100%。但是,使用 PaLM-E(面向机器人的具身多模态语言模型)和 PaLI-X(大规模多语言视觉和语言模型,并非专为机器人设计)训练后,RT-2 具有更出色的泛化能力,在未曾见过的任务中的表现优于 RT-1。 微软推出了大语言和视觉助手 LLaVA。LLaVA 最初是为基于文本的任务设计的,它利用 GPT-4 的强大功能创建了多模态指令遵循数据的新范式,将文本和视觉组件无缝集成,这对机器人任务非常有用。LLaVA 一经推出,就创下了多模态聊天和科学问答任务的新纪录,已超出人类平均能力。 正如此前提到的,特斯拉进军人形机器人和 AI 通用机器人领域的意义重大,不仅因为它是为实现规模化和量产而设计的,而且因为特斯拉为汽车设计的 Autopilot 的强大完全自动驾驶 (FSD) 技术基础可用于机器人。特斯拉也拥有智能制造用例,可以将 Optimus 应用于其新能源汽车的生产过程。 Arm是未来机器人技术的基石 Arm 认为机器人脑,包括“大脑”和“小脑”,应该是异构AI 计算系统,以提供出色的性能、实时响应和高能效。 机器人技术涉及的任务范围广泛,包括基本的计算(比如向电机发送和接收信号)、先进的数据处理(比如图像和传感器数据解读),以及运行前文提到的多模态 LLM。CPU 非常适合执行通用任务,而 AI 加速器和 GPU 可以更高效地处理并行处理任务,如机器学习 (ML) 和图形处理。还可以集成图像信号处理器和视频编解码器等额外加速器,从而增强机器人的视觉能力和存储/传输效率。此外,CPU 还应该具备实时响应能力,并且需要能够运行 Linux 和 ROS 软件包等操作系统。 当扩展到机器人软件堆栈时,操作系统层可能还需要一个能够可靠处理时间关键型任务的实时操作系统 (RTOS),以及针对机器人定制的 Linux 发行版,如 ROS,它可以提供专为异构计算集群设计的服务。我们相信,SystemReady 和 PSA Certified 等由 Arm 发起的标准和认证计划将帮助扩大机器人软件的开发规模。SystemReady 旨在确保标准的 Rich OS 发行版能够在各类基于 Arm 架构的系统级芯片 (SoC) 上运行,而 PSA Certified 有助于简化安全实现方案,以满足区域安全和监管法规对互联设备的要求。 大型多模态模型和生成式 AI 的进步预示着 AI 机器人和人形机器人的发展进入了新纪元。在这个新时代,要使机器人技术成为主流,除了 AI 计算和生态系统,能效、安全性和功能安全必不可少。Arm 处理器已广泛应用于机器人领域,我们期待与生态系统密切合作,使 Arm 成为未来 AI 机器人的基石。