《结构光和人工智能如何塑造未来通信》

  • 来源专题:光电情报网信息监测服务平台
  • 编译者: husisi
  • 发布时间:2024-07-31
  • 结构光将先进的图像处理与机器学习相结合,在创新实验中实现了高数据容量和准确性,从而增强了信息传输能力。

    结构光通过整合多自由度的空间维度,具有极大提高信息容量的潜力。最近,结构光模式与图像处理和人工智能的融合已在通信和检测等领域展现出强大的发展潜力。

    结构光场最显著的特征之一是其振幅信息的二维和三维分布。这一特点不仅能与成熟的图像处理技术有效结合,还能借助当前推动深刻变革的机器学习技术实现跨媒介信息传输。基于相干叠加态的复杂结构光场可以携带丰富的空间振幅信息。通过进一步结合空间非线性转换,可以实现信息容量的显著提升。

    北京理工大学的Zilong Zhang和南洋理工大学的Yijie Shen及其团队成员提出了一种基于复模相干叠加态及其空间非线性转换的增强信息容量的新方法。通过整合机器视觉和深度学习技术,他们实现了低误码率的大角度点对多点信息传输。

    在该模型中,高斯光束通过空间光调制器获得结构光的空间非线性转换(SNC)。卷积神经网络(CNN)用于识别光束的强度分布。通过比较基本叠加模式和 SNC 模式,可以发现随着基本模式的组成特征模式阶数的增加,HG 叠加模式的编码能力明显优于 LG 模式,空间结构非线性转换后的模式编码能力可以得到显著提高。

    验证编码和解码性能

    为了验证基于上述模式的编码和解码性能,我们传输了一幅 50×50 像素的彩色图像。图像的 RGB 维度被分为 5 个色度等级,共包含 125 种色度信息,每种信息由 125 个 HG 相干叠加态编码。此外,还通过 DMD 空间光调制器将大气湍流造成的不同程度的相位抖动加载到这 125 种模式上,并利用深度学习技术进行训练,形成数据集。

    进一步利用非线性转换,实现了对更高容量解码效果的分析,其中选择了 530 个 SNC 模式,通过卷积神经网络对这些模式的混淆矩阵进行实验测量,如图 2 所示。实验结果表明,由于结构特征更加明显,SNC 模式在显著提高数据容量的同时,仍能确保类似的低误码率,数据识别准确率高达 99.5%。此外,实验还验证了机器视觉在漫反射条件下的模式识别能力,实现了多台接收摄像机同时进行高精度解码,观察角度可达 70°。

    结构光技术通过空间维度和机器智能得到增强,促进了信息传输和检测

    非线性转换产生的复杂结构光具有更高的信息容量

相关报告
  • 《人工智能如何影响云计算的发展》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-05-31
    • 云计算一直是一个伟大的技术,正在改变组织的工作方式、存储信息,并改变决策,为技术创新和分析研究铺平道路。想象一下云计算为什么变得这么聪明?智能的云计算不仅可以存储和检索大量的数据,还能够收集、传播和学习这些信息,并随时做出明智的决定。 人工智能如何影响云计算?智能云 在最基本的层次上,人工智能已经改变了数据输入、存储和分析的方式。如今,云计算不仅仅是一个数据仓库,还是一个“智能仓库”。机器学习和云计算可以一起从信息中保存、分析和学习,并将其传递给其他服务器或云平台,以帮助框架信息和响应支持的决策。人们也希望有一种智能云计算能够预测基于用户数据输入的趋势。 迄今为止的应用和发展 每个人都知道云计算和人工智能背后的巨大潜力。 随着新兴业务领域将云计算和人工智能纳入其核心工作,未来趋势将会激励人们和研究人员推出更好、更智能的云计算技术。技术人员正在努力构建能够自我评估和自行决定微小细节的平台,并针对运营活动中的困难提出解决方案。 然而,人工智能支持的云计算仍处于初始阶段,企业必须密切关注这一领域的发展,以最大限度地利用这一技术奇迹,以达到最佳利益。近年来,人们看到手机逐步取代电脑,物联网将所有设备连接在一起,人工智能为这些设备赋予智能。这些变化已经对云计算和技术发展产生了巨大影响,而了解人工智能将如何影响云计算,对所有人来说都是非常激动人心的。 IBM公司指出,“人工智能和云计算的融合有望成为创新的源泉和加速变革的手段”, IBM公司是对云计算最为赞赏的公司之一。 协同工作 云计算是真正意义上的信息来源,它保持了人工智能的学习机制,而人工智能可以帮助提供有用的响应和数据分析,从而使云计算的结果和面向情况成为可能。考虑到人工智能和云计算之间的共生关系具有如此广阔的发展空间,IBM公司与其他厂商致力于其应用与发展。而这些努力表明,人工智能和云计算将会继续创造惊人成果的未来大局。 未来技术的希望 人工智能正在帮助构建能够在几秒钟内响应并理解人类行为的机器或协作机器人。这些机器人的机器学习功能基于训练或学习阶段本身进行的智能分析研究。随着时间的推移,机器人将会越来越熟练,也更加聪明,并能像人类一样快速反应。例如,印度电信巨头沃达丰(Vodafone)公司使用名为Tobi的机器人向消费者发放消息,并向他们提供有关公司产品和服务的重复信息。 WindowsCortana应用程序也是一种自学习机制,可以观察人员交互,并实时提供有用的响应。 人类在塑造正确的人工智能和云计算合作中的角色 由于不断变化的情景和频繁的技术升级,对人工智能的学习需求日益增加。云计算提供更多、更好的数据,让机器学习加速而不受任何干扰。人类的思想可以将人工智能重定向为正确阅读信息。如果人工智能通过人工技术专家进行保存,云计算也可以精通提供有用的数据。 商业智能、云计算和智能工作空间 企业可以通过人工智能在智能数据存储和云计算的帮助下实现决策方面的巨大飞跃。企业可以研究过去的数据、制定业务战略,制定未来的计划,并简单地分析信息,以了解在一个薄弱的关键时期的缺点。通过人工智能完成的商业预测可以帮助大量企业通过在适当的时间投入巨大的努力来获得帮助和洞察力。 对云计算的需求增加 未来,云计算将成为最重要的优先事项之一,它将帮助企业应对面临的挑战。云计算或“智能云”将为智能输入提供大量数据。随着工业领域的激烈竞争,拥有智能云将是必要的,将不再是一种选择。结合人工智能和云计算这两大力量将加速企业的发展。更恰当地说,像医疗、教育、商业、零售等领域将看到对人工智能注入的智能云的需求不断增加。 智能云在各行业的应用越来越多 在教育领域,采用智能云可以提供数据支持的研究,并可以引导学生利用以前的研究及其影响。同样,卫生部门可以利用云计算智能做很多事情。对患者进行手术的医生可以从之前完成的数千个类似病例中寻求帮助,这远远超过了任何医生所保存和评估的手册信息。这种详细收集数据、比较并及时提供解决复杂医疗手术的新方法,使云计算成为医疗行业的礼物。像银行、投资和教育等领域可以看到更多的创新,其中包括人工智能和智能云计算的能力。 从基础机器学习到深度学习将会有一个不断增加的范式转变。在这种情况下,基于人工智能的云计算应用程序和计算算法利用过去的数据和研究分析来制定未来的策略和响应。在其他方面,人们可以期望机器人和机器在智能数据和智能云计算的强大实际场景和情况下,像人类一样进行交互和响应。 聊天机器人、高级机器人以及个人助理 人们看到谷歌和微软等公司推出了聊天机器人或个人助理,他们可以使用以前的数据输入并从中获得常识。这使得人类交互更加有趣,并使寻找重复信息的人们的生活更轻松。 Google Alexa和Microsoft Cortana采用人工智能来提供基于云计算的信息。然而,这些设备本质上更加通用,而随着以人工智能为后盾的高级云计算操作的出现,人们将会看到企业的运营和业务范围将会越来越广泛。
  • 《Nature | 医学人工智能的未来》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2023-10-29
    • 本文内容转载自“ChemBioAI”微信公众号。原文链接: https://mp.weixin.qq.com/s/hlwb9sc0rugxZ_ThiOy7gQ 2023年10月24日,《自然》新闻(Nature News)在线发表了一篇题为An AI revolution is brewing in medicine. What will it look like?的特别报道。 Jordan Perchik于2018年开始在亚拉巴马大学伯明翰分校进行放射科住院医生培训,那时正值他所谓的放射科学领域的“AI恐慌”高峰期。在计算机科学家Geoffrey Hinton宣称人们应停止培训成为放射科医生的仅仅两年后,这一时期开始。Hinton被称为人工智能之父,他预测这些系统很快将能够比人类更好地阅读和解释医学扫描图像和X光片。此后,放射科医学项目的申请数量大幅下降。 基于人工智能的工具越来越多地成为医疗保健的一部分,美国食品和药品监督管理局(FDA)已经授权使用超过500种这类工具。其中大多数与医学影像有关,用于改进图像质量、测量异常或标记检测结果以供后续跟踪。 调查显示,虽然许多医生知道临床AI工具的存在,但实际上只有很小一部分 (大约在10%到30%之间) 使用过它们,他们的态度从谨慎乐观到彻底不信任不等。荷兰乌得勒支大学医疗中心的医学创新实施专家Charisma Hehakaya说:“一些放射科医生对AI应用的质量和安全性存在疑虑。”即使AI工具能够完成它们的目标任务,仍不清楚这是否会转化为患者更好的医疗护理。但有一种被称为综合医学AI的方法似乎正在兴起。这些模型受到庞大数据集的训练,就像驱动ChatGPT和其他AI聊天机器人的模型一样。在吸收大量医学图像和文本数据后,这些模型可以适用于许多任务。尽管目前获得批准的工具执行特定功能,比如在计算机断层扫描(CT)中检测肺结节,但这些综合模型将更像医生,评估扫描中的每一种异常情况,并将其整合为一种诊断。 尽管现在的AI爱好者趋向避免大胆宣称机器将取代医生,但许多人认为,这些模型可以克服目前医学AI的某些限制,有朝一日可能在某些情况下超越医生。然而,这些新工具能够在实际临床护理中使用之前,还有漫长的道路需要走。 目前存在的限制 医学领域的人工智能工具充当从业者的辅助角色,例如通过快速浏览扫描图像并标记医生可能立即查看的潜在问题,这些工具有时表现很出色。Jordan Perchik记得有一次,在他值夜班的时候,一种AI分诊工具在凌晨3点为一名出现呼吸急促症状的患者标记了一张胸部CT扫描。他将这张扫描图像提上优先级,并同意AI的评估结果,该结果显示患者存在肺栓塞,这是一种可能致命且需要立即治疗的情况。如果没有被标记出来,这张扫描图像可能要等到当天晚些时候才会被评估。 但如果AI犯了错误,它也会产生相反的效果。Jordan Perchik说,最近他发现了一例AI没有标记出来的肺栓塞病例,他决定采取额外的审查步骤,最终证实了他的评估,但这减缓了他的工作进度。如果他决定相信AI并继续前进,那么这种情况可能会被漏诊。”许多已获批准的设备并不一定符合医生的需求,早期的AI医学工具是根据影像数据的可用性来开发的,因此一些应用程序是为常见且容易识别的疾病而建立的。 另一个问题是,这些AI工具倾向专注于特定任务,而不是全面解释医学检查——观察图像中可能相关的一切,考虑以前的结果和患者的临床病史。尽管专注于检测一些疾病具有一定价值,但它并不反映放射科医生真正的认知工作。 解决方案通常是增加更多基于AI的工具,但这也对医疗护理构成挑战,伦敦Google Health的临床研究科学家Alan Karthikesalingam表示。假如一个人接受常规乳腺X光检查,技术员可能会采用一种用于乳腺癌筛查的AI工具的辅助。如果发现异常,同一患者可能需要进行磁共振成像(MRI)扫描以确认诊断,而这可能需要另一个AI设备。如果诊断结果得到确认,那么病变将会通过手术移除,可能需要另一种AI系统来协助进行病理学分析。 许多医院并不了解监测AI性能和安全性所涉及的挑战,英国伯明翰大学研究医疗AI负责创新的临床研究员Xiaoxuan Liu表示。她和她的同事们确定了数千份医学成像研究,比较了深度学习模型的诊断性能与医疗保健专业人员的性能。对于该团队评估的69项诊断准确性研究,一个主要发现是,大多数模型未经真正独立于用于训练模型的信息的数据集进行测试。这意味着这些研究可能高估了模型的性能。 坚实的基础 为了解决医学领域AI工具的一些限制,研究人员一直在探索具备更广泛能力的医学人工智能。他们受到了像ChatGPT这样的革命性大型语言模型的启发。这个术语是由斯坦福大学的科学家们在2021年创造的,它描述了在广泛的数据集上进行训练的模型,这些数据集可以包括图像、文本和其他数据,使用一种称为自监督学习的方法。这些基础模型,也被称为基本模型或预训练模型,构成了后续可以适应执行不同任务的基础。 目前大多数医学AI设备是通过监督学习方法开发的。例如,使用这种方法训练一个模型来识别肺炎,需要专家分析大量的胸部X光片并将它们标记为“肺炎”或“非肺炎”,以教导系统识别与该疾病相关的模式。在基础模型中不需要大量图像的注释。例如,对于ChatGPT,使用大量文本进行训练,以训练一个通过预测句子中的下一个单词来学习的语言模型。同样,伦敦摩尔菲尔德眼科医院的眼科医生Pearse Keane及其同事开发的医学基础模型使用了160万张视网膜照片和扫描图像,以学习如何预测这些图像缺失部分应该是什么样子。在进行了这一预训练后,研究人员引入了几百张标记图像,使其能够学习特定的与视觉相关的疾病,如糖尿病性视网膜病变和青光眼。该系统在检测这些眼部疾病以及通过眼底血管微小变化检测出的心脏病和帕金森病等系统性疾病方面优于以前的模型,但该模型尚未在临床环境中进行测试。 Keane表示,基础模型对眼科学领域特别合适,因为几乎可以对眼部的每个部位进行高分辨率成像。而且有大量的这些图像数据可用于训练这种模型。人工智能将彻底改变医疗保健,而眼科学可以成为其他医学专业的示范。大型科技公司已经在投资使用多种图像类型的医学成像基础模型,包括皮肤照片、视网膜扫描、X光片和病理学切片,并整合电子健康记录和基因组数据。 今年6月,Google Research科学家们发表了一篇论文,介绍了他们称之为REMEDIS(具有自监督的强大和高效医学成像)的方法,与使用监督学习训练的AI工具相比,该方法能够将诊断准确性提高高达11.5%。研究发现,在对未标记图像的大型数据集进行预训练后,只需要少量标记图像就能达到这些结果。这项研究的共同作者之一,Karthikesalingam说:“我们的主要发现是,REMEDIS能够以非常高效的方式,只需很少的示例,学会如何在许多不同的医学图像中对许多不同的事物进行分类,包括胸部X光片、数字病理学扫描和乳腺X光检查。”次月,Google的研究人员在一篇预印本中描述了他们如何将这一方法与该公司的医学大型语言模型Med-PaLM相结合,该模型几乎可以像医生一样回答一些开放性的医学问题。结果表明,Med-PaLM Multimodal不仅可以解释胸部X光图像,还可以以自然语言起草医疗报告。 微软也在努力将语言和视觉整合到一个单一的医学AI工具中。今年6月,公司的科学家们推出了LLaVA-Med(生物医学大型语言和视觉助手),该模型在与从PubMed Central(一个公开可访问的生物医学文章数据库)提取的文本配对的图像上进行训练。微软Health Futures的生物医学AI研究负责人Hoifung Poon表示:“一旦你这样做,你就可以开始与图像进行对话,就像你在与ChatGPT交谈一样。” 这种方法的一个挑战是它需要大量的文本-图像对。 随着这些模型在越来越多的数据上进行训练,一些科学家乐观地认为它们可能能够识别人类无法识别的模式。AI工具可能在某些领域超越人类能力,比如使用数字病理学来预测免疫疗法对肿瘤的反应。 Karthikesalingam还指出,即使Google的医学成像AI取得了最佳结果,它仍然无法与人类相媲美。人类放射科医生的X光报告仍然被认为明显优于最先进的多模式综合医学系统。尽管基础模型似乎特别适合扩大医学AI工具的应用,但要展示它们可以安全用于临床护理还有很长的路要走。 毫无疑问,AI在放射科领域的作用将继续增长,与其说取代放射科医生,不如培训他们如何使用AI。