第03版:要闻

从“看清”到“理解”

嘉兴举行专题咖会探路多模态感知

  

  ■记者 周佩佳

  通讯员 钱楚楚 汪 舒

  

  本报讯 机器人需要感知物体才能实现抓取、搬运等操作,如何感知成为其中关键。传统感知以单一视觉识别为主,但随着人工智能的加速演进,感知技术正在向着多源数据融合、复杂环境理解与实时智能决策相融合的方向迈进。5月28日下午,一场聚焦多模态感知领域的“未来场景·战略新兴产业咖会”专场活动在北京理工大学长三角研究院举行,行业专家、高校学者和业内企业代表齐聚一堂,从技术突破、场景落地到区域生态协同,共同探讨多模态感知的当下与未来。

  简单来看,多模态感知是一种融合视觉、听觉、触觉、嗅觉等多种感官信息进行综合理解的人工智能技术,就是通过相关技术手段让机器人与人一样“有感觉”,而这背后的核心在于信息的精准抓取和智能物联,继而提供更全面、稳定和安全的感知结果。

  比如视觉,目前市面上视觉感知技术已经基本能实现常规环境的感知,但如果遇到雨、雾、黑、反光、逆光等其他环境,往往表现平平。参会企业之一的睿明智能科技(嘉兴)有限公司,是北理工长三院成功孵化的一家“年轻”的科技型企业,重点聚焦复杂环境下仿人眼的弱小目标发现和预警。据公司负责人王中山介绍,经过近3年的摸索,睿明智能已经掌握了多模态数据融合、图像增强与重构、仿人眼视觉等三大核心技术,目前已经进入样机验证阶段。“我今天来路演,一方面是介绍我们的项目,更重要的是了解其他同行业企业的发展进度和聆听专家的建议,行业内的交流很重要,不能只顾着埋头研究。”王中山坦言。

  活动主题分享环节,两位专家勾勒了“感知—决策”的宏观图景。中国卫星导航北斗产教研创新委员会副主任、长三角AI+机器人产学研协同创新联盟联合发起人魏立龙,以“感知无界 赋能未来”为题,系统阐述了多模态感知技术如何深度变革工业现场。他指出,以高精度工业视觉为牵引,融合力觉、热成像等多维感知通路,结合AI实时分析,正在为智能质检、柔性装配与预测性维护等工业场景构筑精准高效的感知决策底座。新启步增长研究院院长杨磊则从企业增长战略的角度,为硬科技企业的持续突破提供了方法论支撑。

  不可否认的是,多模态感知的发展趋势也在顶层设计和行业动态方面不断得到验证。今年3月,工信部等九部门联合印发的《推动物联网产业创新发展行动方案(2026—2028年)》,明确将“多模态感知”列为亟需突破的关键技术之一;紧随其后,5月23日,国际智能感知学会正式揭牌成立,标志着这一领域全球范围内的协同创新迈入组织化、常态化的新阶段。

  嘉兴也在积极推动和探索多模态感知领域的科研攻坚。

  北京理工大学长三角研究院相关负责人在活动上表示,研究院正致力于打通从技术研发到场景落地的“最后一公里”,为嘉兴乃至长三角构筑坚实的智能感知智力底座。李德视觉科技(嘉兴)有限公司瞄准“AI+机器视觉”的千亿级赛道,从新一代软硬一体化工业视觉方案出发,落地产线检测的多元化应用图景。

  在无预设议程的开放对话环节,企业家与专家围绕多模态感知在细分场景中的真实痛点、供应链协同与资本对接展开务实讨论。与会者形成的共识是,多模态感知的未来,比拼的已不再是谁掌握更多前沿技术,而是谁能更快将碎片化的需求组织成可复用的解决方案,将分散的创新资源编织成协同共生的区域生态。

  多模态感知是感知信息的交互,而“未来场景·战略新兴产业咖会”系列活动联动了行业同一领域专家和企业之间的信息交互,链接最新技术路径、同步行业发展动态。市科技局相关负责人表示,每月一期的未来场景咖会将继续以场景开放为纽带,推动更多前沿技术从实验室走向生产线,为本土产业向高端化、集群化升级注入持续动能。

2026-06-01 从“看清”到“理解” 4 4 嘉兴日报 content_289070.html 1 3 嘉兴举行专题咖会探路多模态感知 /enpproperty-->