9月26日,第四届中国科技产业化促进会科学技术奖获奖名单公布,卓视智通公司参与的“多模态场景理解与通感一体化关键技术与应用”项目荣获科技创新一等奖。
中国科技产业化促进会科学技术奖是经国家科学技术奖励工作办公室批准备案设立的社会科技奖项(奖励编号0255),目的是充分发挥奖励工作在调动广大科学技术工作者、企业家及有关人员的积极性和创造性方面的作用,促进科技产业化,助力经济建设和社会发展。
奖项的获得凸显了卓视智通在科学技术领域首屈一指的创新能力,其参与或主要完成的研究成果、技术发明达到了国际先进水平,是行业技术进步和产业升级的“排头兵”,更是国家科技战略的重要支撑。
中国科技产业化促进会(简称科促会)是经民政部批准,成立于2009年,由从事科学研究、科技成果转化和产业化、科技金融及致力于科技产业化发展的企事业单位和个人自愿结成的专业性的全国性的非营利性的社会组织,主管单位是科学技术部。科促会以党的二十大和习近平新时代中国特色社会主义思想为指导,紧紧围绕国家创新驱动发展战略和人才强国战略,搭建科技服务平台,优化科技发展环境,营造良好的“双创”氛围,促进科技金融和军民融合深度发展,推动科技成果转移转化和科学技术进步, 提升我国自主创新能力和企业核心竞争力。
“多模态场景理解与通感一体化关键技术与应用”项目重点围绕复杂场景的目标特征识别、图像实例及语义分割、三维重建、多模态融合及生成等关键技术展开研究。结合新一代图像理解及生成式人工智能技术,对智慧城市、医疗、交通等复杂场景进行细粒度、多维度的精准特征识别、位置测量及内容理解,进一步结合光通信网络实现数据节点间高通量低延时通信,实现对多中心多节点间实时交互式计算,为构建“端-边-云”一体的数据高效感知、理解和通信提供了系统化解决方案。
在技术创新性方面,项目构建了图像、音频、视频与文本间多模态生成算法,提出了多维知识驱动的图像标题生成新方法以及基于扩散模型的音频标题生成方法,系统解决了数据稀疏标注、域迁移、强干扰等非理想数据条件下的图像特征识别及多模态融合的瓶颈问题,设计了端边云协同计算的目标高精度检测与识别算法体系,完成了单点位目标检测、融合、跟踪与特征提取,并将单点位检测结果附带同步时间戳,输出到边缘计算设备(或数据中心)进行跨镜头多点位的全时空接续跟踪与匹配。
在项目的推广应用方面,卓视智通借助多模态场景理解与通感一体化关键技术与应用,利用视觉 AI 的检测及还原技术,实现对道路交通主体进行精准、实时感知和记录,并在此基础上完成车辆轨迹全域跟踪、轨迹预测和事件还原。该系列产品为现实业务中对于交通态势、应急事件与事故的复现、拥堵治理疏导、拥堵事件推演等需求提供了有效的技术支撑手段,取得了显著效果。
北京卓视智通科技有限责任公司成立于2012年,是国内最早探索人工智能与数字孪生产业落地的科技公司之一。公司专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿人工智能技术的探索,其中车辆识别、物体识别、文字识别、交通场景识别、大数据及数字孪生产品已成功应用于全国20余省市;为首都及多个省会城市提供了全城AI核心引擎;为国内近30省市高速公路提供了道路异常事件分析、车路感知识别系统;为全国近20个智能网联汽车试验场及先导区提供了车路协同感知模块。