标准是社会高质量发展的重要技术支撑。党的二十大报告明确指出,稳步扩大规则、规制、管理、标准等制度型开放。
近日,由鹏城实验室牵头制定的全球首个端边云协同技术的国际标准——数字视网膜系统国际标准(以下简称标准)在国际标准化组织电气和电子工程师协会标准学会(IEEE SA)正式发布,标志着我国在该领域的标准工作取得重大突破。
标准的主要科研领军人之一、鹏城实验室智能部视觉所所长王耀威告诉记者,相较现有的其他产业应用标准,该标准具有三大优势:可调节注意力,能够挖掘低密度的数据价值;软件可定义,充分优化了整个传感基础设施的灵活性;隐私保护,有效弥补了现行标准在隐私保护方面的欠缺。
着力破解超大城市海量视频数据处理难题
随着近年来城市规模的扩张与需求的复杂化,超大城市在公共安全与交通治理上迎来了巨大挑战。传统的视觉感知系统已无法满足城市海量视频数据的处理分析需求,难以支撑城市治理应用。
“例如,传统监控摄像头为‘一对一’模式,在此模式下,海量高清视频数据的传输对系统带宽带来很大压力,极大影响了城市治理效率。”王耀威表示。
为着力破解超大城市海量视频数据处理难题,鹏城实验室主任、中国工程院院士高文率先提出数字视网膜这一重要概念。他强调在摄像头中嵌入芯片,将摄像头获取的视觉数据经过高效编码和紧凑特征提取后,传送给“城市大脑”,以便更为高效、灵活地检索和分析。
基于此,鹏城实验室成立团队开展研究,并在原有的“视频编码流+特征编码流”的“双流”模式基础上,进一步提出了“三流”模式,创新性地增加了模型更新流,大大加强了该系统应对城市治理等复杂环境的能力。
通过视频流、特征流、模型流的高效协作,团队自主研发的数字视网膜系统实现海量视觉数据的实时处理和时空大数据的分析与挖掘。
“我们提出的数字视网膜标准体系正是基于对数字视网膜系统的研究。”王耀威表示,该标准体系包含12个板块,此次发布的国际标准是首个板块“总体架构”,完整定义了数字视网膜系统的整体框架。
服务全球人工智能技术与产业发展
值得一提的是,该标准提出了“特征实时汇聚、视频按需调取、模型在线更新”的视觉计算系统新范式,既降低了系统内数据传输压力,又缓解了云上的集中计算压力,且模型可更新、功能可定义的技术特性能够灵活支撑各种应用,实现对视觉大数据的实时分析和处理,解决了传统视觉系统在带宽、计算、存储等方面的资源瓶颈。
研发过程中,因端边云协同涉及的供应商众多,且技术创新和产业需求之间存在错位,这套标准体系的建设困难重重。
为解决互联互通问题,鹏城实验室综合考虑全球学术界和国内外厂商的意见,基于不同技术形态,从技术和行业发展趋势的角度引导各个厂家形成统一的技术框架;为应对需求错位的问题,对数字视网膜系统开展了多个应用试点。
2022年初,鹏城实验室联合产业合作单位成立了数字视网膜标准工作组,正式开启了数字视网膜系统的国际化进程。历经多轮优化完善,系列国际标准的第一部分终于顺利发布。
目前,鹏城实验室已与多个产业龙头企业合作,将基于数字视网膜的大规模视频智能处理技术赋能智慧城市应用,在智能交通领域初步构建了应用生态,相关技术已推广至武汉、长沙、西安等数十个大中城市和地区的智能交通、智慧安防等建设项目中。
高文表示,鹏城实验室将加速推进数字视网膜系列标准的建设,打通从研发、生产、测试到应用的全过程,为推动产业链、供应链、价值链、创新链深度融合提供坚实的标准支撑,服务全球人工智能技术和产业的发展。 来源:科技日报