本报讯 近日,由国家广播电视总局主办的第四届广播电视和网络视听人工智能应用创新大赛决赛结果揭晓。深圳广电数字科技有限公司(深广数科)携手汕头融媒集团有限责任公司、北京语言大学信息科学学院、北京中科模识科技有限公司和深圳市智想无界科技有限公司五家单位,凭借“基于广播电视节目内容的方言识别算法——以潮汕方言为例”项目,在“智能字幕与译制赛道”中脱颖而出,跻身全国前三,荣获二等奖。
本届大赛旨在推动人工智能技术在广电领域的深度融合与创新应用,自启动以来共收到全国200多家单位申报,经过多轮激烈角逐,最终在算法赛道(智能生成与制作、智能字幕与译制)、方案赛道(智能修复与增强、智能推荐与个性化服务、智能监测与审核)等2个赛道5个赛题评选出37个获奖项目。深广数科汕头融媒联合团队的项目以其前沿的技术思路和实用的场景落地能力,获得评审专家一致认可。
该项目聚焦潮汕方言识别,在数据采集、数据预处理方面立足汕头融媒几十年强大的方言节目内容库,通过优化语料数据、补充多场景视听资料,并基于语音识别架构与迁移学习技术,打造出高准确、高鲁棒的方言识别系统。团队创新性地构建了历时动态数据库、音字同步数据库,以及以普通话为基础模型的方言识别方法,实现多项技术突破。值得一提的是,该项目自启动以来,得到潮汕各社会组织和潮学专家学者的持续关注与鼎力支持,宝贵的本土语料和关键学术支持,为这项技术与文化精准贴合奠定了坚实基础。
作为中国最古老的方言之一,潮汕方言被誉为古汉语的“活化石”,保留着许多古音古义。随着时间的迁移,越来越多的古字古音已濒临失传的危机。一直以来,汕头融媒积极推动该项目的语料库优化完善,除组织专职人员进行语音标注外,还广泛发动社会各界积极参与,得到汕头职业技术学院、汕头市文化艺术学校、市十一中学学生和广大社会热心志愿者的热烈响应。与此同时,由汕头融媒牵头组织的方言语音识别项目录音队伍不断壮大,从中小学生、老师到社会各界热心人士、中老年志愿者,大家凭着对传承潮汕文化的美好愿望,利用课余或工作生活之余踊跃参与录音,线上线下碰撞交流互动,不断提供生动详实的本土特色语料,为提高项目的语音识别准确率筑牢根基。
目前,该方言数据库已覆盖中文一二级常用字、20万条垂直领域术语及5万条潮汕俚语,甚至能精准识别“呾话”“食茶”等特色表达,对潮汕三市主流口音的识别准确率高达93%。接下来,汕头融媒将继续加强与深广数科等合作伙伴的紧密协作,进一步推动该项目从算法模型走向现实场景,围绕智慧城市、智能视听等场景开展深度技术融合与跨界合作,不断推进在智能音箱、车载语音、AI客服、AI玩具、餐饮美食等领域的应用测试与商务对接,致力让方言识别能力成为连接千万家庭的本土化智能服务入口,开创具有深厚文化底蕴的智慧生活新生态。