近日,浦东新区科技和经济委员会公布了2021年度浦东新区科技发展基金产学研专项(人工智能)资助名单。传音控股和华东师范大学联合申报的项目“基于认知理解生成的开放域跨语言知识图谱构建与应用”成功获批。双方在自然语言处理、知识图谱、跨语种知识迁移等技术的系统研究和合作成果获得评审专家的认可,并将推动相关技术在新兴市场智能语音对话系统领域的落地应用。
近年来,随着深度学习技术的进步,汉语、英语等大语种自然语言处理技术日趋成熟,并在语音对话等方面获得广泛应用。但要构建一套跨越众多细分生活领域、覆盖多种语言的智能理解和对话系统,仍然面临着部分垂直领域、小语种语料不足以及对于海量数据人工标注的依赖。部分场景下数据难以获取、难以标注、难以评估且语言专家稀缺,成为行业研究难题,距离实用门槛仍有较大差距。
该申报项目聚焦在非洲、南亚等传音智能终端目标市场,深度调研本地生活与语种。基于在市场深耕多年的人力与渠道优势,传音持续低成本采集、标注语料数据,为算法模型输送海量的高质量语料,解决了小语种语料稀缺与成本高昂的问题。同时研究多形态信息抽取、低资源条件下的认知理解和推理、跨语言知识图谱构建及对齐等算法,降低对于小语种、细分领域的语料标注依赖,同等语料量下提升了语言认知理解的准确率。
项目将构建起一套跨语言的开放域服务系统,最终赋能传音智能手机的语音交互、对话等场景,以便捷实用的功能辐射用户生活、工作、出行与娱乐,形成本地化的AI内容服务生态。
除了打造非洲、南亚地区本地化多语言认知服务,构筑传音自身的产品壁垒,项目所形成的自然语言处理技术解决方案,也将持续释放“红利”,加快国内人工智能技术在海外新兴市场的渗透率及覆盖率。通过赋能行业伙伴出海,在客服、教育、IoT等多领域进行创新,项目成果将助推新兴市场行业融合、发展数字经济,以技术创造更多社会价值。