已在今年斩获八项“世界冠军”的科大讯飞再加一冠,在近日刚结束的2018年国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation,简称IWSLT)中,科大讯飞以在英德方向语音翻译任务上端到端模型(End-to-End Model)显著优势获得第一,基线模型(Baseline Model)获得第二的优异成绩,充分证明了自身在语音翻译领域的国际领先地位。
IWSLT是国际上最具影响力的口语机器翻译评测比赛,每年举办一次,至今已经举办了15届。IWSLT 2018 吸引了世界各地多所机器翻译领域的知名大学及研究所参加,包括英国爱丁堡大学(University of Edinburgh)、美国约翰霍普金斯大学(JHU)、德国卡尔斯鲁厄理工学院(KIT)、意大利Bruno Kessler 基金会(FBK)、芬兰赫尔辛基大学(Helsinki),以及国内的阿里巴巴、搜狗等。
本次比赛包括两个主要任务,一是语音翻译任务,评测数据来自英语到德语的TED演讲真实语音和文本;二是低资源文本翻译任务,数据来自巴斯克语到英语的TED演讲真实文本。科大讯飞结合公司当前讯飞翻译机2.0、讯飞输入法、讯飞听见等产品应用场景,参加了语音翻译任务评测。
语音翻译目前主要有两种实现方式,一是传统基线模型(Baseline Model)方案,对输入语音先进行语音识别得到文本结果,然后再进行文本机器翻译英语口语测评软件:科大讯飞再获国际口语机器翻译评测大赛冠军,实际应用中由于复杂环境下语音识别错误的存在,导致误差扩散影响最终语音翻译性能;二是采用最新提出的端到端模型(End-to-End Model)方案英语口语测评软件,基于神经网络强大的建模能力,输入语音直接输出目标译文。本次语音翻译评测任务,主办方对两项技术分别进行了评测。
科大讯飞基于语音识别和机器翻译上的深厚积累,将最新深度学习研究成果成功应用于语音翻译任务英语口语测评软件,不仅在传统基线模型上获得第二名的成绩,同时通过核心源头技术创新在最新的端到端模型上勇获第一。这是在科大讯飞继2014年IWSLT中英翻译取得冠军以来,再次在此项比赛中获得重大突破,充分证明了公司在语音翻译领域的国际领先地位。
此外,这也是科大讯飞今年以来在智能语音和人工智能国际权威竞赛或评测项目获得的第九个世界冠军,此前斩获佳绩包括——
2018年10月,在国际自动驾驶领域权威评测任务Cityscapes上,科大讯飞团队刷新了全部两项子任务的世界纪录;
2018年9月,在国际权威英文语音识别大赛“CHiME-5”中,科大讯飞包揽全部四个项目的第一名;
2018年7月,在CGED 2018中文语法错误自动诊断大赛上,科大讯飞综合排名第一;
2018年7月,在国际权威英文语音合成比赛中连续13年蝉联世界第一,仍然是语音合成自然度指标全球唯一超过真人说话水平的公司(获得10个测评项目中的9项第一,在最关键的自然度和相似度评测指标上均大幅领先第二名);
2018年6月,在由模式识别领域国际学术顶会ICPR举办的MTWI(Multi-Type Web Images,多样式网络图像)国际识别挑战赛中,荣膺“文字识别”、“文字检测”和“端到端识别”全部三项冠军;
2018年3月,在由医学影像领域的国际顶级会议ISBI举办的IDRiD糖网病挑战赛上,取得微动脉瘤分割任务第一名、其余三项任务前三名的佳绩;
2018年2月,在由国际计算语言学协会(ACL)下属组织主办的第十二届国际语义评测比赛(SemEval2018)中英语口语测评软件,斩获基于常识的机器阅读理解全球第一;
2018年1月,机器阅读理解SQuAD阅读理解大赛再次刷新世界纪录,EM得分超过人类平均水平(参赛者包括微软、谷歌、Facebook、IBM、Salesforce、斯坦福大学、卡耐基梅隆大学、清华、北大等国内外企业和科研机构);
基于在语音识别和机器翻译核心技术上的深厚积累,科大讯飞也推出了相关的“爆品”。早在2016年年度发布会上,首发业界有重大影响的讯飞翻译机和具备多语种翻译的讯飞听见智能会议系统两大语音翻译类产品。据悉,此次IWSLT2018语音翻译比赛任务上的技术突破,将会与科大讯飞其他核心人工智能技术相结合,进一步协同提升这两款产品及其他后续迭代产品的语音翻译性能。