搜狗击败讯飞阿里,获IWSLT国际口语机器翻译评测

 头条123   2025-01-12 16:54   753 人阅读  0 条评论
搜狗击败讯飞阿里,获IWSLT国际口语机器翻译评测

克日,正在方才闭幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级白话机械翻译评测年夜赛上,搜狗击败讯飞、阿里巴巴, APPTEK(美国利用科技公司)、AFRL(美国空军研讨尝试室)和KIT(德国卡尔斯鲁厄理工学院)等国际海内多个微弱敌手,一举夺得了2018年IWSLT年夜赛Baseline Model(基线模子)赛道冠军,代表中国向天下彰显了AI范畴的手艺硬气力!

表1 IWSLT年夜赛Baseline Model赛道终究成果

--取自IWSLT官方发布结:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

那是搜狗继WMT 2017机械翻译顶级评测年夜赛夺冠以后,所戴得的又一翻译范畴的手艺桂冠。短时间内持续登顶天下 一的位置,充实证实了搜狗正在翻译行业出格是白话翻译范畴已位居抢先职位。

IWSLT是甚么角逐?

IWSLT是国际 具影响力的白话机械翻译评测角逐,从2004年起头已举行了15届。每届角逐都吸引了天下各地机械翻译范畴的着名企业和研讨机构介入,本届角逐吸引了讯飞、阿里巴巴等海内公司,爱尔兰ADAPT中间,美国约翰霍普金斯年夜学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基年夜学,英国爱丁堡年夜学,美国AppTek公司等多家国际着名年夜学、研讨机构和公司加入。

表2 IWSLT2018年夜赛参赛环境

--取自IWSLT官方发布成果:

:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

本届IWSLT 2018的白话机械翻译使命首要评测基于指定命据集从英语到德语的语音翻译才能,共分为Baseline Model(基线模子赛道)和End-to-End(端到端赛道)两个赛道,此中Baseline Model赛道首要评测语音翻译的流水线计划,输进语音先经由过程语音辨认体系获得语音辨认成果,以后将成果送进机械翻译体系取得译文,那也是业内 支流、结果 好的语音翻译处理计划,市场上商用机械同传、翻译机等语音翻译类产物几近都采取了近似的方式;End-to-End则是本次评测新增设的赛道,首要鼓动勉励参赛方摸索基于神经收集的端到端语音翻译处理计划,但愿可以或许输进语音,基于深度神经收集模子间接输出译文,这类方式今朝仍处于初期研讨阶段,受造于语音-文本平行语料难以年夜范围收集、算法研讨不成熟等身分的限定,间隔商用仍存正在较年夜间隔。本次评测中,正在练习集、测试集不异的环境下,Baseline Model赛道 好的体系获得了28.09的BLEU(机械翻译量量评价目标,值越年夜代表翻译量量越好),而End-to-End赛道 好的体系仅获得了19.4的BLEU,较Baseline Model赛道相差8.69个BLEU,差异很是较着,也证实了Baseline Model赛道评测的算法还是今朝 可行和适用的处理计划。

搜狗本次加入的是Baseline Model赛道的评测,并获得了 一位的好成就。评测使命面向TED演媾和年夜会学术陈述场景,测试集包罗来自英国、欧洲、印度等各个国度的英语演讲者,存正在噪声、口音、自在表达等庞大语音征象,同时说话中存正在年夜量范畴专着名词和白话化的表达(如:年夜量语气词、毛病语法表达等),具有极强的实战意义和应战性。终究,搜狗提交的体系BLEU值到达28.09,抢先排名 二的科年夜讯飞1.6个BLEU,证实了搜狗正在白话机械翻译范畴壮大的气力。

AI赛道中延续发力,搜狗领跑语音翻译行业

搜狗的AI计谋蓝图当中,说话是 焦点的重头戏。一向以来,搜狗都对峙着“天然交互+常识计较”的野生智能焦点标的目的,并延续深耕手艺,鞭策手艺向产物的快速转化,2016年,搜狗公布了自有人机交互处理计划-知音引擎。具有充沛实在语料数据上风的搜狗,将语音辨认与机械翻译手艺相连系,并正在2016年推出了环球首款商用AI同传体系-搜狗同传,引领了语音翻译手艺的提高与利用。经由过程数百场的国际集会“实战”,搜狗同传取得了无数媒体和不雅寡的好评,成为当下炙手可热的“AI字幕君”。

与此同时,搜狗也推出了一系列的智能硬件,将语音翻译手艺利用到了更广漠的场景当中,帮忙用户突破了跨邦交流时的说话窘境。2018年3月,搜狗推出了搜狗观光翻译宝,具有离线翻译功用与摄影翻译功用,让马化腾都为之心动,正在伴侣圈里年夜打告白。做为首款智能翻译硬件,它撑持42种说话对话翻译,处理了旅游场景顶用户听不懂、看不懂、不会说等实在痛点。该项产物正在京东平台首发当日即告售罄,首日发卖额破万万。与此同时,搜狗还推出了灌音翻译笔,供给灌音转写、对话翻译、同声传译等功用,把AI同传落地到了消耗级产物当中,开辟了语音翻译的新航道。

尽人皆知,野生智能是将来科技的风向标。经由过程此次正在IWSLT角逐中的优异成就,能够看到以搜狗为代表的国产科技巨子企业,已表示出了引领行业的手艺硬气力。

本文地址:https://www.toutiao123.net/news/26502.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!