有道词典离线包怎么用(有道词典离线包)
谷歌翻译“平替”?我们早就有了翻译 App 更优解
“你知道吗?谷歌翻译退出中国了!”当我这样告诉朋友时,只收获了他们有些嫌弃的目光:“这都两周前的老新闻了,你怎么才知道?”
我笑着掩饰尴尬,作为一个经常需要翻译功能的人,连如此“行业大头”退出市场都不知道,确实有些不太合理。
如今,谷歌翻译的网页,只能跳转到谷歌首页;谷歌开发的 Chrome 浏览器取消了翻译功能;谷歌翻译 app,也彻底不能联网使用了。
甚至翻译不出一个苹果
谷歌官方表示,翻译功能退出中国是因为“使用率低”——这倒解释了我对这件事后知后觉的原因。
毕竟,我有更多、更好的选择。
曾经的谷歌特色,如今的全民标配
试问,哪个 80、90 后,没有用过谷歌翻译学习英语?多年前,我也是谷歌翻译的忠实用户。也曾被它通过相机翻译菜单、路牌的功能所震撼。
现在想想,除了对着照片翻译,谷歌翻译的对话翻译和准确性,也是我当年选择它的理由。没错,当年。因为这几个让我动心的亮点,早已成为了翻译 app 的标配。
现在,我常用的翻译 app 有网易有道词典,腾讯翻译君和 iPhone 自带的翻译 app 也偶有使用。腾讯翻译君主要用小程序,在微信聊天时图方便,iPhone 自带的翻译主要用于单词翻译。
在这里,就用网易有道词典为主,来展示下如今翻译 app 的魅力吧。
更会玩的拍照翻译
首先就是谷歌的拍照翻译功能,只需在 app 中打开相机,就能识别屏幕中出现的外文并进行翻译,也可以从相册中选择图片翻译,便捷实用。
而这一功能,通过网易有道词典也能实现。
如果只是如此,那并不能让我放弃谷歌翻译,但网易有道词典将「拍照翻译」这件事,可谓是玩出了花。
拍摄一页英文,app 就会框选所有单词,并标注出重点词汇。
点击任意单词,就能查阅释义和发音,或者更进一步,在《牛津词典》《柯林斯双语词典》《韦式国际英语词典》等专业授权辞书中查阅单词的详细解读、例句,并记录下你的学习笔记。
阅读英文时,大多情况下我只是有个别几个单词不认识,网易有道词典也能化身“词典笔”,不用全文翻译,哪个单词不认识,将摄像头对准它就能知道意思。
即使是最基础的拍张照片翻译图片中的文本,你也可以通过涂抹、取词等方式,更加高效准确的完成翻译工作。
有的人翻译是为了知道含义,有的人则是为了学习提高。有时我只需要知道路边一个单词的意思,有时却需要在褶皱的书页中找到我需要的那句话。有道词典的这些功能并不是为了不同强行创造需求,而是在综合了大家的使用场景后,不断精进迭代的结果。
谷歌翻译确实解决了基础的拍照翻译场景,但它只适合平整界面上的内容翻译,当你看到手机屏幕上翻译的文本不断跳动改变、无法显示准确含义时,就会知道网易有道词典涂抹取词的设计是多么的巧妙了。
当然了,一般拍照翻译,你也可以用腾讯翻译君小程序实现,同样很好用。
更有“对话感”的对话翻译
除过拍照翻译,谷歌的对话功能我也很常用,点击首页中间的“话筒”,就能实现对话翻译了。谷歌提供了超过 70 种语言的对话翻译,在语种支持方面,谷歌确实有国际大厂的风范。
不过,谷歌的对话功能有一个问题,那就是识别率。在使用双语翻译时,它虽然能同时聆听两种语言,但似乎判断不清该在何处停止识别,反应总是慢半拍。
再加上界面比较传统(或者说老旧),互译时总找不到自己说的那句话。作为对比,同样是国外厂商,苹果的翻译 app 都知道对话时通过对话形式来区分说话对象。
苹果翻译(右)会用界面来提示对话者
而网易有道词典的对话翻译,会让你深刻感受到什么叫优秀的本地化。
有道词典也会将对话的双方分列在界面两侧,如同聊天软件一般,方便用户查看,历史信息也一目了然。谷歌翻译除了老旧的翻译界面,对话历史也像真的对话那样,消失在网络中,不知道“你刚刚说什么”这句话,是不是谷歌翻译最多的一句话。
总的来说,有道词典的对话翻译功能,更加符合“对话”的逻辑。
去年,有道词典的对话翻译功能还只是支持了常用的中英日韩、粤语文言等超过 40 种语言及语言分支,如今已经有 65 种了,如果是直接翻译,更是达到了 109 种。“国际大厂的风范”,有道也有。
同时,有道还能实现中、英、日、韩、法、俄、德、西班牙、粤、越南、泰等 11 种语言及语言分支的自动检测,如果你进行这些语言的互译,不用切换按钮,只需点击下方的话筒就可以直接进行对话。
中英文可以自动识别
乌尔都语(小语种)则需要点击对应按键
另外,作为一款全面的英文学习 app,有道词典在对话翻译上同样支持更多操作,编辑、收藏、分享、复制,哪怕是对话翻译,网易也希望你能学到更多。
呆板的界面、缓慢的速度(当然如今已经不能用了),谷歌翻译确实需要更进一步。
翻译中文,需要更懂中文的人
当然,好看的皮囊要有精致的灵魂,翻译最重要的还是准确和专业。其实经常进行多语种翻译的朋友应该也知道,或许是中文的博大精深,让翻译专业的谷歌,在“中对外”领域,远近闻名的一言难尽。
日常翻译几款 app 都能胜任,想要对比它们的差异,还得从一些特殊的场合入手,在这里,我就用几个简单的例子,来看看它们的实力。
首先,就是在办公室里最常见的中英混杂,比如“这个 case 很重要,你来 follow 一下”。
我先尝试了三款翻译软件的对话翻译功能,不得不说,苹果翻译错的着实离谱,即使我说得再慢也无确识别。而网易有道词典和谷歌翻译都可以准确识别。
好在手动输入后,苹果翻译终于得出了正确答案。
其次就是网络用语,今天“YYDS”,明天“绝绝子”,我们不评判这些说法的对错,但至少遇到时,我们要有办法翻译沟通。
上面两张图,分别是有道网易词典、苹果翻译和谷歌翻译,翻译结果显而易见,不得不说,中文翻译这方面,还得靠懂中文的人——不仅懂中文,还懂中文互联网。
最后,则是最特殊的专业词汇,比如“continus fever”。这是一种临床常见的发烧症状,指体温上升并持续维持在 39℃~40℃ 的高水平,并达数天或数周,中文专用名词是“稽留热”。
我们尝试用几款翻译软件翻译这个词语,同样只有网易有道词典做出了最准确的翻译,其他翻译 app 的结果都只有“持续发烧”。
使用桌面端方便截图展示
当然,上述例子只是日常翻译的冰山一角,中文的特殊性,让翻译不能只看本意,“油管”可以是输油管,也可以是流媒体网站,“耐撕”可以用来评价布料,也可以称赞队友操作。
相比识别率低、操作繁琐的谷歌翻译,功能简陋、支持语言较少的苹果翻译,在翻译的专业性和准确性上,我还是更愿意相信有道网易词典一些——毕竟,它确实很好用。
有道的网络释义解决了不少问题
从手机 App 到桌面端,翻译也有「生产力」
我彻底放弃谷歌翻译,其实是今年的事,因为桌面端,还是谷歌翻译更顺手一些。但今年年中,网易正式上线了桌面翻译软件网易有道词典 9,从文档翻译、图片翻译,到音频翻译、网页翻译,足够专业,也足够好用。
在电脑上,我最常用的翻译场景有两个,一个是网页翻译,一个是文档翻译。一般来说,网页翻译靠 Chrome 浏览器自带的翻译插件,文档翻译则靠复制粘贴。而这两个场景,网易有道词典 9 都有不错的解决方案。
首先是网页翻译,偶尔遇到不认识的单词,只需将鼠标指针放在单词上,有道词典就会显示出含义,体验几乎没有延迟。
如果遇到大段文本看不明白,也可以通过快捷键截图翻译,除了常规的复制分享,还能把翻译后的文本钉在屏幕上,方便对照学习。
同时,网易有道词典 9 还提供了丰富的离线数据库,如果你是学生,或者像我一样需要经常外出办公,下载离线语音包,不用网络也能学习办公。
这个体验,让我回忆起流量还很宝贵的年代,用有道词典 app 背单词的日子,离线资源包,真是我最喜欢的功能。
注意,上述功能与谷歌翻译或者 Chrome 浏览器的翻译功能不同,并不仅限于浏览器,你可以在系统的任何位置进行取词、截图、翻译、分享,大大增加了翻译功能的使用场景。
为了多设备同步信息,我是 Safari 浏览器的重度用户,有道词典 9 在一定程度上,让我摆脱了 Chrome 浏览器的束缚,工作更加自如。甚至也敢把系统彻底设定成英文,也不担心出现设备异常时看不懂系统提示——毕竟,我有有道词典这么一个全局可用的翻译助手。
本地文档也能翻译
虽然已经毕业多年,但因工作偶尔也有论文查阅需求,网易有道词典 9 在论文阅读方面的体验,用四个字来形容,就是“超出预期”。
首先,网易有道词典 9 竟然与 ReadPaper、Aminer 等顶尖机构深度合作,内置了论文检索功能,覆盖 40 种以上专业领域、3 亿文献资料,支持多种检索方式。
网易有道词典 9 不仅能搜能看,还能直接下载阅读,而最让我惊讶的,还是翻译——只需将文档拖入软件,就可以在保留原文排版的同时,完成内容翻译,对找查看非常方便。
手机 app 中作文批改的功能也加入了桌面端,可以智能识别并修改常见的 200 种常见错误,学术交流无需大费周章。
最最主要的是,只要验证了大学生身份,就可以不限字数的使用论文翻译功能,作为毕业老鸟,真的是羡慕极了。
扫描左下角二维码就可以认证
网易有道词典 9 保持了有道词典翻译一贯的准确,什么牛津、韦式等专业版权词典的收录、超过 100 种语言的互译都是标准操作,而基于有道神经网络翻译的准确性,更不用多说,在这里放上两段翻译对比,大家自行判断吧:
突然发现,桌面端的体验部分,完全忘记对比谷歌翻译的功能了。但看到这里的你,觉着还需要对比么?
从我个人体验来说,网易有道词典 9 并没有像手机翻译 app 那样广铺功能,而是抓住了桌面端翻译的两大痛点:页面翻译和学术翻译。学生也好,上班族也罢,网易有道词典 9 确实是一款桌面翻译神器。
如果你登陆网易有道词典的网页,就会看到「史上最强大的桌面翻译软件」这句略显嚣张的宣传语,你有什么办法,人家确实是。
“使用率低”,谷歌诚不欺我
今年 6 月,Kindle 宣布退出大陆市场,在老用户的遗憾声中,我们听到的,更多是“早就用国产阅读器了”的声音。
回到翻译类 app 上,早在 2020 年,有道词典官方宣布用户突破 5 亿,同年第三方调研机构艾瑞数据显示,有道词典在词典翻译类 app 的市占率超过 70%,如今更是超过 9 亿累积用户,月活超过 1 亿——不是没有人用翻译类 app,只是大家选择了更好的那一个。
谷歌以“使用率低”为由退出中国市场,我是相信的。
不论是从翻译精准度、速度等体验专业翻译实力的地方,还是划词翻译、论文对比等符合国人使用习惯的操作里,都可以看到网易有道词典最大的特点:懂中国人。以网易有道词典 9 的论文翻译为例,从检索翻译,到写作修改,可谓是一站式的解决了学术场景的翻译需求。这样的本地化体验,只有国内的翻译 app 才给得到。
谷歌翻译退出中国市场可惜吗?我觉着可惜,因为我希望看到谷歌翻译在翻译 app 的“内卷”中拿出更出色的翻译解决方案,给我们带来更好的体验。那谷歌翻译退出中国市场遗憾吗?我并不遗憾。
不论是网易有道词典,还是其他翻译 app,都在用更高质量的品质和与用户更友善高效的沟通,为我们提供着更便捷、更多元、更符合场景的翻译体验。
不论谷歌翻译是否退出中国市场,广大中国用户的翻译需求,都有更好的选择。
专业且万能的学英语神器!有道翻译官4.0新体验
很久很久以前,我们学习英文的时候,除了纸质字典,还有一个在当时属于比较先进的电子词典,能查词义能听发音还有小游戏,这让电子词典成为了当时风靡之物。
不过到了现在,硬件版的电子词典已经逐渐的没落,因为人们只需要在电脑或手机上安装上一款词典软件,就可以完全替代硬件版的电子词典功能了。
词典软件有许多,今天我们就来看看有道出品的有道翻译官4.0新版本,看看它都有着哪些实用功能可供大家使用。
图1 有道翻译官主界面
选择身份卡 推荐适合内容
首次使用有道翻译官,一开始的时候会有个身份卡的选择,用户可以根据自己的身份来选择对应的身份卡,而有道翻译官也会根据用户的选择来在首页推荐不同的内容,对于小于14岁的用户,有道翻译官还支持青少年守护计划。选错身份卡也不用急,在用户设置选项中还可以进行重新选择。
图2 身份卡选择 图3 青少年守护计划
支持语种丰富 提供的资料不少
先来看看有道翻译官的基本功能——翻译。
有道翻译官支持非常丰富的各国语言翻译功能,其中覆盖了许多小语种。
用户只需要在首页的输入框中输入需要查询的单词或短语,就能获得翻译结果。
在中→英翻译中,除了给出了英文单词以及释义外,还给出了中文的现在汉语释义。点击英语单词可切换到英语整体释义界面,这里包含了该单词的英美读音,释义以及牛津、韦氏、柯林斯的词典翻译结果。还为用户提供了第三人称、现在分词、过去式、过去分词、近义词,反义词等的资料。
图4 中→英翻译结果页面 图5 英语整体释义界面
往下翻还能找到有道翻译官为用户提供的例句、词组短语、网络释义。
图6 例句
无需输入 拍照可翻译
有道翻译官支持拍照翻译功能,遇到不认识的文字,无需手动输入,拍照即可获得翻译结果。
图7 拍照翻译原图片 图8 拍照翻译结果图片
无网络时仍可用 离线翻译功能
有道翻译官支持离线翻译功能,这对于去到国外时无网络的情况下是非常实用的功能,用户可以预先下载好离线翻译包资源,以便在无网络环境中使用,拍照翻译功能也支持离线翻译哦。离线翻译功能免费使用,这就比某软件厚道多了。离线翻译支持拍照翻译及语音翻译。
图9 下载离线包 图10 拍照翻译功能支持离线翻译
即点即译 屏幕翻译功能
有道翻译官支持屏幕翻译功能,用户可以通过拖动浮球到屏幕中需要翻译的词语之处,有道翻译官就会自动识别文字并给出翻译结果。也就相当于电脑里的即点即译。
图11 屏幕翻译功能
即说即译 充当翻译
有道翻译官支持语音翻译功能,可以通过录音形式来将语音进行翻译。除了录音翻译外,还支持同传翻译功能,可以实时的翻译所识别出来的语音内容。此外还支持对话模式,适合于外国人沟通时使用。
图12 语音翻译结果
能打分的复读机 一键跟读功能
有道翻译官支持一键跟读功能,这个功能就有点像之前流行的复读机,用户可以用它来跟读单词,跟读后有道翻译官采用AI实时智能纠音,给出用户读音的准确度,以及提供发音要点。
图13 评出读音准确度 图14 提出发音要点
个性化字典 必备指数与考点
有道翻译官有个性化字典功能以及单词必备指数,它会根据用户的身份卡来提供对应的个性化字典,并且给出了该单词的必背指数,包含在五年真题中出现的次数,还提供了具体考点资料。
图15 个性化字典及单词必备指数
其它的一些附加功能
有道翻译官拥有单词本功能,单词、句子用户想要的均可收藏,方便随时复习,并且支持云同步。
每日一句功能则采用了精美的日历形式来推荐每日佳句,并且提供了该佳句的纯真英文读法。用户亦可切换到跟读模式来练习发音。
图16 单词本功能 图17 每日一句
文档翻译功能支持上传本地文档(PDF/DOC/DOCX)来进行整篇文档翻译操作。此外还有出国急救包,这里提供了常用的语句并分类存储,方便用户快速进行调用。
图18 文档翻译功能 图19 出国急救包
总结
怎么样,这个功能丰富的有道翻译官你喜欢不,有翻译要求的你不妨一试。
有道词典辅助英语学习,难点也会变得如此简单
不得不说现在的孩子们学习压力真的是太大了,之前孩子上小学的时候还好,我们还能简单地给孩子辅导一下家庭作业,但自从上了初中之后,面对逐渐增多的课程,孩子显得非常吃力,而且我们也不再具备辅导的能力了,尤其是英语学科。有一次和朋友聊天的时候谈起这件事,朋友告诉我,可以为孩子准备一支词典笔,并为我推荐了这款有道的产品。
教材适配,官方合作
在朋友推荐之后,我在网上看了不少词典笔进行了简单的对比,发现这款有道词典笔确实不错。因为孩子所在的学校用的是人教版的教材,而这款词典笔是有道官方和人教版官方合作发行的产品,教材适配性较好,而且点读的时候都是教材配置的原因,这样孩子在课后也能很好地跟进学习进度,在课堂上没有听懂的内容,回到家后可以通过词典笔完善。而且它的扫描很准确,用了这么长时间没发现有遗漏的情况。
离线使用,放心安全
虽然我不是那种特别严格的家长,但为了孩子能更专心学习,在平时我很少允许孩子上网,也比较担心网络上一些不健康的内容会影响到孩子的身心健康。这款有道词典笔给我一种非常放心的感觉,因为它支持离线使用,买回来的时候我们为孩子下载了对应的教材版本以及一些相关的学习资料,所以在没有网络的情况下也可以正常使用,更方便,而且也比较令人放心。配合内置的200多万词库,用起来很轻松。
正规发音,口语练习
我一直都觉得,孩子在英语学习方面有一定的短板,其中比较明显的就是口语,在课堂上没有足够的机会练习,回到家我们又没法辅导,长此以往对孩子的学习非常不利。现在就不担心这个问题了,这款有道词典笔可以陪孩子一起练习英语口语,它有着非常正宗的美式发音,在使用的过程中,如果孩子的发音有错误,它也会及时纠正。我发现孩子还挺喜欢这个功能的,有时间就会练习,我感到非常欣慰。
AI翻译,更加准确
根据孩子目前的学习情况来看,比较大的难点还是英语的翻译,有很多单词不懂,而且很难做到准确翻译。不过现在,这个问题同样可以交给有道词典笔了。它拥有品牌自研AI技术,可以准确地识别每一个单词,而且额翻译出的内容更人性化。我们尝试过,把同样的单词输入一些网上的翻译软件,译出的内容就是死板的机翻,但有道词典笔翻译出的内容更贴近生活,容易理解。
结语:现在给家里的孩子使用有道词典笔已经有一段时间了,据他自己说,现在感觉学习英语比之前轻松多了,这对于我们和孩子来说都是非常大的帮助。现在很多家长可能和我们一样,不太擅长辅导孩子的功课,也没有充足的时间,那就把这些问题都交给有道词典笔吧!
网易有道词典一个小更新,消除了你和全球一半人类的沟通障碍
机器之心报道
作者:泽南
完全不懂外语的你也可以拿起手机,和老外直接对话了:甚至不需要选择彼此说着的是什么语言。
遇到看不懂的单词时,很多人会想到打开网易有道词典 app 查询。最近使用这个 app 的同学,可能会注意到一个新增的功能:
有道词典的「对话翻译」功能,现在可以自动检测语言了。
除了自动识别语种,有道词典还可以实现近乎实时的「同声传译」,延迟不到一秒,而且在大多数 iOS 或安卓的智能手机上都可以实现。有了这样的技术,两个说着不同语言的人,只需要一个安装了有道词典 app 的手机,就可以进行实时顺畅的对话交流了。
这种神奇的功能,现在支持 11 个语种互相翻译,这就意味着可以覆盖全球超过一半的人口(有道词典手动选择语言互译的话,则支持 44 种语言)。
语音识别语种,用的是图像识别模型
让手机快速自动识别语种,看起来是一个简单的小功能,却大幅度提升了使用的便捷性。在这背后,研发团队投入的工作也是个有趣的故事。
目前人们每天使用的机器翻译软件中的语音翻译,一般都遵循着类似的工作流程:人口中说出的话,经过语音识别(ASR)系统转换成文字,再通过神经机器翻译模型(NMT)转换为目标语言,最后再通过语音合成(TTS)系统转换成目标语言的语音才算完成。
语音翻译的级联模型(图片来自 MSRA)。
这样一套自动流程也有手动的步骤——需要预先由使用者选好转换语言的类型。有道新上线的功能直接省去了这一步骤:通过在整个级联流程的最前端加入语音活性检测(VAD)和自动语音识别技术(LID),现在你在不用切换翻译种类的情况下,就能和人即时展开对话了。
有意思的是,有道识别语音的 LID 模型,源自在图像识别领域大放异彩的 ResNet(残差神经网络)。在人工智能业内,这是一个「你必须要知道的模型」,ResNet 曾大幅刷新了 ImageNet 竞赛的记录,并启发了众多计算机视觉的新方法,但在语音领域,用 ResNet 的落地技术还比较新鲜。
为了让擅长识别图像的 AI 模型能够处理语音内容,有道开发者们对原模型进行了特殊的修改和配置。在有道词典使用的 LID 方法中,图像 RGB 的三通道输入被修改为语音的单通道,神经网络模型也被压缩到了仅有 2Mb 大小,让其可以在离线状态下识别语种。
「另外,图片输入到神经网络中时通常是固定的尺寸,但语音识别领域中,我们经常遇到的是长短不一的内容,」这一新功能的主要贡献者,有道 AI 语音算法工程师王海魏表示。「我们认为让 ResNet 识别不同大小的内容是可行的方案,因此对模型进行了修改,也获得了成功。」
在有道词典 app 上,翻译对话时语音识别的内容呈现流式过程,随着说话人输入内容的增加,机器判断准确度也在不断提高。当「置信度」到达阈值时,系统就会开始调用随后的流程开启翻译,而有道 LID 给到的语种自动识别最快可以在 0.5 秒给出结果。
由手机端侧 AI 模型启动的过程既解决了翻译准确度的问题,也优化了翻译系统的反应速度。
让手机自动识别语言的原理并不复杂,在目前的应用市场上,iPhone 在最新的 iOS 14 系统中使用了类似的技术。从效果上来看,对于带口音的对话内容,有道的识别效果要好一些。
有道词典 app(左)和 iPhone iOS 14 系统(右)的对话翻译对比。在中文语境下,有道词典给出的结果要更好。
这还是在有道词典覆盖了用户基数更大、机型众多的安卓系统的情形下实现的。
AI 技术落地,没有想象那么简单
「一项技术的真正落地和参与数据竞赛、写论文会遭遇到的挑战完全不同,有时甚至更难,」有道 AI 语音团队负责人李庆说道。
有道的工程师们去年曾经参加了中国计算机学会、西北工业大学、上海交通大学、新加坡南洋理工大学等多家机构联合举办的 INTERSPEECH2020「口音英语语音识别技术挑战赛」。刚刚从学校毕业加入有道的吴昊、王海魏等人,仅准备了十天时间就在口音种类识别和英语语音识别两个赛道上获得了第二名、第三名的好成绩。
在比赛结束后,该团队将研究方案整理成论文发表,在基于目前最流行深度学习模型 Transformer 的技术上,研究人员开发出了一种基于端到端语音识别的口音分类算法,据了解该论文目前也被 ICASSP2021 接收。
有道参加 INTERSPEECH 2020 比赛团队发表的论文。
实验表明,有道提出的方法在测试集上达到了 72.39%的精度,在开发集上达到了 80.98%的精度。在 2020 年 INTERSPEECH 口音英语语音识别挑战赛中,研究人员提交的系统在口音识别任务中排名第二。
更重要的是,他们在比赛中使用的方案,和如今有道词典 app 中上线的功能思路相通。「研究这些属性,归根结底是希望能够提升用户在不同场景下使用产品的体验,」王海魏表示。「我们希望用户能够在遇到不同口音、不同语种的情况下都能获得更好的使用效率。」
相比打比赛,一项技术的工程落地是个长期过程。在有道 AI 团队,人们总是希望产品能够做到接近完美,LID 技术的迭代到最终上线花费了近四个月时间的打磨。
与手机自带系统不同,有道词典 app 需要适配大量不同品牌型号的手机,而其中的一部分可能配置较低,甚至有一些品牌的设备对于录音功能的调用还会存在延迟。一个小小功能的上线,背后是研发人员无数次尝试和努力。
这样的工作很复杂,但有道一直在做。
为什么有道翻译如此好用?
有道翻译拥有一个专注于技术落地的团队,其中算法团队的成员们主要根据业务的需求,调研、设计和实现各种相关算法,训练各类模型。数据团队的成员则不断挖掘高质量训练数据,并根据算法的要求,对数据进行清洗、分类、标注等工作。此外,高性能和研发团队负责优化模型训练的速度,实现推理引擎,优化服务性能,提供在线和离线的翻译能力。
有道 AI 语音团队。
在分工合作下,有道翻译提供的产品不断演进,逐渐成为了国内大量用户的首选。目前,网易有道全线产品月活跃用户 (MAU) 已经超过了 1.2 亿。
经常需要对外文翻译的同学可能会发现,百度、谷歌和有道翻译等系统在不同领域的内容上各有胜负,其实在不同领域上质量的差异,大多是由于训练语料的领域分布引起的。如果为每个领域训练专用的模型可以得到较好结果,但成本较高,如果希望一个模型能够适配多个领域,一方面可以增加训练数据,另一方面也需要在模型,或者训练过程中对领域语料的使用进行优化,如在模型训练时引入领域信息,或者训练时对某些领域的语料进行重采样等。
有道的翻译系统支持用户自定义术语表的扩展,可以根据用户提供的不同术语来实时优化翻译结果,给出正确的译文。
「我们在训练中采取了多任务学习的方式,增加了待翻译文本的领域预测,使得整个系统在翻译不同的领域时都会较好的质量,」有道 AI NLP 团队负责人王瑾玫表示。「另外,在一些对速度不太敏感的应用场景,我们探索了基于领域记忆库的实时优化算法,极大的提升了对应领域的翻译质量。」
中英文混合的内容也可以被有道词典准确识别。
自谷歌 2016 年在翻译系统中整合神经网络(GNMT)已过去近五年时间,而网易有道也紧随其后在 2017 年年初上线自研的 NMT,当前业界使用 AI 翻译的技术相比过去已经有了显著提高,但在一些真实场景中仍然能看到很多亟待解决的问题。即使是在 Transformer 被广泛使用的今天,翻译质量还有不少可以提升的空间,比如低资源甚至零资源语言的翻译质量问题,虽然在多任务学习和预训练模型方法的使用上有了改善,但还可以再进一步提升。
「使用 Transformer 模型也存在缺点,需要根据不同的任务场景进行一些优化,如在长句推理时计算量比较大,堆叠深度时模型能力难以提升,」王瑾玫说道。「因此在有道翻译上,我们对离线应用,深度模型应用等任务上都做了相应的优化。」
有道的硬件产品词典笔现在已经发展到了第三代,除了快速的翻译能力之外,还可以给你的口语发音打分。
一个学习工具,要想从 0 到 1 获得人们的青睐是一件比较困难的事情,目前在教育领域里,像有道翻译这样热门的产品为数不多。另一方面,对于有道来说,从「1 到 1.1」也是一种重要的创新。
未来,有道翻译的算法团队还会沿着应用先进技术的道路前进,让翻译系统支持更多语言,实现更高的准确率,并进一步降低翻译的延迟。
当然,他们也对新技术保持开放。「除了经典方法和流行的技术之外,我们也一直在关注那些未来几年才有希望落地的技术。」李庆说道。
*应要求,文中所列人员皆用化名。*
声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送至邮件举报,一经查实,本站将立刻删除。转载务必注明出处:http://www.hixs.net/article/20240416/169625501786884.html