首页 快讯正文

iOS 14翻译“太懂了”

admin 快讯 2020-09-19 77 0

本文来自微信民众号:数据实战派(ID:gh_ff93f845912e),作者:林檎,头图来自:Apple


2天前的苹果发布会由于低于预期,再为“乔布斯之后,苹果再无创新”的论调添砖加瓦,许多人叹息发布会毫无亮点,没想到2天后,苹果能够依附iOS 14的一项功效更新的惊喜效果登上微博热搜。



“你懂个锤子”——what the f*** do you know?


“瓜娃子”——Dumb-ass。


“不样停车”——Don’t park。


“瓜皮”——Stupid。


“我一把把把把把住了”——I have got a handle。




iOS 14翻译“太懂了” 第1张

苹果、腾讯、有道对“瓜皮”的翻译效果


没错,喜提热搜的即是昔日频频被吐槽落伍的苹果翻译功效。


这个热门话题之下,许多用户晒出了自己使用iOS 14最新内置翻译功效得出的中翻英效果。凭据我们的考察和体验,这些效果引发烧媾和新鲜感的一大缘故原由在于,苹果的机械翻译居然读懂了许多非常规中文表达,包罗方言、网络盛行用语、行话、口误等等具有着名NLP话题“自然语言处置太难了”色彩的表达


,

联博

www.326681.com采用以太坊区块链高度哈希值作为统计数据,联博以太坊统计数据开源、公平、无任何作弊可能性。联博统计免费提供API接口,支持多语言接入。

,

在已往的几年里,苹果一直在努力提高其人工智能能力,机械翻译即是其中之一。这家公司在2016年吸引到了该领域的大牛人物,如卡内基梅隆大学研究员Russ Salakhutdinov。2019年,苹果聘请了谷歌人工智能专家 Ian Goodfellow 作为新的机械学习总监,与此同时,苹果还收购了一家人工智能初创公司Voysis,用以辅助改善Siri。


Siri自己也内置了机械翻译能力,不外,这些能力被以为远比不上谷歌、微软等行业先行者的事情。


直到今年的WWDC2020,苹果正式宣布iOS 14系统,并首次引入基于iPhone神经网络引擎的翻译功效,宣称支持包罗中文在内的11种语言,且用户可通过文章或语音举行翻译识别。据官方先容,翻译APP是凭据iPhone神经网络引擎实现语言转换的,且这个历程是在离线状态下完成,用户不用忧郁会被窃听的风险。


没想到,和苹果强调的离线珍爱隐私这一亮点相比,中英翻译质量乐成“喧宾夺主”。


iOS 14翻译“太懂了” 第2张


熟悉机械翻译的读者都清晰,近年来,机械翻译效果上的改善,主要得益于神经网络翻译模子的应用:从初期纯粹的词典匹配,到加入了语言学领域的专家知识实现规则翻译,发展到今天,基于语料库的统计机械翻译已经大行其道,机械翻译现步入神经网络发展阶段。影响神经网络翻译模子实际效果的要害之一,便在于被用来训练神经网络模子的语料库。被语料库训练事后的模子,可以实现更庞大的自动翻译,更好地处置差别的文法结构、辞汇辨识、惯用语的对应等。


这次iOS 14 能够有这样的翻译显示,其中一种大概率的可能性是,苹果把不少“小众”中文表达纳入了其机械翻译语料库更新之中:若是苹果的语料库中没有“瓜皮”这个词语的寄义,或者基本不泛起,那么模子在翻译的时刻,很难或者基本无法翻译出准确的效果,由于它基本不知道可以翻译成“stupid”。


不外iOS 14翻译的效果也有可以诟病的地方,好比说它延续了中文语料库中的一些歧视性表达。好比将“阿三”翻译成了“An India”。若是这个效果泛起在其他国家,生怕苹果要吃大讼事,这也是“小众”语料库的风险所在。


现在,苹果并没有公然研究透露iOS 14翻译功效更新的详细实现方式。但在其机械学习研究博客apple machine learning中,已经有跨越5篇与机械翻译相关的研究,显然,这家公司意识到自己的行业落伍位置。


而除了语料库的多元化之外,模子的更新、人机耦合等方式也能够带来改善效果。


最后多言一句,人机耦合这个观点,曾经由于海内厂商在机械翻译上的欠妥宣传而变得颇负面,但实际上,机械翻译文本,人类改善,机械再检查,“重复,直到翻译准确”,确实能够形成很好的反馈闭环。


包罗网友们这次晒出的一些iOS 14翻译效果,也能证实人机耦合(以及人工翻译)的一大“壁垒级”价值,那就是,人类的语言表达总是实时更新的,而且其更新换代之中也总有具有创造性的表达/翻译。若是最初没有人把“工藤新一”写作“滚筒洗衣机”,信赖苹果的模子也无法输出下面的这个翻译效果。


iOS 14翻译“太懂了” 第3张


本文来自微信民众号:数据实战派(ID:gh_ff93f845912e),作者:林檎

版权声明

本文仅代表作者观点,
不代表本站Allbet的立场。
本文系作者授权发表,未经许可,不得转载。

评论