人工智能又攻下一城:从智能翻译机掀起的AI硬件销售热潮说起

从围棋、游戏、驾驶再到翻译,人工智能不断攻城掠地。但在智能翻译机这一征程上,并非为了在某一领域打败人类,而是打破沟通的边界,用技术穿过了千百年来形成了语言鸿沟,使我们与彼此再次相遇。

恐怕谁也没想到,智能翻译机这样看似小众的产品能引起AI硬件的销售热潮。

数据显示,最近在京东预售的搜狗旅行翻译宝在3月19日开售一小时后就被抢购一空。”据悉,搜狗此次销售额破 1000 万,登顶京东该品类冠军。”

如果说AlphaGo第一次让AI走进人们的视野,那搜狗旅行翻译宝则又攻破一城,让AI走进了人们的生活。

在此前,翻译机市场一直面对着艰难的落地应用问题:翻译质量差、语种数量少暂时不提,很多翻译机还要求必须连接网络才能应用,在很多场景中其便利程度远低于手机上的翻译软件。

但翻看搜狗旅行翻译宝京东购买页下的用户反馈与评论,我们可以看到,目前94%以上的用户在使用后还是对产品给予了支持与认可。在产品功能上多数用户表示“在离线状态下翻译很准确”、“语音识别灵敏,比较复杂的英语句子翻译成中文也很好”;而在提及应用场景时,也有用户表示“作为一个英语盲,在国际航班上不敢点餐,说了别人也听不懂。不敢一个人去坐中转航班,看不懂也听不懂”。当然也有人提出升级建议,包括离线翻译、拍照翻译需要增加英文之外的语种扩充等。

看来AI技术赋予给搜狗旅行翻译宝的离线、高质量、多语种翻译能力完美贴合了消费者对智能翻译机的想象。在这一众多科技企业着手布局的领域,搜狗无疑站到了前列。消费者的一致好评也说明,这款产品切实改变了以往国人跨国沟通不畅的窘境。而AI的力量也从阿尔法狗的棋盘中走向生活,造就了第一款适用于消费者的智能翻译机。

当翻译App日益强大,什么才是智能翻译机的自我修养?

那么相较于其他同品类的产品,搜狗是怎么做到真正实用的?搜狗CEO王小川对此解释是:离线翻译,拍照翻译,多语种互译。

想象一下,旅行中最常出现的情况是什么?

在地铁、飞机等交通工具中信号不畅,自己却看不懂地名?购买的海外流量包用尽,却为了和他人沟通到处找WiFi使用翻译App?

可即使网络顺畅,翻译App也常常表现不佳。不光翻译质量差,在比较嘈杂的市场、景点中很难精准识别语音。几种局限场景,几乎覆盖了出国旅行的绝大部分状况。

正是这些不便打开了智能翻译机的生存空间。

针对这些问题,搜狗提出了双麦克风阵列+离线翻译技术的解决方案。

通过全指向性I2S数字双麦克阵列结合多项拾音技术,有效规避噪声、远场拾音,提升了噪声场景下的语音精度,从而确保高质量的翻译效果。这样一来,在室内环境中多人低声交谈时,翻译宝可以准确收音,语音识别速度也基本做到了实时同步。

在离线翻译方面,搜狗基于transformer结构的离线机器翻译技术也是业内首家,在没有任何网络的时候也能实现语音翻译和拍照翻译功能。当然不依赖网络自然意味着在终端进行计算,为了补充算力搜狗旅行翻译宝搭载了GPU芯片,这是市面上第一款搭载了GPU的智能翻译机。

有了强大的算力加持,通过运算定制,针对识别、翻译、合成涉及到的矩阵运算进行定制优化,可以使得语音翻译的延迟严格控制在1s以内。这样的速度甚至超过了很多翻译App在4G网络环境下的速度。

当然搜狗自身在NLP,尤其是机器翻译领域的实力也不可小觑。搜狗的神经网络翻译系统在2017 年国际顶级机器翻译比赛 WMT 中获得了中英和英中双向翻译冠军。有测试表示,搭载了这一技术的翻译宝在中英离线翻译的翻译速度与准确率也高于同类竞品。

但真正让旅行翻译宝区别于竞品的,还是拍照翻译功能。

拍照翻译在这两年于手机App中流行开来,通过图像识别功能找到图片中的文字并进行翻译,为用户提供了很多便利。翻译路标、菜单…尤其是面对一些对英语不熟悉,手机输入翻译困难的用户,图片翻译几乎是唯一解决途径。相比之下,只能翻译语音的翻译机们又落后一局。

王小川在推出旅行翻译宝时,就曾表示“我们不一样”。加入拍照翻译功能,就是相比竞品的一大差异化优势,

搜狗旅行翻译宝的拍照翻译功能搭载了搜狗业内领先的OCR文字识别技术,可处理“复杂背景、光线弱、拍照抖动、文字折行”等问题,搭配500W像素摄像头与3.1寸高清屏幕,针对出境游会遇到的找路、吃饭、看展和购物时“看不懂”的问题,实现“即拍即翻”。用户只需要拍摄要翻译的内容,比如路牌、菜单、名画介绍、商品说明,机器就能直接将图片内的外语翻译为中文,让用户不用再逐字费力输入外语。

需要注意的是,目前拍照翻译还只支持中英之间的翻译,如果未来扩展到日韩俄这类手机原生输入法不支持的语言,恐怕会成为最实用翻译产品,再次掀起热潮。

在多语种互译上,搜狗旅行翻译宝也能满足用户出行的多语言需求,据统计,目前世界上使用语言最多的十种分别为:英、法、西、阿拉伯、中、俄、德、葡萄牙、印地、日。翻看了下,搜狗旅行翻译宝已全部涵盖这十门语言。此外还多提供了韩语、泰语、荷兰语、波兰语、芬兰语、丹麦语、瑞典语、意大利语另外8种语言,覆盖世界200多个国家,而同品类其他竞品目前只支持5种左右的语言。

最重要的是,这18种语言在联网状态下全部支持互译,未来的用户场景也不仅仅只针对中国人,将可以实现全世界人民的跨国交流。

加码机器翻译,搜狗如何帮助中国沟通全球?

很多人对搜狗的AI发展策略存有这样一个疑问:当其他企业都用音箱这种场景更广泛的产品打入硬件市场,为什么搜狗剑走偏锋的选择了智能翻译机?

简单来看,可以找到两点理由。第一是因为搜狗通过输入法、语音输入法等产品在NLP技术上得到了更多累积,推出翻译机产品更得心应手。第二是翻译机多国语言互译的功能不仅仅适用于中国市场,搜狗有可能借助这款产品在全国市场走的更远。

可仅仅停留在市场层面,未免会低估搜狗对于翻译这件事抱有的情怀。

王小川此前曾用“发明电”来类比翻译的实用:“翻译技术走向实用化不亚于人类发明电,同样是历史突破。今天各个国家冲突,各个之间不信任是因为语言和文化引起,一旦翻译技术被解决掉,我们可以很容易获得全球信息,国外也了解我们的信息,世界会发生变化。”

其实仔细观察搜狗在机器翻译方面的布局,会发现搜狗早已进入这一领域。

在 2016 年的乌镇世界互联网大会上,搜狗对外率先展示了搜狗机器同传技术,实现全球首次机器翻译实用化。随后,还为前哨大会、香港 RISE 峰会、CCF-GAIR 峰会、达沃斯论坛等上百场大会提供机器同传支持。同时,搜狗还将翻译与核心产品搜索、输入法结合:上线全球首个跨语言搜索引擎,将机器翻译与搜索技术相结合,让用户能够用中文查询和阅读英日韩网站的翻译结果;在搜狗输入法中首创性地加入翻译功能,让用户在聊天场景下,能够进行中英日韩语音和文字输入的自动翻译,无需复制粘贴,更不用在社交软件和翻译 APP 中来回切换。

从toB应用的机器同传,到终端上的搜索、输入法、翻译App,再到覆盖更多人群场景的旅行翻译宝,搜狗正在翻译领域越扎越深。而应用于旅行场景的翻译宝也仅仅是一个开始,教学、商业、出版…一切你能想象到的,需要沟通的地方,都是机器翻译的应用领域。

当很多科技企业还没有发现这片沃土的时候,搜狗已经播种完毕,准备收割了。

在和厂商的交流中,很多厂商都曾表示过AI硬件销量低、使用率也低,其实根本问题就在于这些硬件没能对用户的生活做出改变。如今看来,加强人与人之间的沟通效率,很可能是AI硬件对我们生活形成的最大变革。

如今中国正承担着共建人类命运共同体的全球使命,走向世界、与全球交流已经成为了一种必然。而机器翻译日益强大的能力刚好可以为这一使命赋能,满足我们和全球沟通的刚需。

从围棋、游戏、驾驶再到翻译,人工智能不断攻城掠地。但在智能翻译机这一征程上,并非为了在某一领域打败人类,而是打破沟通的边界,用技术穿过了千百年来形成了语言鸿沟,使我们与彼此再次相遇。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论