序
什么是人机协同翻译,为什么会需要人机协同翻译,以及人机协同翻译的效果,应用场景等,本文将关于这些内容一一解答。
什么是人机协同翻译
人机协同翻译主要面向翻译公司、个人译员等翻译生成者,为客户提供40+类型文档翻译、图片翻译、视频翻译,帮助客户在线完成项目管理、翻译/质检、任务交付,基于客户不断累积数据智能训练最合适客户的机器翻译模型,持续提高客户人工翻译效率。简单来说就是人机协同翻译不是简单的机器翻译,也不是简单的人工翻译,也不是简单的机器翻译+人工翻译,而是机器翻译+人工翻译+智能训练的翻译平台。
账号绑定
这里我们首先来体验一下在线翻译吧,体验地址:https://alynx.alifanyi.com/login.html?spm=a2c6h.27976729.J_4502519820.36.72e877abGv62eg 第一次体验的时候是没有账号的
目前阿里在线翻译暂时不支持注册账号,可以通过授权阿里云账号的形式注册阿里翻译平台账号
这里需要勾选对应的权限,如果没有勾选的话授权会失败的,授权完成之后进入阿里在线翻译首页
服务开通
点击【马上开通】进入服务开通页面
勾选服务协议,点击【立即开通】,开通成功之后回到在线翻译首页刷新
这里我们可以看到每月有1000也免费翻译额度,可以放心的测试翻译效果了。
文档翻译
这里我先去准备了一个英文文档,内容如下:
System Guide This is the guide to the CodeMirror editor system. It provides a prose description of the system's functionality. For the item-by-item documentation of its interface, see the reference manual. Architecture Overview Because CodeMirror is structured quite a bit differently than your classical JavaScript library (including its own previous versions), it is recommended to read at least this section before jumping in, so that you don't waste your time with mismatched expectations. Modularity CodeMirror is set up as a collection of separate modules that, together, provide a full-featured text and code editor. On the bright side, this means that you can pick and choose which features you need, and even replace core functionality with a custom implementation if you need to. On the less bright side, this means that setting up an editor requires you to put together a bunch of pieces. The putting-together part isn't hard, but you will have to install and import the pieces you need. The core packages, without which it'd be hard to set up an editor at all, are: @codemirror/state, which defines data structures that represent the editor state and changes to that state. @codemirror/view, a display component that knows how to show the editor state to the user, and translates basic editing actions into state updates. @codemirror/commands defines a lot of editing commands and some key bindings for them.
点击在线翻译-文档翻译下的【继续翻译】按钮跳转到上传文件页面
选择需要上传的文件,文档上传成功之后
这里会对文件内容进行解析,再次出一个费用提示信息,点击【开始翻译】
翻译成功之后可以在线查看翻译结果,也可以下载翻译好的文件,点击【查看】
这里在线查看文档翻译效果比较模糊,下载之后翻译的文件内容
系统指南 这是CodeMirror编辑器系统的指南。它提供了系统功能的散文描述。有关其界面的逐项文档,请参阅参考手册。 架构概述 因为CodeMirror的结构与你的经典JavaScript库 (包括它自己以前的版本) 有很大的不同,所以建议在跳进去之前至少阅读这一部分,这样你就不会把时间浪费在不匹配的期望上。 模块化 CodeMirror被设置为单独的模块的集合,这些模块一起提供了功能齐全的文本和代码编辑器。从好的方面来说,这意味着您可以选择所需的功能,甚至可以根据需要使用自定义实现替换核心功能。从不太好的一面来看,这意味着设置编辑器需要你把一堆碎片放在一起。 组装部分并不难,但是您必须安装和导入所需的部分。核心软件包是: @ codemirror/state,它定义表示编辑器状态和对该状态的更改的数据结构。 @ codemirror/view,一个显示组件,它知道如何向用户显示编辑器状态,并将基本编辑操作转换为状态更新。 @ codemirror/commands为它们定义了很多编辑命令和一些关键绑定。
图片翻译
下面我们再来看一下图片翻译,这里还是需要开通图片翻译的服务的
同样的操作点击【继续翻译】,在跳转的页面上传待翻译的图片,这里的图片我还用上一次文档的内容截图保存图片
上传图片完成后可以看到
点击【确认,开始翻译】,可以看到翻译的效果
由于在页面中比较小,看不清翻译后的内容,这里选择【点击图片全屏查看】可以看到翻译后的结果
观察图中的内容可以知道图片翻译相比文档翻译来说,文档翻译的准确度更高一些。
体验感受及建议
先说一下这一次主要体验的内容,这次对于人机协同翻译平台的体验主要是在线智能翻译的图片翻译、文档翻译,视频翻译的话由于没有模板视频,没有体验,如果可以的话希望官方可以提供对应的demo文件可以方便大家测试体验人机协同翻译平台的翻译效果。
在体验在线智能翻译-文档翻译时,对于文档翻译后的内容整体上没有什么偏差,语句通顺容易理解,只是在对部分单词的翻译上,缺失语境的联系,单词释义匹配的不太准确,这一点希望后续可以继续优化提高;另外在线文档翻译成功之后,点击【查看】翻译结果的时候,页面字体太小并且很模糊,基本看不清内容,只能选择下载文件后再看,有的情况是不需要下载翻译文件,直接在线看就可以,希望后续对于【查看】内容的清晰度也做一下调整,提高清晰度。
在体验在线智能翻译-图片翻译时,相比文档翻译,图片翻译的精准度相对低一点,会将图片中部分的关键词翻译成汉语,实际上这部分关键词是专有名词,不需要翻译成汉语,比如图片中的codemirror,另外对于文档中一些专有名词识别的不准确,比如将codemirror识别成了codemillor。
还有一点是疑惑的地方,比如我开通了文档翻译服务,并且也提示有1000页免费翻译额度的情况下,上传文档之后仍然会提示收费信息,比如这样
刚开通的文档翻译服务,1000页的免费测试额度没有使用的情况下出这样的提示,比较疑惑?
在本次体验中,对于在线翻译的功能和准确率基本都达到了期待的目标,相比目前的在线翻译产品来说的话,翻译的准确率基本差不多
但是作为阿里云人机协同翻译平台来说,后续会基于现有的翻译结果进行模型化训练,文档翻译的准确率也会不断提高,因此这只是初版的翻译准确率,后续的每一次翻译都会越来越准确;另外有专业的技术团队作为后台支撑,在机器翻译+人工翻译+训练模型的加成下,后续的翻译效果不言而喻。
对于产品应用场景的话,应该说是有文档的地方就需要翻译,比如说你工作中需要看国外资料,但是自己翻译又太耗时,那么你可以交给人工协同翻译平台在线翻译或者调用api翻译都是可以的;或者说你要购买进口商品,商品说明文字也可以通过图片翻译成中文;或者你要考证,需要看国外资料;再或者各个视频平台的国外电影中的中文翻译,也就是视频翻译,都是应用场景,因此说这款产品的应用场景很多,重在不断提高产品服务的识别精确率。
关于人机协同翻译平台机器训练这块,是否可以提供一个关于如何配置机器学习,机器训练,来提高翻译准确率的实验室内容,或者视频操作内容,或者提供一个可以一步一步完成整体机器翻译训练的全步骤的文档,对于用户来说,都希望容易操作还可以达到自己预期的产品,这样简化用户操作的同时提高翻译准确率,是不是更有利于产品发展呢。