浅析Python 实现一个自动化翻译和替换的工具

2022-07-18 301

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 浅析Python 实现一个自动化翻译和替换的工具

浅析Python 实现一个自动化翻译和替换的工具

这篇文章主要介绍了Python 实现一个自动化翻译和替换的工具，非常不错，具有一定的参考借鉴价值,需要的朋友可以参考下

一个可能你似曾相识的场景

阅读内容包含大量英文的 PPT、Word、Excel 或者记事本时，由于英语不熟悉，为了流利地阅读，需要打开浏览器进入谷歌翻译的主界面，然后把英文复制到谷歌翻译的输入框中，最后又把翻译结果复制回 PPT、Word 和 Excel。

要是一个两个单词还好，要是发现有 100 个单词不认识，就必须复制粘贴 200 次，如此机械性重复性的工作，应该交给程序来做，这就是我设计下面这个自动化翻译工具的初衷。

提升办公效率的法宝

如上图所示，运行程序并保持后台运行，在电脑上的任何一个软件中选择一段文本，并 Ctrl + C 复制到系统剪贴板中，程序就会自动帮助我们完成翻译，并将翻译结果自动复制到系统剪贴版中，只需 Ctrl + V，就完成了翻译结果对原文的替换。

编码实现

程序主要分为两部分，第一部分为谷歌翻译爬虫，第二部分就是实现这个将翻译结果自动替换的业务逻辑。

谷歌翻译爬虫

通过浏览器 F12 开发者工具，很容易定位到翻译请求的

这个请求接受两个参数，一个就是我们要翻译的字符串 q，另一个是用于用户认证的 tk(token),其中 q 很容易构造，tk 的构造就需要花费一番心力了，需要我们调试 js 代码，这里参考 Github 上大神的轮子： https://github.com/cocoa520/Google_TK

谷歌翻译爬虫的主要代码如下:

def translate(tk, content):
if len(content) > 4891:
print("too long to translate")
return
param = {'tk': tk, 'q': content}
result = requests.get("""http://translate.google.cn/translate_a/single?client=t&sl=en
&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss
&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2""", params=param)
data = result.json()
print(data0[0])
返回结果是 json 形式的，翻译结果保存在结果的第一个元组中。

Python 操作系统剪贴板

将读取剪贴板的内容的代码封装成函数如下：

def getText():#读取剪切板

打开剪贴板

w.OpenClipboard()

读取剪贴板的内容

d = w.GetClipboardData(win32con.CF_TEXT)

关闭剪贴板

w.CloseClipboard()
try:
return d.decode('utf-8')
except:
return d.decode('gbk')
返回值 d 是字节类型的，需要解码，中文按 gbk 格式解码，英文按 utf-8 解码。

类似地，写入剪贴板的代码如下：

def setText(aString):#写入剪切板
# 打开剪贴板
w.OpenClipboard()
# 清空剪贴板
w.EmptyClipboard()
# 写入剪贴板
w.SetClipboardText(aString)
# 关闭剪贴板
w.CloseClipboard()
实现将翻译结果自动替换原文的逻辑的代码如下：

while(True):
# 如果剪贴板正在被占用
try:
cs = getText()
except:
time.sleep(1)

cs = getText()

print('cs',cs)
if cs and cs != ls:
print('准备翻译')
content = getText()
tk = js.getTk(content)
res = translate(tk, content)14 setText(res)
time.sleep(1)
ls = res

总结值得注意的是，系统剪贴板对象是单例模式的，在操作系统范围内只有一个，而且读写剪贴板都是互斥的，在读（写）剪贴板的同时不允许任何对剪贴板的写（读）操作。试想这样一种情景，我们在其他软件中 Ctrl + C 写入剪贴板，而此时我们的程序代码正好执行到读剪贴板那一行，毫无疑问会报错，我的解决办法是使用 try…except 语句延时 1 s再读取，这样可以大大降低读写碰撞的概率，但无疑消耗了程序性能。

浅析Python 实现一个自动化翻译和替换的工具

打开剪贴板

读取剪贴板的内容

关闭剪贴板

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

浅析Python 实现一个自动化翻译和替换的工具

打开剪贴板

读取剪贴板的内容

关闭剪贴板

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像