【GdOcrTool】即指即译,OCR取词工具

2021/12/15:修正 ini 路径;增加适用于较大字号的配置文件。

2021/12/05:改善单点取词成功率;调整对标点符号的处理;增加 GdOcrTool 配置文件,配置方法简化;附 Capture2Text 配置文件,设置微调;增加放大镜功能;调整区域取词鼠标指针为十字;增加32位便携模式;修复双引号转义错误;修复鼠标冻结错误。

2021/11/19:修正错误,增加取词视觉反馈。

2021/11/15:已可用于 MDict,欧路词典

2021/11/14:脚本源码已上传,配置方法已更新。

◉ 演示:

即指即译:

即指即译

区域取词:

区域取词

◉ 使用方法:

(1). 双击启动 GdOcrTool.ahk (或 GdOcrTool.exe),根据对话框提示指定若干文件路径。会自动生成 GdOcrTool.ini 配置文件。

(2). 单点 OCR 取词 (即指即译)(快捷键:Ctrl+右键

(3). 区域 OCR 取词(快捷键:Ctrl+`),按 Esc 退出。

(4). 默认使用 GoldenDict。如需 MDict 或欧路则修改 GdOcrTool.ini 中的 DictApp 为 MDict 或 Eudic。

(5). 区域取词如需使用 Windows 自带放大镜功能(仅支持放大镜停靠视图)则修改 GdOcrTool.ini 中的 EnableZoom 为 1。

注:修改 GdOcrTool.ini 后重启 GdOcrTool.ahk。

◉ CapturedText 配置:

配置好的 ini 文件已包含在下载链接,无需手动配置。按图片标红处核对。

◉ 下载:

(1). 下载 Capture2Text,解压,无需安装。包含德、英、法、日、韩、俄、西语言包。32位及64位下载地址:https://sourceforge.net/projects/capture2text/files/Capture2Text/Capture2Text_v4.6.2/

(2). 多国语言下载额外 Tesseract 语言包,四个版本任选,识别速度、准确率不一。简体中文包名: chi_sim.traineddata,拷贝至 Capture2Text → tessdata 文件夹。tessdata_fast 的简中识别率最高 。
* legacy:SourceForge
* tessdata:GitHub
* tessdata_best:GitHub
* tessdata_fast:GitHub

(3). 下载 GdOcrTool.ahk,并与 Capture2Text.exe 放入同一文件夹。百度网盘,提取码:4rv3

(4). 安装 AutoHotkey v1.1

(5). 在 Capture2Text.exe 所在文件夹 Captured2Text 中建立名为 Capture2Text 的文件夹,下载配置好的 Capture2Text.ini 放入其中。网盘链接中有两个 Capture2Text.ini,其中一个能适应较大字号。

(6). 此项适用于32位便携模式,可用于U盘。跳过步骤(4)。步骤(3)中下载 GdOcrTool.exe,在硬盘或U盘的默认存放路径如下:

image

30 Likes

这个有用!感谢分享!

3 Likes

多谢分享!还是官方版可靠,没有什么乱七八糟的东西!!

官方版能否加個剪貼板取詞???我很灌注樁這個

"Ctr+C+C"本身就可以“剪貼板取詞”

1 Like

楼主只讲了原理和配置方法,没讲用法,摸索了半天才用起来啊。安装并配置了Capture2Text_v4.6.2_64bit.zip,

Tesseract 训练数据是起什么作用? 下面有四个链接,是不是下载其中一个就可以了啊?下载了第一个和前面下载的Capture2Text一模一样, 其它三个GitHub好像都链接不上。那么,你的下载第2项是什么意义呢?

GdOcrTool.exe也下载,并运行起来。另外,Capture Box那里要设置是Background color , 而不是你所说的Border color吧?

OCR功能运行操作还要好好训练训练才能掌握哦!如果用好了,可以放弃nonwill那个OCR版了哦,原版在文字取词方面有优势哦! 今天仔细看了下,nonwill那个OCR版把原版的屏幕取词功能阉割了,真是愚蠢至极!

用法就是 Ctrl + 鼠标右键 取词。

下载 Capture2Text 里面已经附带了几个语言包了,不用去 GitHub。

取词过程实际上进行了两次 OCR。要把 Border color 改成透明,不然第一次 OCR 出现的边框会影响第二次 OCR。

1 Like

Background color和Border color设置为一样的淡色就行了。你所讲的下载分三步。而我实际只用了第1、3步啊,第2步跳过了啊!

Background color 不影响,主要是 Border color。改完效果立竿见影。第2步有好些个模型可选,但没有 Capture2Text 自带的好用。

请问,Capture2Text有没有32位版的呢?

1 Like

那GdOcrTool也要需要32位版一起才能用哦,还请一并分享。

1 Like

GdOcrTool32.zip (403.3 KB)

1 Like

我补充一下。

还可以直接把OCR的结果通过命令行传给GoldenDict, 例如:GoldenDict.exe “${capture}” (请看下图)。这样将就不需要用“ctrl+c+c”传了.

OCR

同理:GoldenDict可以搭配任何专业的OCR软件,只要软件可以把OCR的结果通过命令行传给GoldenDict。

3 Likes

这是直接传到剪贴板吧,直接ctrl+v就可以黏贴出当前词了,

请问这个 GdOcrTool 的作用是什么?好像Ctrl+右键是由它来起作用的。它好像是个AHK,能否开放源码?这样可以整合到我的AHK集中营(开机必备的一堆ahk),不必再启动一个独立软件。

image

======
update: 已经看到ahk了,只是格式不友好:)

这个搭配图片词典,好用!

目前默认情形下英文的比较好,但中英文混合的情形识别还有限,可能还需要进一步配置。

你所列的OCR模式两个,相应地要按你图中去设置Hotkeys,可是我的键盘左下角没有win键,我想改为Alt键+q,结果模式1:点选 OCR (快捷键:ctrl+右键)就不起作用了,将所有win键换成Alt键都不行,难道只能按你图中的排列组合才行吗?

这是由GdOcrTool 定义的,更改配置,对应的ahk也改改即可

1 Like

GdOcrTool.exe就一个exe文件,没法改啊,难道组合键就这样固定了吗?