【GdOcrTool】GoldenDict 官方版 OCR 功能增强(现已支持 MDict,欧路)

2021/11/19:修正错误,增加取词视觉反馈。
2021/11/15:已可用于 MDict,欧路词典
2021/11/14:脚本源码已上传,配置方法已更新。

◉ 演示:

GoldenDict:

GoldenDict

MDict:

MDict

欧路词典:

Eudic

◉ 模式:

  1. 点选 OCR (快捷键:ctrl+右键
  2. 框选 OCR (快捷键:ctrl+`

◉ 原理(点选):

  1. Capture2Text 识别鼠标处整行文字。
  2. Capture2Text 识别鼠标右方整行文字。
  3. 对比1,2提取出鼠标下的单词。
  4. 发送给 GoldenDict。

◉ 配置方法:

红框为必选设置,蓝框为推荐设置。

  1. Capture2Text 配置。(运行 Capture2Text.exe 后去托盘区里设置)。

  1. 脚本配置

用记事本打开 GdOcrTool.ahk,自行指定 GoldenDict.exe 路径。(默认值为 “C:\Program Files\GoldenDict\GoldenDict.exe”)。MDict 或 欧路词典 按类似方法修改路径,并额外修改名为 DictSelected 的变量(默认 “GoldenDict”,修改为 “MDict” 或 “Eudic”)。

◉ 下载:

  1. 下载 Capture2Text,解压,无需安装。已包含德、英、法、日、韩、俄、西语言包。一次识别只能选择一种语言。下载地址:SourceForge

  2. 额外 Tesseract 语言包,下载对应语言,下面四个链接任选其一(识别速度和准确率不同)。如简体中文包名为 chi_sim.traineddata(拷贝到 Capture2Text 同目录 tessdata 文件夹内)。

  3. 下载 GdOcrTool.ahk,与 Capture2Text.exe 置于同目录下。百度网盘,提取码:4rv3

  4. 安装 AutoHotkey v1.1

◉ 使用方法:

  1. 双击 GdOcrTool.ahk 开始取词之旅。
  2. 点选取词: ctrl + 右键;启动框选取词: ctrl + `;强制退出框选取词: esc 键。
  3. 不用时点托盘区图标退出。
18 Likes

这个有用!感谢分享!

2 Likes

多谢分享!还是官方版可靠,没有什么乱七八糟的东西!!

官方版能否加個剪貼板取詞???我很灌注樁這個

"Ctr+C+C"本身就可以“剪貼板取詞”

楼主只讲了原理和配置方法,没讲用法,摸索了半天才用起来啊。安装并配置了Capture2Text_v4.6.2_64bit.zip,

Tesseract 训练数据是起什么作用? 下面有四个链接,是不是下载其中一个就可以了啊?下载了第一个和前面下载的Capture2Text一模一样, 其它三个GitHub好像都链接不上。那么,你的下载第2项是什么意义呢?

GdOcrTool.exe也下载,并运行起来。另外,Capture Box那里要设置是Background color , 而不是你所说的Border color吧?

OCR功能运行操作还要好好训练训练才能掌握哦!如果用好了,可以放弃nonwill那个OCR版了哦,原版在文字取词方面有优势哦! 今天仔细看了下,nonwill那个OCR版把原版的屏幕取词功能阉割了,真是愚蠢至极!

用法就是 Ctrl + 鼠标右键 取词。

下载 Capture2Text 里面已经附带了几个语言包了,不用去 GitHub。

取词过程实际上进行了两次 OCR。要把 Border color 改成透明,不然第一次 OCR 出现的边框会影响第二次 OCR。

Background color和Border color设置为一样的淡色就行了。你所讲的下载分三步。而我实际只用了第1、3步啊,第2步跳过了啊!

Background color 不影响,主要是 Border color。改完效果立竿见影。第2步有好些个模型可选,但没有 Capture2Text 自带的好用。

请问,Capture2Text有没有32位版的呢?

https://sourceforge.net/projects/capture2text/files/Capture2Text/Capture2Text_v4.6.2/

1 Like

那GdOcrTool也要需要32位版一起才能用哦,还请一并分享。

GdOcrTool32.zip (403.3 KB)

我补充一下。

还可以直接把OCR的结果通过命令行传给GoldenDict, 例如:GoldenDict.exe “${capture}” (请看下图)。这样将就不需要用“ctrl+c+c”传了.

OCR

同理:GoldenDict可以搭配任何专业的OCR软件,只要软件可以把OCR的结果通过命令行传给GoldenDict。

2 Likes

这是直接传到剪贴板吧,直接ctrl+v就可以黏贴出当前词了,

请问这个 GdOcrTool 的作用是什么?好像Ctrl+右键是由它来起作用的。它好像是个AHK,能否开放源码?这样可以整合到我的AHK集中营(开机必备的一堆ahk),不必再启动一个独立软件。

image

======
update: 已经看到ahk了,只是格式不友好:)

这个搭配图片词典,好用!

目前默认情形下英文的比较好,但中英文混合的情形识别还有限,可能还需要进一步配置。

你所列的OCR模式两个,相应地要按你图中去设置Hotkeys,可是我的键盘左下角没有win键,我想改为Alt键+q,结果模式1:点选 OCR (快捷键:ctrl+右键)就不起作用了,将所有win键换成Alt键都不行,难道只能按你图中的排列组合才行吗?

这是由GdOcrTool 定义的,更改配置,对应的ahk也改改即可

GdOcrTool.exe就一个exe文件,没法改啊,难道组合键就这样固定了吗?