【2020.8.16】GoldenDict-2A11 - Tesseract+ OCR划词完美版 - macOS / Linux / Windows

3 个赞

太小众了。。。

小众是坏事,也是好事。坏在没流量,没利益;好在树小不招风,相对自由自在。

请教一下作者在哪些视频网站或者播放器软件是可以取词的,我发现Chrome、firefox、Edge的OCR取词都无效(不管是不是视频),连Potplayer都不行,目前只发现txt和系统文件管理器的英文可以取词

我电脑在其他软件上用OCR取词只能先把鼠标划到任务栏,再到移到目标地去划词。

被你说中了。我试着给entry加引号就能跳转了
goldendict源码使用正则表达式检测entry,却没有考虑无引号的情况。

DEMO: RegExr: Learn, Build, & Test RegEx

六得一批 :grinning:

我的还是用不了ocr取词,只能ctrl+c+c取词。。

第一次使用,放了大概五十来部词典,搜英语加载有点慢,搜汉语直接卡死,然后强退

现在很多大中学生的思维方式是:用钱去解决绝大部分问题。
包括自己的学习,一上来就想着要花钱报培训班,而不是先想着怎么自己搜索资料去自学。
纵使在咸鱼淘宝上买了学习资料,能达到多少学习目的和效果可想而知,然后狗熊掰玉米棒,接着花钱找下一个学习资料

排查了一下字典文件,有两本词典可能有问题,禁用以后能用了,感谢

有的词典错误过多,会导致程序崩溃。比如故訓匯纂-手機版的1573.png,应该是有问题的图片。但据说在深蓝里没问题,深蓝真是…我是不赞成过于纵容不规范的容错机制的
官方的更容易崩溃,nonwill这一版已经改进了很多

1573png.zip (396.2 KB)

有网友反映,故訓匯纂-手機版(標準版)在goldendict查知字,单独使用可能还不会崩溃、但同组词典过多有时会崩溃。用另存为把这一页导出来上传的1573.png,手头的图片软件都打不开,我用编辑器发现里面居然有css的内容,不知道是怎么混进去的。而据mdx作者说,他在深蓝上可以显示该图片,不知道这两天新的mdd图像改进版是否解决了此类问题。

这个就不懂了,我的有问题的词典是康熙字典和说文解字,在深蓝和欧路里也是没问题,之前装过一个其他版本GD,也是这俩词典不显示,但是没有奔溃

我删了该索引(见附件),重新启动程序查询知字,还是同样的问题。编辑器打开索引前面部分有点奇怪。
解开mdd找到1573发现图片没问题(见附件),没想到另存为的图片和mdd里头的图片会不一样。

mdx见下,故訓匯纂-手機版(標準版)目录,我手头就是2020.01的这个
链接: https://pan.baidu.com/s/1BLQqXae25td5u9uKkkD8YA 提取码: h5bt

1573.zip (431.6 KB)

你用的是wgf 的那个版本吧,我这也一样,很容易导致程序崩溃。必须单独建组,崩溃概率会下降,而且用本贴mingw版本也会降低崩溃概率。

我怀疑是这两本mdx的字体问题,原因是用了阿弥托佛的改版后崩溃变少了些,而他的版本有把字体改为开心字体(可能还有部分文字字体没改过来)。类似ODE EN-ZH英汉切换版,把css中的@font-face 相关行删掉就不会崩溃了。

Down.zip (786.3 KB)

Id搞错了,应该是name=“故訓匯纂-手機版(標準版)” id=“1252c36616b1b981f41bed74eb21ce86”,索引见附件

另外我把查询结果导出来了,附件有。

要不只下载mdx,结合1573压缩包的正常图片和原mdd结构,搞个简易mdd?

深蓝版的img标签删掉了onerror="this.style.display=‘none’

我不知道为啥会这样?文件属性里头显示的生成日期是现在。

附件打包了只能查询知字的mdd+原mdx,查知字OK了?附上两个索引。

俺累了,不想再追究了

都到这一步了,接着干呀!