这套书一共4卷,7576页,OCR费了很多时间,也和夸克做了对比检查,修复了幻觉问题,不过因为夸克识别正确率也不高,所以只能设置50%匹配。目前pdf版本1190页,5621页和5650页的位置是错误的,分别为1189页,5623页,和5652页,而且似乎缺少卷之间衔接的部分1966和5656这两页,目前不清楚是本来就没有还是pdf缺页了,这5页希望有纸质版的朋友能帮忙补齐。
Gemini:
新时代俄汉详解大词典1_gemini.txt (18.2 MB)
新时代俄汉详解大词典2_gemini.txt (19.2 MB)
新时代俄汉详解大词典3_gemini.txt (16.4 MB)
新时代俄汉详解大词典4_gemini.txt (17.3 MB)
Quark:
新时代俄汉详解大词典 1_quark.docx (13.3 MB)
新时代俄汉详解大词典 2_quark.docx (13.8 MB)
新时代俄汉详解大词典 3_quark.docx (11.6 MB)
新时代俄汉详解大词典 4_quark.docx (13.5 MB)
6 个赞
大神辛苦了,这可是鸿篇巨制!
不知道大神有时间的时候能否试一试下面两本日语基础词汇用例辞典,谢谢您!
【外国人基本语】扫描的还比较清晰,【国语基本用例】扫描的比较差。
【国语基本用例】我看过纸版,本身纸张就非常薄,而且透字,所以扫也扫不清楚…
通过百度网盘分享的文件:国語基本用例辞典…等2个文件
链接:百度网盘 请输入提取码
提取码:th99
复制这段内容打开「百度网盘APP 即可获取」
1 个赞
是的。
不过内容还是非常不错的,国内的很多参考书参照了这两本辞典。
原来有这个的文本数据啊,感谢提供,用这个和ocr文本对比修复乱码应该可以直接做文本版了。
多谢大神OCR这么多词典。希望有空的话OCR一下这个词典,多谢了。
通过网盘分享的文件:AHDR The American Heritage Dictionary of Indo-European Roots 3nd.pdf
链接: https://pan.baidu.com/s/1OdOZlIv1_LZ0vX_CJqKhng?pwd=vjhf 提取码: vjhf
–来自百度网盘超级会员v10的分享
2 个赞
这个很简单,页数比较少:
AHDR_gemini.txt (816.6 KB)
1 个赞
另外,希望把正文前面的3个部分preface、indo-european and the indo-Europeans和guide to the dictionary也ocr一下,多谢了
这里是1190等四页图片,5656没有这一页,原书缺失,第三册最后一页是5655,第四册第一页是5657。
1190等四页.rar (15.0 MB)
2 个赞
非常感谢,用夸克处理了一下,不过1190这页变形太严重,右侧的文字识别困难,能否重拍一下,谢谢。
补充夸克识别的版本和gemini识别的前言等部分:
AHDR_quark.docx (1.4 MB)
AHDR_Preface.txt (105.9 KB)
处理图片,补充ocr了这四页:
新时代俄汉详解大词典 补.txt (40.9 KB)
1 个赞