请问大家是怎样扫描纸版词典的?

大家是通过什么办法扫描纸版词典,进行OCR处理,然后编辑成TXT或Word文件的?我是初学者,我目前的做法是通过手机拍照,一页分三段拍三张,然后传送到手机的上的“白描”插件里,进行OCR识别,拷贝后,再粘贴电脑上,进行文字编辑。
识别率在85%以上。这种做法是不是落后了?大家有什么更好办法?请赐教。
另外淘宝上有“寄书扫描”的业务。不知道有没有使用过的?日语识别率怎么样?像我这本书这样的清晰度是否能达到好的效果?

2 Likes

第一栏,是你拍糊了,还是原版就是糊的?这本书有没有新版的?

这本词典是1986年出版的,书有些发黄了,但是拍照后识别可以。第一段原来就有些颜色淡,不是每页都这样。

论坛上很多人是找的淘宝。这个清晰度,扫描效果不好说,可以淘宝上直接找客服问下。还有这本书名是什么?1986 年之后没有再版了吗?你发出来,看看有没有人知道的。

是这部辞典。

书名 国語基本用例辞典
作者 Chikafumi Hayashi
著作人 林史典
出版者 教育社, 1986
来源: 维吉尼亚大学
已数字化 2007年10月19日
ISBN 4315501964, 9784315501964
页数 947 页
1 Like

新消息!好消息!有链接之类的吗?

谢谢!也是一个办法。专业扫描,OCR肯定用专业机械。

这本辞典非常实用,虽然有不少年月了,但是例句都非常经典!

可惜目前网上的PDF都非常模糊,纸质书也不清楚,我以前尝试扫描了几页,效果也不好。

是的。句子都很经典实用,难易度适中,适合学习日语的人使用。我手机拍照,然后OCR处理,效果还可以。就是太费事。

知乎上有套解决方案

感谢介绍的这个详尽的方案。

現代国語用例辞典 1992


0235.rar (10.4 MB)

1 Like

这个真漂亮!

不知道能不能分享!

感觉这个OCR一下,可以制作出非常棒的文字版了!