这本书是我之前买的二手然后花了四个多小时手机拍摄的,然后用夸克进行了处理,尽量保证文字清晰。
这本词典是比较有特色的,汉字部分标注了吴音唐音之类传统汉字辞典才会标的内容,而且例句很多是出自文学作品。此外本书和其他书不同,汉语词和其他外来语一样采用片假名标注。
目前日语词典大多数都有mdx,近年的高中及以上的国语词典只有这几本没有电子版了,希望坛友能协力补齐以下辞典电子版:
集英社国語辞典 第三版(有很多百科内容,接近中型词典)
学研 現代新国語辞典 改訂第六版(高中词典)
角川 必携国語辞典(高中-一般,一直没有出新版,侧重辨析)
此外还有其他的不太主流的:
新訂 日本語を学ぶ人の辞典 (第一版是有日版,大陆版和台版pdf的,第二版非常少见)
三省堂 デイリーコンサイス国語辞典 第6版(简明词典)
学研 現代標準国語辞典 改訂第4版(初中用词典)
介绍参考:
扫描图档:
通过网盘分享的文件:新潮现代国語词典 第二版.zip
链接: 百度网盘 请输入提取码 提取码: 1234
这个也进行了初步ocr,其他ocr结果还没完成
paddleocr数据(只ocr了正文):
通过网盘分享的文件:新潮现代国語词典 第二版 OCR
链接: 百度网盘 请输入提取码 提取码: 1234
8 个赞
amob
2
谢谢分享,快速翻了一遍,手机拍得和处理得很完美,想必花了不少功夫,比有些人(扫描商家)用扫描仪扫的都强(他们不做检查)。个人买了扫描仪都闲置好久不用了,切书太费事,加上扫描、后处理和检查补扫等工作花的整体时间也不少于四小时,切书又心疼书。可能手机扫描是就性价比而言的最优解了,就是花耐心和气力。
1 个赞
这个吗? 切图版制作中…
Zcover.part1.rar (20 MB)
Zcover.part2.rar (10.7 MB)
3 个赞
这个似乎是2007年出版的,应该是初版,新訂版是2010年出的。
了解,原来是以下这本
日本語を学ぶ人の辞典
我会改制作台版的这本是有一个主要的原因,例句有中文翻译^^,请看以下卖家卖的实例,也可发现新版的例句也没有中文翻译
卖家
我感觉原版书切了比较可惜。拍书的话奇偶页分开拍比较快,我是每50页检查下有没有漏拍或者严重模糊的。不过我后来发现夸克有时默认算法有问题,会把一些清晰的字擦除,这种还不容易查出来。
Gemini也是这样,我遇过太多次,会多添加或删减一两个日文字的。好在我是逐字检查…
之前说的是夸克扫描的图像处理的问题。ocr问题目前复杂的词典还是没有一个完美的,gemini有时会出现幻觉,编出原书没有的内容,竖排文本容易顺序错乱,所以还要幻觉检查。
KANXV
10
发现很多照片几乎在相同的部位部分内容被擦除了,可能是手指被拍上然后被软件自动擦除的。在OCR以后可以有目的地去检查一下。
Add images
这个不是手指遮挡的问题,应该就是之前发现的夸克默认算法的问题,同样的图默认算法有问题,换个算法就正常了,我再查查哪些有问题替换一下。