这本辞典收录了很多百科词条,在小型辞典中收词最多,而且解释比较简洁挺不错的。不过有2100多页,扫描费了很长时间,后续电子化也会比较难,因为注音全是带方框的假名小字,不过如果不处理注音会比较容易。
下载:
通过网盘分享的文件:集英社国語辞典 第3版.zip
链接: https://pan.baidu.com/s/1UwGOtQv0KxYqcrRGzaqQow 提取码: 1234
这本辞典收录了很多百科词条,在小型辞典中收词最多,而且解释比较简洁挺不错的。不过有2100多页,扫描费了很长时间,后续电子化也会比较难,因为注音全是带方框的假名小字,不过如果不处理注音会比较容易。
下载:
通过网盘分享的文件:集英社国語辞典 第3版.zip
链接: https://pan.baidu.com/s/1UwGOtQv0KxYqcrRGzaqQow 提取码: 1234
感谢,辛苦从日本买回来拆掉扫描。为大家造福。
我个人觉得这样的原版辞典一般的初学者用不上,可以不注音,像《广辞苑》就没有注音,关键是以内容为主。
我都是不拆书拍照的,感觉拆了比较可惜。
搞了个二值化的pdf:
链接:百度网盘 请输入提取码
提取码:66j0
主要是校对这种小字音调还有furigana非常花时间,如果要出一个不处理这些问题的不完美版本就会比较快,只需要对比差异检查缺项错字问题就可以了,要检查这些就要逐词条阅读,可能几分钟才能检查一页,这样2100页就要100小时以上。
ocr文本,gemini错位情况比较严重,目前设了要求60%匹配仍然有不少匹配错误情况,音调的方框假名识别不出来,先把数据放上来,实际要做文字版还是相当麻烦的
集英社国語辞典_gemini.txt (13.9 MB)
集英社国語辞典_paddleocr.txt (13.7 MB)
集英社国語辞典_paddleocr.7z (12.5 MB)
这本辞典功能性在小型国语辞典感觉是最好的
就是版本有点老,不少词这本里查不到
希望这几年能看到这本再次改订
说起来,小型国语辞典的新选最新版跟他收词数量差不多,但是收词倾向完全不一样,新选对于日本文学以外的百科词条收的不多,并且新选的页数要比集英社的少很多