《韩中词典》OCR文本数据

使用gemini和quark分别识别了文本,gemini版本可能有幻觉,由于我自己还没学韩语,所以本词典制作优先级不高。这个似乎有道有过数据,不知道现在还能不能访问了,也可以作为词头来爬取数据。

韩中词典_gemini.txt (13.1 MB)
韩中词典_quark.docx (14.0 MB)
韩中词典_quark.txt (11.8 MB)

6 个赞

感谢大神分享!

不知道下面这个日本语语感辞典好不好OCR,这本书扫描的效果不是很好,大神有时间的时候可以试一下效果吗?感谢您!

日语语感辞典.p…
链接:百度网盘 请输入提取码
提取码:62n3
复制这段内容打开「百度网盘APP 即可获取」

1 个赞

可以的,不过竖排版识别效果比横排的要差。

前30页测试:
日语语感辞典_1.txt (115.1 KB)

2 个赞

感谢大神!!!

补充paddleocr数据:

韩中词典_paddleocr.7z (19.0 MB)

1 个赞