三民大辭典文字版的可行性

三民大辭典的文字化,不知道有沒有高人在做。茲發幾張樣張,冀同道共襄此舉。










3 Likes

蚍蜉撼樹,愚公移山。
先把詞條索引做完吧
(現有的錯漏百出):joy:

個人力量黨然微弱,不知道論壇裏有沒有同好感興趣,一起完成

粗看了下,識別率還不錯。 值得讚歎!這是很有意義的事,可以堅持做完。
不知出版社什麼時候放出電子版。如果不出,自己識別也是沒有辦法的事情。OCR 也不必太過較真,達到基本能用即可,能提高效率,快速做出來。 自己也不用太費力氣。
算是一個過渡版本。可以參照圖片版看。
100%的準確率 那得看出版社的原始數據了。

2 Likes

道阻且長,行則將至。
:wave: :wave:

W2K老兄已翻出二百余条错漏,确实是“错漏百出” :laughing:

楼主用的什么软件,识别率确实挺高

其心可嘉,其事甚难。词典如果不准确,就很难使用了,查了也无法确定是否准确。再说这部词典内容未见到有什么好,辞源+汉语大词典,应该超过它。

加上图文综合版,很好啊。

楼主有没有完成OCR?