三民大辭典的文字化,不知道有沒有高人在做。茲發幾張樣張,冀同道共襄此舉。
3 Likes
蚍蜉撼樹,愚公移山。
先把詞條索引做完吧
(現有的錯漏百出)
個人力量黨然微弱,不知道論壇裏有沒有同好感興趣,一起完成
粗看了下,識別率還不錯。 值得讚歎!這是很有意義的事,可以堅持做完。
不知出版社什麼時候放出電子版。如果不出,自己識別也是沒有辦法的事情。OCR 也不必太過較真,達到基本能用即可,能提高效率,快速做出來。 自己也不用太費力氣。
算是一個過渡版本。可以參照圖片版看。
100%的準確率 那得看出版社的原始數據了。
2 Likes
道阻且長,行則將至。
W2K老兄已翻出二百余条错漏,确实是“错漏百出”
楼主用的什么软件,识别率确实挺高
其心可嘉,其事甚难。词典如果不准确,就很难使用了,查了也无法确定是否准确。再说这部词典内容未见到有什么好,辞源+汉语大词典,应该超过它。
加上图文综合版,很好啊。
楼主有没有完成OCR?