【制作呼吁】希望有人能组织小学类文字版工程:《故训汇纂》《古音汇纂》《广雅疏证》等等

最好组建制作群,定期汇报进度,且人数不能太少,我觉得应当有五十人参与为好。

附:我想把《广雅疏证》文字化,如果有感兴趣的朋友,可以留言关注一下。《疏证》约1000页,如果有二十人参与,则每人五十页,一个月即可对校完毕。(不用逐一手打)

3 个赞

幫頂! :+1:

楼主有过类似经验吗,纯手打还是有点心生畏惧:grin:

先ocr,然后对校,怎么可能手打 :joy:

1 个赞

原来如此,那ocr的质量非常关键,可以先调研市面上的各种产品,尝试出一套流程,以后就可以统一按这个模式做各种大部头的文本化了

我自己也在做,楼主可叫上我,我自己已经校对了20多页了(已经扫描了200多页)。可惜上班忙,有个人一起做还是挺乐意的。我是先用天若OCR识别(强烈推荐),识别率是95%,剩下的错误都是生僻字导致的。至于字库不存在的字,就直接造字。等晚上下班后,我发一下样例,确实呼吁人们把小学类的书籍电子化,因为其实本身这类书籍(包括广韵)并不是用来阅读的,最好的方法是自己亲自动手给文字、音韵作系联。尤其是广韵,根本不适合阅读,最好的方法是逐字地、手动地把每个字的反切自己标注一遍,做一个韵部汇总,而这个亟需电子检索才能快速做到。

1 个赞