《拉鲁斯法汉双解词典》 文本数据(OCR)

接下来不如搞新世纪法汉大词典或者法汉大词典:grin:填补下文字版大型法汉词典的空缺,现在只有本坛只有英语西语日语区获此殊荣

外文、词典这些我都是业余选手,随便瞎玩的,没法投入太多时间和精力强啃硬磕。本来把较高质量的文本提取出来,指望专业人士接手的,校改少量文字,达到基本可用,也不算太麻烦,可惜也没见到几个日常依赖这些工具的人入场干活,那只能闲置荒废了。

大型词典都一个人做会很费时间,感觉比较好的方案是把词典文本化后先粗校切分词头,然后我之前也提过,可以搞个类似

的平台搞合作校对。ocr,切分词条这种需要技术的部分先做了,降低了门槛,这样普通人也能校对。我之前写拉鲁斯的校对工具用nicegui其实有意往这个方向改的。

paratranz是搞游戏汉化的,可以在线协作,需要导入原文和译文,但不能导入图片