完成切片词典的主体开发
期待,切图词典的制作有一个词头提取和校对的环节,可能是主要费时的部分,提高OCR质量,把词头图片剪切拼接成大图就原书的辅页索引一般,整页的批量的去用ABBYY校对,应该能方便不少。
1 个赞
期待V大新作品,这个太强大了!
不错。
要是论坛上主要的图片大词典都用 DicSlicer 重制一下就太好了
不知道能否处理 三栏或多栏的
1 个赞
厉害!期待大作!
完成第一本完整的切片词典:输入原始的图片,一键输出最终的切片词典。
但同时也发现了严重问题:每个词典的排版特征不同,以致很难有通用的方法实现对不同词典进行切片,基本上都需要一些个性化的定制。
以我目前的简单理解:
(1)要么通过制作足够多类型的图片词典,重新提炼特征,并设计很多选项。
(2)要么通过类似机器学习的机制,让程序自行学习并识别特征。
对于不熟悉python,或不善于使用ChatGPT的用户来说,目前的成熟度远远达不到发布的标准。
这里仅列示一下现有的基本模块,供有心人参考:
5 个赞
期待分享啊!!
程序运行的演示:
2 个赞