【工具-切片词典】DicSlicer 预览

完成切片词典的主体开发

15 个赞

期待,切图词典的制作有一个词头提取和校对的环节,可能是主要费时的部分,提高OCR质量,把词头图片剪切拼接成大图就原书的辅页索引一般,整页的批量的去用ABBYY校对,应该能方便不少。

1 个赞

期待V大新作品,这个太强大了!

不错。
要是论坛上主要的图片大词典都用 DicSlicer 重制一下就太好了

不知道能否处理 三栏或多栏的

1 个赞

厉害!期待大作!

完成第一本完整的切片词典:输入原始的图片,一键输出最终的切片词典。

dicslicer

但同时也发现了严重问题:每个词典的排版特征不同,以致很难有通用的方法实现对不同词典进行切片,基本上都需要一些个性化的定制。

以我目前的简单理解:
(1)要么通过制作足够多类型的图片词典,重新提炼特征,并设计很多选项。
(2)要么通过类似机器学习的机制,让程序自行学习并识别特征。

对于不熟悉python,或不善于使用ChatGPT的用户来说,目前的成熟度远远达不到发布的标准。

这里仅列示一下现有的基本模块,供有心人参考:

5 个赞

期待分享啊!!

程序运行的演示:

DicSlicer

2 个赞