完成第一本完整的切片词典:输入原始的图片,一键输出最终的切片词典。
但同时也发现了严重问题:每个词典的排版特征不同,以致很难有通用的方法实现对不同词典进行切片,基本上都需要一些个性化的定制。
以我目前的简单理解:
(1)要么通过制作足够多类型的图片词典,重新提炼特征,并设计很多选项。
(2)要么通过类似机器学习的机制,让程序自行学习并识别特征。
对于不熟悉python,或不善于使用ChatGPT的用户来说,目前的成熟度远远达不到发布的标准。
这里仅列示一下现有的基本模块,供有心人参考: