请问怎样才能把词典的PDF里面的内容做成这个效果的TXT,左边是词条右边是对应的页码(想制作词典的MDX)
原始PDF是这样的
2-4.pdf (3.0 MB)
即:
论坛好像有相应的教程
推荐工具
1,PDF补丁丁(PDFPatcher):提取图片。
2,Comic Enhancer Pro:可以用来切图。或者其它类似图片工具,如PS。
3,EmEditor:文本工具。编辑源文件用。
4,MdxBuilder:编译mdx用。
做索引可以参看此帖。
工具可以参看此帖。
问问题,提供的讯息越多越好。
你应该先说词典的名字、出版社。看有没有人做过i,或者有没有同类的mdx。
不外三种方法:
1.ocr,然后把词头抽出来。
这种方法最常见。舍得出钱的,用网上ocr,如百度高精度ocr。不想出钱的,一般上用finereader。
2.用一本类似词典的现成词头,根据这本词典加页码。
3.一个词一个词手打。
参看:
Oeasy:[索引] mdx 科普、制作教程大合集[进行中][20180121]
https://061061.xyz/19410.html