1)https://www.pdftohtml.net/
2)Convertio — 文件转换器
3)@MicroX
三个转的我都试过了,一开始觉得掌上百科那边使用https://convertio.co/zh/转的。后来比对过是https://www.pdftohtml.net/。
Convert PDF to HTML Free Online | Xodo
最后细看了那边@J大的,他的相关词都是按在正文里出现的顺序排的
一开始还觉得相关词咋没了,看来他也是碰到了混到了正文里清理起来真的很费力 ,他后来更新的应该直接从正文里后提取出来的(我猜的)。
想了想原数据既然没有太理想的可用,而@J大那边做的相关词挺有特色的(再有就是他弄得这个我真不会啊,我觉得很有特色),就用它改了。
已知的问题:1)跨页的有丢失 2)也有一分为二的 3)再有就是词头索引排序有颠倒的,数据在却查不到。
(补的缺后半页的是我自己在Convert PDF to HTML Free Online | Xodo
英文字用法指南-繁體版.rar (5.7 MB)
问题还很多,发上讨论如何完善。