【疑难词目(词头/条头)索引制作求助】请各位前辈指教如何从这本《拉汉科技词典》提取词头和对应页码?

这本词典用现在的技术来处理比较容易,选两家厂商,比如夸克和合合分别OCR,然后再补充第三种大模型OCR(例如Gemini 2.5 Pro),得到的三个文本对比互校,可以把错误率降到相当低。也不需要花2800元,或许280元即可,它是调用api的费用。