另一种可能:记一次利用html处理辞书索引ocr结果的尝试

采纳这种技术新思路,这本词典离文本化是不是又近了一步?