Pdf词典文件,ocr输出文本制作mdx

请教:有部汉英词典pdf文件,经ocr后,输出了word和txr文档,然后如何制作mdx呢。用其他汉英的词头,如何去粗略匹配和制作啊,不懂这个技术啊。