求助:这样的网页词典怎么做?

http://www.palikanon.com/english/pali_names/dic_idx.html
我我菜鸟,想把以上的网页做成mdx词典。目前我只会用网上搜的办法:将txt转成excel,用“excel to txt for mdx”再转成txt,然后生成mdx。
现在的问题是:我不知道怎么设置内部引用链接。请哪位老师告诉我如何设置内部链接?
如果有高手会编程自动抓取帮我做好,那就更感谢了!
PS:以上网站词典套了好几层网页,也有许多内部交叉引用词条,字符要使用巴利语特殊字符,我每次都是用UTF-8才能正确显示。
如果没有简便方法,我也只能一步步自己用土办法慢慢做了。

看有没有人给你做吧,会Python 就很简单,我最近忙得很,没人给你做就等我有时间给你做。大概需要半个小时。

1 个赞

楼下止步,今天工作还没有事,可以摸半个小时:fish:
updated 半个小时完不成,以后再说

太感谢了。我自己用笨方法做,估计要搞一个月。
友情提示:有些字母,它又分了好几个网页显示,例如字母“A”下的词条,分了5个网页 Ab-Ad; Ag-Al;Am-An;Ap-As;At-Az。他这个词典,除了自己编写的词条之外,他还引用了其他的词典,来自其他词典的词条,他又另做了网页展示,此外还有内部词条之间的链接。
如果用笨方法做,的确很花时间的。