convert CCALD9.epub into a mdx

https://b-ok.global/book/5007633/ceff19

5 个赞

原来 python + bs4 可以这么简捷,我用 regex 转麻烦很多。看来还是要花点时间学。

1 个赞

写的第一版(extract1.py)只有几行,后面为修跳转才扩写成现在这样子。

1 个赞

有几个字开头有表格的,例如 aside ,第二个解释缺失,被当成辞头了。

1 个赞

重写了代码:

extract09.7z (1004 字节)

增添两个函数,一个try…except…else,一个多值递归。完工。

2 个赞

稍作修改,就能将"aside from"等保留为独立词条:

extract99.py (2.4 KB)

6 个赞

LZ好厉害 :+1:,感谢分享

2 个赞

lurker兄,别谦虚了,你就是很厉害!! :smile:

2 个赞