【求助】抓古诗文网,地址索引已有,求python代码

查找</html>,找找规律,</html>后要么空行或是新网页,要么就是补入内容。

对了,有err.txt吗?有的话还得再跑才算真正抓完

没有err.txt。 内容应该没抓完。内容前后交错,洗版是个难题。先搁置了。。。

好,我也再仔细看看程序有没有错误

明显没抓完,《狱中杂记》的翻译就没有。排版倒不重要,能全文检索就行了。(google不能搜译文部分)

地址索引已经上传

好,闲了再试试。主要对大杂烩不怎么感兴趣……