raw_zgls.mdx (12.0 MB)
开发中,todo_list:
- 替换内码为Unicode
- 替换换行
- 显示章节
- 排版
- 梳理图片、链接
- 校验内容(对照一遍)
已知问题:
- 有两个词条内存中数据有两份同样的数据。
- 有两个词条【@1】与【@Y】中含有换行符。
- 内存数据的提取过宽,导致有乱字符 NUL 等,如果以此为条件,会删掉有的词条。几十卷,若手动修不如等待同好爬在线版的一版了。若修改提取逻辑(如分为实词条和链接词条分别提取、bytes逐码与已有词条对比删除,需要各种验证,有空再玩。