分成了两个包,暂时没有图片,用的是阿弥陀佛帖子里的Python 程序下载的网页,Python 提取主要内容,emeditor清洗的数据,官方大文件特别版打包数据,效果就像网页另存为本地后的显示效果,表格有些显不出来,漏掉了不知道不少词条,尝试过用软件提取所有mdx词条然后用emeditor把原来爬去网页的链接关键词和mdx词条相比较提示有十来万不同的,有些确实是漏掉的,但又有很多和mdx词条里的一样的,有啥办法提取两个不一样词条的办法?
09.01号: 第一个mdx文件:https://pan.baidu.com/s/1qUqpssv6wxy3gkv0Fy4U4w?pwd=u74r 提取码:u74r 复制这段内容打开「百度网盘APP 即可获取」
第二个mdx文件:https://pan.baidu.com/s/1yrJ66CPittzGA8ucUZ8mog?pwd=416u 提取码:416u 复制这段内容打开「百度网盘APP 即可获取」
10.20号:
通过百度网盘分享的文件:20231020 链接:https://pan.baidu.com/s/14PldkHyztDznXJsIUPQ0vg?pwd=3o4m 提取码:3o4m 复制这段内容打开「百度网盘APP 即可获取」