我终于腾出时间来整理了一下这个文本。证实你说的没错,文本中有904条重复。
这个文本的来源是读书中文网的pdf,不过去掉了pdf最后的部分,就是光盘自己添加,纸本没有的部分。这不是什么来源神秘的内部文本。
有一个Startdict版的《汉语大词典》有重复的词条,重复的部分和这个文本相同,大概就是用这个文本做的。
除掉这904条后,这个文本是一种可以使用的整理底本。
我现在把这904条重复的资料存在Excel文档中上传,供有需要的书友参考。
repeat.zip (170.7 KB)
我终于腾出时间来整理了一下这个文本。证实你说的没错,文本中有904条重复。
这个文本的来源是读书中文网的pdf,不过去掉了pdf最后的部分,就是光盘自己添加,纸本没有的部分。这不是什么来源神秘的内部文本。
有一个Startdict版的《汉语大词典》有重复的词条,重复的部分和这个文本相同,大概就是用这个文本做的。
除掉这904条后,这个文本是一种可以使用的整理底本。
我现在把这904条重复的资料存在Excel文档中上传,供有需要的书友参考。
repeat.zip (170.7 KB)
为什么我下载下来,三个压缩包,解压之后内容是一样的?
不明白你的意思。这三个压缩包是同一文件的不同部分,只下载一个无法解压啊。
标明1的文件可以改名为1.rar,标明2的文件可以改名为2.rar,标明2的文件可以改名为3.rar。
然后,使用7zip或winrar,打开1.rar,解压,软件会自动找其余两个文件合并。
Download 7-Zip 22.01 (2022-07-15)
https://www.7-zip.org/download.html
问问题需要把问题尽量说清楚。最好有电脑截图。
没人据此做一个mdx词典嘛,好过那些改得不知道对错的
我个人认为:最有用的版本仍然是本坛的2.0光盘本,内容最多。2.0光盘本的主体应该是从网站抓下来的,已经有html排版。也有人根据图像本增补过内容。
本帖这个纯净的文本适合作为参照本。
3.0光盘版的内容少于2.0光盘版,但有些词条的内容反而比较多,例如“六号”条。
不管用哪一种版本,都需要对照图像本使用。
这个非pdawik会员完全看不到。有什么优点?是2.0光盘本的修订本吗?
能不能把其说明贴出来,供大家参考?
参看:
请不要私信问我在哪里,耐心一点看帖子,该帖顶楼或Manju的帖子,都有云盘的链接。
可以公开问的问题,不要发私信。不是熟人,尽量别发私信。
假如你用不了云盘,找个熟人帮你上载到你能用的网盘。
我觉得,下划线或专名线,对普通读者或初学者,好处太多。比如看一本古籍,如果有专名,尤其是人名或地名,更容易快速理解原文。无论它来自哪里,只要能方便读者阅读理解,就是好事。
另外,中文本来就没有间隔号,你为什么要多持一举故意增加空格?这样做,完全膠柱鼓瑟了。
“需要的是读者提高自己的古文知识和素养”,這話說得倒好,可是,沒有人一出生就有很高的古文知識和素養,所以你的要求太高了。