【转贴】中华古诗近1.4万古诗人近5.5万唐诗和26万宋诗数据集json格式

二楼已经有免费地址,有需要的直接看二楼。截图里的网址忽视即可。

我的直觉告诉我应该是这个

文字描述看上去像。那有需要的,可以直接下github的了,不用花钱了。

骗傻子懒人买的,这种数据集来源都不明,谁训练ai和搞开发用这个?

我再推荐个免费的,反正不在意质量的话

1 个赞

烂大街的破烂,搞诗词的不懂程序,搞程序的对诗词也是p也不懂,拼凑堆积出来的一堆垃圾。

1 个赞

嗯,这玩意还得是专业的有鉴别能力的人来做合适。

收集唐诗宋词资料,应当参考WFG的思路。这些才是可信和高质量的来源。

WFG: 全唐詩典
WFG: 全宋詞典

大佬果然是大佬,找到的东西果然不是一个等级的。

古籍,只讲大而全的话,还是没看到能接近殆知阁的和坛内那个网站的

这个咱们坛子里有么?

WFG从来不发涉及版权敏感的资源,别想了,他都是自己和几个朋友用的。

那就多用搜韵呗

github上的那群二百五搞一个“最全中华古诗词数据库”,1万多fork,5万star,却连逯欽立的《先秦漢魏晉南北朝詩》都没有收录,可想而知多荒唐可笑。

四书五经、蒙学的韵文、清代的小品文都放进去了,这帮人能懂诗词?四书和论语分开放,连四书是啥都不知道,挺可笑的。

他们真是拿到点啥,就兴奋地往里塞。

这么一想或许还真有可能有ai用这个作为训练集的。
github骗stars的东西多了去了,也不差这一个。

顺便说下,中华·古籍·库最近又可以不登陆进行查词了。

古代诗词,除了半截的全明诗、全清词,不大可能也没必要的全清诗,前面所有朝代都有全集出版。现在古代文本开放、最全,也有一定质量的是识典古籍,还能对照原版图像。

说起数据库,有大佬记着这个网址么?中国历代人物图像数据库http://diglweb.zjlib.cn:8081/zjtsg/mingren/index1.htm

这个后来是不是上不去了?现在是失效状态。


有没有大佬做了这个mdx和mdd,或者有谁知道新的网址或者类似德网址。