The Catalogue of Life 2023

物种名录2023
The Catalogue of Life 2023

收集 Catalogue of Life China 2023 相关文档的超简单小字典(技术不行),丑到爆!

20240217
属种可以分开查询了,有多个词条相关的是entry形式,单一词条的是跳转形式.
跳转的因为相关词条可能是异名词条,会有双重跳转.
双重跳转看词典支不支持.懒得改了.这次是最终版了,改一次好麻烦(数据量太大)



20240130
终于会用mdict-utils打包了…
1.增加taxonID查询;
2.部分词条把entry改回了@@@link;
3.从CC-Canto CC-Canto 作者那里抄了折叠部分的css,只会抄,不懂是什么意思,勿怪;
4.修改小错误.

20240127
初次制作

从 The Catalogue of Life 网站下载dwc文档

从中国物种名录网站下载相关excel
http://www.sp2000.org.cn/

本来是想以taxonID为主要词条的,结果加上跳转超1000万,连Mdxbuilder大文件版+超长词头+超长内容都制作失败.
只好以拉丁学名为主要词条.缩减了一部分.

原数据词条:490万+
加上中文学名,异名学名,地方名跳转词条: 8365385

相关数据太大,只作简单整理,添加分类层级导航.由于中国物种名录里面的拉丁学名和COL2023的拉丁学名部分不一致,分类也不太一样.
所以只有少部分有中文学名和中文分类层级,仅供参考.

因为大文件版不支持自动跳转,链接全部为entry(也可能是我不会)

有任何错误,敬请谅解.
欢迎修改.

站内盘:

百度盘:

提取码:loyo


2 Likes

试试mdict-utils打包,没什么限制。

1 Like

不会搞,说有错误

#mdict-utils# 打包有个坑,
说所有文件要utf8 no bom
但是描述文件其实却是要默认简体中文格式保存
开始不知道,一直报错,说0x8c错误

一千多万词条,连很冷门的细菌都能搜到,而且词条后面还附有链接来源,很优秀,感谢辛苦制作和分享!

有一个问题,这个词典无法以单独的属名或种名以及属名+种名的形式进行搜索,比如Neisseria gonorrhoeae,无论是以Neisseria或gonorrhoeae或Neisseria gonorrhoeae均无法正常搜索到,最终需要在查看该词库所有单词中搜索才能看到。

这个应该可以实现,但要过年后了.
回家电脑带不回去,笔记本cpu又不行.

好的,辛苦了,感谢您!

种名可以拆开按属,种查询了

收到,非常感谢!虽然这个不能被很多人看到,但是这么优秀的作品,相信后面见到的人都会对您心存感激的,这个对我们生物医学相关领域的人帮助很大,再次感谢您无私的辛勤付出!

要是能把这个搞下来就好了。
https://www.iplant.cn/

1 Like