辞海第七版源流和书法显示的问题

刚才试了一下,繁体字头能查到,但是书法还是简体的

我没有爬新数据啊,只是简体字下会同时给出它的繁体字和异体字,我只是提高查得率。本来可能搜异体字搜不到。

zhongx大佬的“软笔字帖”里是有繁体书法数据的,离线版MDX可能需要调整一下,繁体书法就能显示

来源都不一样呢,那个和辞海没关系,缺的数据就是缺了。

然后又微调了下css和mdd。

明白了,您辛苦了

有点问题,又改了一下mdd和css,麻烦再重新下载。

已更新,谢谢啦

现在流传的辞海mdx的例证相关的标签都被 Protect 暴力正则处理过添加一堆新的标签,但是同时也导致了一大堆位置错误和标签缺失。。。总而言之例证的标签相当混乱。
看了半天,无力修复。官网原始数据虽然标签简单,但好歹位置是正确的。
要是谁备份了原始数据,建议发出来供人重制。
或者要是谁有能力爬一份新数据就好了。


例证指的是画框的吗?

对的,标签都被mdx制作者动刀过。官网只有一个<citation>标签。

逼死强迫症,有几千处标签添加失败和其他地方不协调,几千处标签错乱。


我看了一下mdx标签确实有点乱,官网上html源码汉字乱码是加密的吗?

汉字就是加密的


我看官网citation里面添加一些标签,设计如此吗?

那有的是没有的,可能是官方后来移除了可能有问题的,还是mdx制作者强行修改统一?总之现在mdx和官网标签出入非常大。


又更新了,修复上千个例证标签位置的错乱,看得我头晕眼花。缺失的标签没能力补,就这样吧。
将原版错误使用的六千个左右的右单引号⸍改成正确的’。

5 个赞

请问amob前辈修改的网址在哪里,我看一楼的百度网盘链接还是3月12日的

看了下在线版没给出索引,当初是怎么爬的?

哦,只更新了123网盘,百度网盘忘记了。取消百度网盘了,懒得维护了。

可能是docId吧,数字递增就行了

1 个赞