大辞海修复版

freemdict下载:

图片数据:

https://s3.freemdict.com/useruploads/Protect/data.rar

修复的MDX MDD:

https://s3.freemdict.com/useruploads/Protect/大辞海修复.zip

1.根据json重置
2.删除了json数据中的重复项
3.根据孤影版本和PDF修复了词条问题(“倒格子问题”)
4.根据孤影版本和PDF修复了遗漏的词条(只有几个,具体不记得了)
5.修复了词条与词头不对应的情况(查询原版本“数学分析”可以了解该问题),该问题源于大辞海书本中某些词条的释义与前文重复,直接用见***页表示,估计在录入的时候出现了差错

***因为词条修复为纯手工修复,可能会出现差错,有发现可私信问题。

现阶段两个主要问题:
1.字体问题,也是最大的问题,可以通过手工修复,不过数据量太大,有8000+,除非组织人手修复,否则太麻烦
2.顺序问题,就是某些多释义的词条相同卷的释义没放在一起

排版问题:
预留了css和js链接,有愿意处理的可直接上传css和js

可以的话麻烦HUA上传到free的网盘。

9 Likes

能转到国内能访问的盘吗

大CH的图片又活了?

很多以前不行的现在都可以了,神奇。

应该是来管理人员维护了,之前一直全内容开放,忘关,现在是又要登录才能看全文了

3 Likes

看来只是稍微整了下,词条缺失问题还是一样(比如,全文搜索「“倒格子”的对称」)


mega网盘对中国大陆地区的用户不友好,文件过大,mega网盘将限制下载流量,很可能强制中断下载,需要支付美元,至少需要支付$6.1美元/月才可以继续下载,中国大陆地区支付美元的话,首先还需要换外汇,真麻烦,能看不能吃,难受啊…
建议楼主换成Google drive,Google drive没有下载限制。

注册一下账号就可以直接下了

多谢分享,但可惜无法下载
这些图片是做什么用的?是那些内容错乱的条目的图片吗?
这些错误不知是原网站的问题,还是转换时衍生的错误?
站长的json也找不到了

你尝试找过嘛?不能再好找了。

就是词条内的图片,之前缺了一些。

多谢站长,原来在站上,不在坛里

纯手工修复,工作量可不小啊,十分感谢,不过还是不建议花太多时间去修复它。

怎么说,这本词典问题很多,已发现的有:

  • 词条内容缺失,除楼主修复的之外,其实还有不少,比如『流化床燃烧』、『沙弥』、『荼毗』等;
  • 有些词条被并入其他词条内了,比如「彗」在词条「烩」中;
  • 词条乱入,比如『煇』的词条末多了「祲想齐」,『胚胎』词条最后多了「胎儿」
  • 大概60条左右有字缺字体文件、如「」;
  • 理工科公式排版很混乱;

总而言之,问题很多,建议还是不要浪费多余的精力去修复了,能用就行。

看了下,字体还是用的云链接,这个能不能离线调用的

字体问题没那么麻烦吧,直接离线下来,打包在mdd里引用不就行的吗

主要问题是无法查询 查不到挂字体也没意义

公式排版纯粹是谷歌的锅,十多年了还没支持mathml 火狐和Safari是支持的

感觉大辞海就没用心弄,这些词条错误简直太离谱了

多谢楼主!但提供的网盘都无法下载 :sleepy:

已经上传到本站,参见顶楼。

其实可以用js来实现MathML显示

    if(document.getElementsByTagName("math")) { 
        var script = document.createElement('script');
        script.src = 'https://polyfill.io/v3/polyfill.min.js?features=es6';
        document.head.appendChild(script);

        var scriptmml = document.createElement('script');
        scriptmml.src = 'https://cdn.jsdelivr.net/npm/[email protected]/es5/mml-chtml.js';
        scriptmml.async = true;
        document.head.appendChild(scriptmml);
    }

效果如图

不过诸如“\xa0”和“\r\n“之类的转义符会造成公式解析错误,要先在mdx里修掉,或也用js来替换处理。此外,原字典中还有大量公式、图片插入位置错误;我自己在修改中甚至还发现有公式录入不完整的情况,见【n维球体体积】、【实验形数】等条目。看下来若要全部修复的话实在是莫大的工程!

3 Likes

大辞海的解释挺信达雅的,比百科之类的好用 :relaxed: