freemdict下载:
图片数据:
https://downloads.freemdict.com/uploads/useruploads/Protect/data.rar
修复的MDX MDD:
https://downloads.freemdict.com/uploads/useruploads/Protect/大辞海修复.zip
1.根据json重置
2.删除了json数据中的重复项
3.根据孤影版本和PDF修复了词条问题(“倒格子问题”)
4.根据孤影版本和PDF修复了遗漏的词条(只有几个,具体不记得了)
5.修复了词条与词头不对应的情况(查询原版本“数学分析”可以了解该问题),该问题源于大辞海书本中某些词条的释义与前文重复,直接用见***页表示,估计在录入的时候出现了差错
***因为词条修复为纯手工修复,可能会出现差错,有发现可私信问题。
现阶段两个主要问题:
1.字体问题,也是最大的问题,可以通过手工修复,不过数据量太大,有8000+,除非组织人手修复,否则太麻烦
2.顺序问题,就是某些多释义的词条相同卷的释义没放在一起
排版问题:
预留了css和js链接,有愿意处理的可直接上传css和js
可以的话麻烦HUA上传到free的网盘。
21 个赞
应该是来管理人员维护了,之前一直全内容开放,忘关,现在是又要登录才能看全文了
4 个赞
看来只是稍微整了下,词条缺失问题还是一样(比如,全文搜索「“倒格子”的对称」)
1 个赞
free
7
mega网盘对中国大陆地区的用户不友好,文件过大,mega网盘将限制下载流量,很可能强制中断下载,需要支付美元,至少需要支付$6.1美元/月才可以继续下载,中国大陆地区支付美元的话,首先还需要换外汇,真麻烦,能看不能吃,难受啊…
建议楼主换成Google drive,Google drive没有下载限制。
1 个赞
多谢分享,但可惜无法下载
这些图片是做什么用的?是那些内容错乱的条目的图片吗?
这些错误不知是原网站的问题,还是转换时衍生的错误?
站长的json也找不到了
纯手工修复,工作量可不小啊,十分感谢,不过还是不建议花太多时间去修复它。
怎么说,这本词典问题很多,已发现的有:
- 词条内容缺失,除楼主修复的之外,其实还有不少,比如『流化床燃烧』、『沙弥』、『荼毗』等;
- 有些词条被并入其他词条内了,比如「彗」在词条「烩」中;
- 词条乱入,比如『煇』的词条末多了「祲想齐」,『胚胎』词条最后多了「胎儿」
- 大概60条左右有字缺字体文件、如「█」;
- 理工科公式排版很混乱;
总而言之,问题很多,建议还是不要浪费多余的精力去修复了,能用就行。
字体问题没那么麻烦吧,直接离线下来,打包在mdd里引用不就行的吗
3 个赞
公式排版纯粹是谷歌的锅,十多年了还没支持mathml 火狐和Safari是支持的
感觉大辞海就没用心弄,这些词条错误简直太离谱了
其实可以用js来实现MathML显示
if(document.getElementsByTagName("math")) {
var script = document.createElement('script');
script.src = 'https://polyfill.io/v3/polyfill.min.js?features=es6';
document.head.appendChild(script);
var scriptmml = document.createElement('script');
scriptmml.src = 'https://cdn.jsdelivr.net/npm/mathjax@3/es5/mml-chtml.js';
scriptmml.async = true;
document.head.appendChild(scriptmml);
}
效果如图
不过诸如“\xa0”和“\r\n“之类的转义符会造成公式解析错误,要先在mdx里修掉,或也用js来替换处理。此外,原字典中还有大量公式、图片插入位置错误;我自己在修改中甚至还发现有公式录入不完整的情况,见【n维球体体积】、【实验形数】等条目。看下来若要全部修复的话实在是莫大的工程!
6 个赞