大辞海、辞海数据源对比

大辞海有在线版,epub(2015)版。
辞海有在线版。


【蝃】字条中的「𬟽」字:

1 个赞

三个版本的序号有时一致,有时不一致。

一致用括号的:

  • 【司士】:官名。(1) 掌管纠察百官的辅政大臣。相传商代已置,为天子五官(司徒、司马、司空、……

不一致的:

  • 辞海在线版
    • 【六官】:亦称“六卿”。官名合称。(1) 《周礼》以天官冢宰、地官司徒、春官宗伯、夏官司马、秋官司寇、冬官司空分掌邦政,称为“……
  • 大辞海在线版
    • 【六官】:❶《周礼》以天官冢宰、地官司徒、春官宗伯、夏官司马、
      有时一级序号有时带圈,有时不带。

同一个版本内部:一级数字序号,有时用带圈,有时用括号。

两级数字时,带圈为一级,括号为二级。

大辞海含有辞海没有的词条,如【司正】、【司里】。

因此私有字不多的情况(大辞海epub版的语词卷一万多,但古代史卷一百多),大辞海是有用武之地的。

1 个赞

大辞海在线版瑕疵很多,比如有条目录入不完整,见【雷酸】【地球观测试验卫星】等;公式错乱,见【加成反应】【内积空间】等。
不知道epub版里有无改善?

epub(2015)版,在哪里能看到?

大辞海在线版(游客访问,不清楚点进去是什么数据,我看mdx版恰好也是长这样):

大辞海epub版:

还是不行。图里【雷汞】条缺化学式;【雷酸】条中,化学式后缺句号,异氰酸化学式缺一部分,条目前的"1/100"莫名其妙,应该像是文中缺的部分图片字,但内容和位置都有错误。如此明显的错误,则可想而知,电子书版也未有仔细校队过。

如此,只有辞海的在线数据质量好些。

而大辞海

  • epub 中说到:根据 APP 数据制作。
    • 不知有人做过 app 的数据提取吗。
    • 一般是azw3版为源数据,epub可能是二次转换的。看语词卷的「字目」在「义一」后,很符合这个特征。目前找不到 azw3 的数据。
  • 目前先用着坛里的 2019年在线数据的 mdx 版吧。