AHD 2024 Improve

@匿名1650 这个词典好用吗?我看只有iphone 和android 两个版本?没有电脑端吗?

个人给词典的排名:

  1. OED, ODE
  2. MWU, MWCD
  3. CED
  4. RHU,AHD,主要 AHD 词源比较有特色(online版的文字粘连主要出现在词源部分。。。)
  5. SOED, Chambers, COD, LDOCE, OALD, CALD, CCALD, MWALD

PC版的话,官方确实没有,可能授权给其他词典平台吧,没用过。现在趋势是 online web 版, 手机版。而 PC 版的话,大都是老版本,比如 SOED, COD。


哎,你有兴趣可以把 SOED 5 和 4 的PC数据搞出来,那每个版本都是不同大师的杰作,可以珍藏。 SOED Intro - 词典及语言学习交流 - FreeMdict Forum 这种数据不会变动的,可以做一版收藏,其他实用的OED,MW, CED 适合年年更新。(现在的 SOED 5 和 6 只有成品 mdx,数据夹在了错误难以排查)


主要看你,我提一嘴,你觉得好用就搞,能双赢最好,只利他牺牲自己精力就算了。

2 个赞

方便国外用户的话,我感觉可以放到github上。

官网数据存在拼接错误:

而 mdx css 的对标签的遗漏,Sunny 精力有限,css 要想基本上全渲染准确:

  1. 官网的几百行 css 梳理删减
  2. 所有标签的归类排查:
    1. css rule 数量, 在上面的 html element tree 中,paths 里面。
    2. hwds 对应 mdx.txt 内容的行号
    3. 用 vim 或大文件编辑器打开 txt
      1. :set foldmethod=syntax 进行折叠查看,za折叠或打开,hjkl 上下左右移动
    4. 逐条 path 检查,对照显示效果,每个选两三个例子,编写 CSS rule,大概检查一百来个 css 规则,普通的 css 也就几百行,因为例子要看两三个,劳动量稍微大点。

有精力的同学可以上,分享一段是一段,大家一起把显示问题尽可能的消灭。

你可把原mdx解開,搜尋 fromLatin
fromVulgar Latin
fromMiddle
ofOld
等等,應該可以看出出錯的端倪。我只是順手修改了所見到的,必有漏網的,由你動手一定會更完整。

官网拼接上错误的,之前 @白石晧晧 提到的APP Store 的 AHD5 离线版怎么样呢?我感觉搞词典,起码得有个可靠的参考源。

对。AHD 官网对自己的数据都不怎么上心。毕竟盈利不如 MW OXFORD。

AHD 我都没听过,OXFORD 这个我听过。

手机版本,需要购买啊。

如果破解版的话,数据就慢了(我搜了下,大概2021年的有cracked)。

当然数据更准确最重要,这样的话,你可以先拿 android cracked 版本的 AHD.玩玩。

你这个回复我感觉有点想法,你提到了有SOED 5的成品mdx,还有SOED 5 PC版,可不可以写程序自动调用比对呢?这个前提是SOED 5 PC版的数据是对的,因为SOED 5的成品mdx有错误,如果SOED 5 PC版数据也是错误的,这样比对就没意义了。或者直接把SOED 5 PC版的数据提取出来。

这句是什么意思啊

官网 AHD 的数据是最新的,它手机版安卓是和别人 mobisystem 合作的,数据更新的慢,而破解版的数据就更老了。(不过 app store 是 苹果版吧,我没用过,所以让你们聊聊)

官网数据就是错的,而你却怪我,好委屈 :smile:

1 个赞

App store 的 AHD5 是2011年第一版的数据,没有后续增加词条。
Android 版的更新数据可能到2018年。
近年最新的词条只有在网页更新,APP没有。

可是我看你刚发的官网AHD上也有错误的,我刚看了下你之前提到要破解的应用,有桌面端,是Mac平台的,只支持Apple自家芯片,不支持Intel芯片,我电脑上Intel芯片,运行不了那个程序的Mac版。

这个问题简单,我明天可以写个程序进行判断,有问题给出提示,或者把有问题的写入到一个文件中。

听你这么说,还是用官网的数据比较好,有什么错误大家提出来。

搞词典,最难的部分是破解准确的源数据。

剩下的全是简单、但苦累活,反向归类出词典的语义结构、写条 css 规则 有啥难得,就是需要人工判断排版合不合适,很耗时间。

你这个回复中照片上显示的这类拼接错误,我应该是好处理的,明天我写个程序,遇到可能有问题的给个提示或者把有问题的输出到一个文件中。



查了这个Android2018版数据也是正常的,但不是官网的最新内容。

因此网页版还是最好的数据,除了粘连,不过也无伤大雅吧,一般都能分辨。