@匿名1650 这个词典好用吗?我看只有iphone 和android 两个版本?没有电脑端吗?
个人给词典的排名:
- OED, ODE
- MWU, MWCD
- CED
- RHU,AHD,主要 AHD 词源比较有特色(online版的文字粘连主要出现在词源部分。。。)
- SOED, Chambers, COD, LDOCE, OALD, CALD, CCALD, MWALD
PC版的话,官方确实没有,可能授权给其他词典平台吧,没用过。现在趋势是 online web 版, 手机版。而 PC 版的话,大都是老版本,比如 SOED, COD。
哎,你有兴趣可以把 SOED 5 和 4 的PC数据搞出来,那每个版本都是不同大师的杰作,可以珍藏。 SOED Intro - 词典及语言学习交流 - FreeMdict Forum 这种数据不会变动的,可以做一版收藏,其他实用的OED,MW, CED 适合年年更新。(现在的 SOED 5 和 6 只有成品 mdx,数据夹在了错误难以排查)
主要看你,我提一嘴,你觉得好用就搞,能双赢最好,只利他牺牲自己精力就算了。
方便国外用户的话,我感觉可以放到github上。
官网数据存在拼接错误:
- American Heritage Dictionary Entry: mantle (ahdictionary.com)
- 要么 word ninja 修复,但准确性会不会还原错(因为涉及词源各种奇怪字)
- 要么 换 android 数据源
- 要么看官网数据是不是有原始数据,只是 js 拼接时错误(但估计要是这个问题,Sunny 早就解决了。)
而 mdx css 的对标签的遗漏,Sunny 精力有限,css 要想基本上全渲染准确:
- 官网的几百行 css 梳理删减
- 所有标签的归类排查:
- css rule 数量, 在上面的 html element tree 中,paths 里面。
- hwds 对应 mdx.txt 内容的行号
- 用 vim 或大文件编辑器打开 txt
- :set foldmethod=syntax 进行折叠查看,za折叠或打开,hjkl 上下左右移动
- 逐条 path 检查,对照显示效果,每个选两三个例子,编写 CSS rule,大概检查一百来个 css 规则,普通的 css 也就几百行,因为例子要看两三个,劳动量稍微大点。
有精力的同学可以上,分享一段是一段,大家一起把显示问题尽可能的消灭。
你可把原mdx解開,搜尋 fromLatin
fromVulgar Latin
fromMiddle
ofOld
等等,應該可以看出出錯的端倪。我只是順手修改了所見到的,必有漏網的,由你動手一定會更完整。
官网拼接上错误的,之前 @白石晧晧 提到的APP Store 的 AHD5 离线版怎么样呢?我感觉搞词典,起码得有个可靠的参考源。
对。AHD 官网对自己的数据都不怎么上心。毕竟盈利不如 MW OXFORD。
AHD 我都没听过,OXFORD 这个我听过。
手机版本,需要购买啊。
如果破解版的话,数据就慢了(我搜了下,大概2021年的有cracked)。
当然数据更准确最重要,这样的话,你可以先拿 android cracked 版本的 AHD.玩玩。
你这个回复我感觉有点想法,你提到了有SOED 5的成品mdx,还有SOED 5 PC版,可不可以写程序自动调用比对呢?这个前提是SOED 5 PC版的数据是对的,因为SOED 5的成品mdx有错误,如果SOED 5 PC版数据也是错误的,这样比对就没意义了。或者直接把SOED 5 PC版的数据提取出来。
这句是什么意思啊
官网 AHD 的数据是最新的,它手机版安卓是和别人 mobisystem 合作的,数据更新的慢,而破解版的数据就更老了。(不过 app store 是 苹果版吧,我没用过,所以让你们聊聊)
App store 的 AHD5 是2011年第一版的数据,没有后续增加词条。
Android 版的更新数据可能到2018年。
近年最新的词条只有在网页更新,APP没有。
可是我看你刚发的官网AHD上也有错误的,我刚看了下你之前提到要破解的应用,有桌面端,是Mac平台的,只支持Apple自家芯片,不支持Intel芯片,我电脑上Intel芯片,运行不了那个程序的Mac版。
这个问题简单,我明天可以写个程序进行判断,有问题给出提示,或者把有问题的写入到一个文件中。
听你这么说,还是用官网的数据比较好,有什么错误大家提出来。
搞词典,最难的部分是破解准确的源数据。
剩下的全是简单、但苦累活,反向归类出词典的语义结构、写条 css 规则 有啥难得,就是需要人工判断排版合不合适,很耗时间。
你这个回复中照片上显示的这类拼接错误,我应该是好处理的,明天我写个程序,遇到可能有问题的给个提示或者把有问题的输出到一个文件中。