OED词头合并重新排序,征集意见

因为时间顺序和频率大小刻意还原,但是词性顺序无法还原。

现在就是官网的词性顺序,搞不清。

词性应该也是按历史先后。

1 个赞

就怕有时间差不多的词性。

whitegerry的数据是光盘版的?那他那个肯定更准确,我直接用他的顺序好了。

我推荐用频率排序,最高频出现在最上面,不然obselete太多了,或者whitegerry的也不错

1 个赞

OED- Oxford English Dictionary义项排列顺序遵从从古至今的历史原则,OED的书证源自各时期名家的著作,优雅沉稳。
ODE- Oxford Dictionary of English则是现代和常用义优先。ODE的书证源自语料库,贴近生活。
有专著介绍的

我的建议是先按原始网页顺序排出一版,尽量保留各种标签信息。

后面如果要调整为光盘顺序,也无不可。归根结底,排序规则取决于mdx使用者的特定需求,这个就见仁见智了。

4 个赞

1 2

看来官网的释义和书证都是严格按照历时先后来排的,但是词性可能是按照n, adj, v, adv.来的。

能否截图下「down」的完整排序?

按频率排改变不了 Obs. 排在前面这个特点,

这个恰好就是 Obs.

这个也是 Obs.
可能freq=0是 Obs.

1 个赞

1 2

1 个赞

n, adj, v, adv. prep, int, prefix

1 个赞

我知道词性怎么排的了。。感谢 Aaron!!!有帐号真好啊。
词性是按最小ID排序,ID应该也是按历史时间排的,这样刚好是 n. → adj. → v. → adv. → prep. → int. 相同词性,按序号排就行了,感谢!

3 个赞

找到序号就好了。加油。 :heartpulse:

1 个赞

我认为把Bob n7加进 bob 里一起排序更好,毕竟官网是有序号的,类似Down n5。

137229 在网盘里还分享了一个Merriam Webster Online 2020, 数据质量也很高,内容完整度全方位超越前人,这个东西也值得打磨一下

去年到今年 修订了千把个词吧,给你们找不同 看看 想要完美的 新旧一起用了

2 个赞

说一下,,我这个发的不是二手数据,我就是一手数据 :joy: 原网页 啥都没变,,,,还有 没有 n10 这个

3 个赞

对了,期待出一版完全不含语音的版本,或者单独给语音文件打包。单词语音其他词典有很多了。

2 个赞