因为时间顺序和频率大小刻意还原,但是词性顺序无法还原。
现在就是官网的词性顺序,搞不清。
词性应该也是按历史先后。
就怕有时间差不多的词性。
whitegerry的数据是光盘版的?那他那个肯定更准确,我直接用他的顺序好了。
我推荐用频率排序,最高频出现在最上面,不然obselete太多了,或者whitegerry的也不错
OED- Oxford English Dictionary义项排列顺序遵从从古至今的历史原则,OED的书证源自各时期名家的著作,优雅沉稳。
ODE- Oxford Dictionary of English则是现代和常用义优先。ODE的书证源自语料库,贴近生活。
有专著介绍的
我的建议是先按原始网页顺序排出一版,尽量保留各种标签信息。
后面如果要调整为光盘顺序,也无不可。归根结底,排序规则取决于mdx使用者的特定需求,这个就见仁见智了。
看来官网的释义和书证都是严格按照历时先后来排的,但是词性可能是按照n, adj, v, adv.来的。
能否截图下「down」的完整排序?
按频率排改变不了 Obs. 排在前面这个特点,
这个恰好就是 Obs.
这个也是 Obs.
可能freq=0是 Obs.?
n, adj, v, adv. prep, int, prefix
我知道词性怎么排的了。。感谢 Aaron!!!有帐号真好啊。
词性是按最小ID排序,ID应该也是按历史时间排的,这样刚好是 n. → adj. → v. → adv. → prep. → int. 相同词性,按序号排就行了,感谢!
找到序号就好了。加油。
我认为把Bob n7加进 bob 里一起排序更好,毕竟官网是有序号的,类似Down n5。
137229 在网盘里还分享了一个Merriam Webster Online 2020, 数据质量也很高,内容完整度全方位超越前人,这个东西也值得打磨一下
说一下,,我这个发的不是二手数据,我就是一手数据 原网页 啥都没变,,,,还有 没有 n10 这个
对了,期待出一版完全不含语音的版本,或者单独给语音文件打包。单词语音其他词典有很多了。