OED词头合并重新排序,征集意见

感谢大家的帮助,这里写下OED词头排序的总结,以 「down」为例。

whitegerry:
n.1 → n.2 → n.3 → a. → adv. → prep. → v.1 → v.2 → Down, n.4
heliosxin :
int. → n.3 → n.6 → Down, n.5 → n.1 → n.2 → n.4 → adj. → v.2 → v.1 → adv. → prep.
oed 官网:
n.1 → n.2 → n.3 → n.4 → Down, n.5 → n.6 → adj. → v.1 → v.2 → adv. → prep. → int.

对比官网排序,heliosxin数据全,但不知道用什么排序的,而whitegerry的光盘版排序最准确,只有专有名词做了特殊处理,最新版会尽量还原 oed 官网排序(参考#43楼),再次感谢大家的帮助!

2 个赞

HWS-OED-HTX.rar (8.9 MB) 原始OED2V4光盘词头顺序文件,供参考. 以前提取oed2v4
时保留的
处理转义字符后的词头序 HWS.OED.HTML.zyzf.001.rar (1.1 MB)

2 个赞

感谢,刚好可以对照使用,看词头序,光盘版和官网对Bob,bob 以及 Down,down处理是一致的,忽略大小写,直接按词性后面的序号排序。

ID好像并不是按照历史时间排序的,比如mourn,排第一的是122937, mourn n. ,这个词条下的Etymology写的是:< MOURN v.1,可见mourn v更早一些,但是mourn v.的ID是122939。貌似就是简单的按照n, adj, v, adv. prep, int, prefix的顺序排的。

按#41楼侧边栏里的单词列表排序,会更准确。