舒服员
1
之前给 @mdict6 卖关子 , 现在魔改版终于完成了.
使用的底版和这个是同一个, 在其基础上:
-
增加最常用词性信息, 且最常用词性始终排在解释的第一位.
-
增加词频信息: COCA 30000 以内的单词会用星号标注, 以5千为一档.
-
增加更多近义词, 从Roget thesaurus词典获取了更多的近义词.
-
增加部分单词的英国英语音标.
-
增加来自WordNet里的词汇信息.
- 合并词头. 如"dent1" “dent2” 合并为 “dent”.
- 修正源文件错误. 如闭合标签, 文本使用了不合适的标签等
- 简体化 (自己看着方便, 如果有人需要原版繁体中文 , 可以留言).
- 由于已经全部简体化, 原来简体版本的重定向词头就得以删除了.
- 剔除不必要的词头. “-o-”
点击图片放大
下载地址:
压缩包含有多个颜色主题的css, 只有wxp.css是使用的.
本文同时发布到了知乎: https://zhuanlan.zhihu.com/p/585004665
一度被知乎反作弊给锁定了, 可能是新号的缘故.
制作过程不难, 但是花费不少精力时间.
如果觉得本词典有用, 帮我在知乎的文章上点个赞, 让知乎知道不是发布垃圾信息. 谢谢
由于发布的第一个版本, 可能存在错误. 本来我昨天就打算发布了, 截图时发现词族部分有的单词标签不对, 今天又重头制作的.
31 个赞
多谢精品!
不过汉语词头下怎么没内容?
希望同时分享繁体版。
3 个赞
啊呀,想法不错,但是排版不太紧凑,导致版面比较大,有点鸡肋啊
词频标记建议不要匀速增加,因为前5000的地位和后5000的地位完全不同。建议比如2000/5000/9000/14000/20000/30000/45000/60000这样递增。
1 个赞
舒服员
10
@RANP0 繁体版已经更新, 刚刚申诉成功, 不过账号还是被禁言 只能说反作弊系统厉害.
@sxingbai 抱歉, 熬夜出现问题, 已经更新
@mdict6 谢谢支持 那个星星就是unicode字符, 显示不了可能是当前用的字体没有那个符号, 手头没办法测试, 稍后再看看吧
@Sherman 排版是个人喜好, 可以自行修改CSS
@knetxp 1.比较级忽略了.
-
字辩部分原版是没有标签的, 就是一堆文字直接塞到了div里. 我曾经尝试解析出来单词和释义, 但是不同词条该部分格式又不一样, 只能作罢. 现在就是直接把原版里的内容原封不动显示出来.
-
短语如果是字典里的一项, 会以链接形式出现, 图中第一个不是字典里的条目.
-
a标签可以用: #phrase a {}
和#synonym a {}
区分
@hua 谢谢hua大
@zambast 递增算法更科学, 但是这个3万其实都是常用词, 主要是方便知道单词大概排名, 如果采用递增方式, 那么如何计算分隔区间, 大家的看法可能更加不同.
@Impact 直接添加? 没看懂. 更新了未转换的繁体版.
6 个赞
舒服员
12
@shiruxue 需要筛选一下字体, 找出那些包含星星的字体. 问题出在正在使用的字体没有星星符号.
2 个赞
谢谢大作!
diminutive(其他词条也一样)在深蓝词典上(请见截图)有问题。
1 个赞
knetxp
14
附上我修改的css,有喜欢的可以下载使用。
wxp.css (4.0 KB)
8 个赞
请问这个COCA Frequency 60000哪里下载。
现在用的sound++,里面的COCA是一个几十万的词频版本,不合并词形的,质量其实不如COCA60000,而超过6万的词频,就算查到了比如10几万的编号其实也没多大参考价值。
1 个赞
naisme
19
可能为难楼主了,这个地方有办法分开不。词路径及上位下位很棒!
1 个赞
舒服员
21
原来有专门的词频词典哦, 我不太需要那么详细的词频信息, 只想简单标注一下高频词. 另一个版本应该不会更新了 没有什么可更新的了.
@naisme 这里的标签我看了一下, totally mess, 类名, 标签, 文本对应不上或者缺失, 算了吧.
@mdict6 星星应该可以显示了
@knetxp 修复了比较级
1 个赞
舒服员
23
nltk.wordnet hypernym_path
1 个赞