不知坛友,可有方法可以迅速查出某一词表的词频。
比如现有300词,可有方式一键导入类似COCA这种词库,直接看到所有词的词频。
或者有类似功能,感激不尽。
我猜是没有这样的专用工具。如果不想自己写脚本,有个变通的办法是,将词表导入到anki,利用插件 Fast Word Query,调用一本词频mdx,生成anki卡片后再导出。
Hello, thank you for your response.
To clarify, the example I provided was merely for illustrative purposes, with a reference to 300. However, in practice, the vocabulary I need to compare consists of over 7000 words.
I currently don’t have a COCA membership, but I’m contemplating obtaining one if this approach proves to be viable.
Given the potential for future research that might involve similar comparisons, I’m inquiring whether there’s a relatively expeditious method available. The manual comparison process is undeniably quite time-consuming.
Regarding the comparison results, any format that provides access to word frequency data is acceptable, including, of course, a text file.
May you have a good day!
您这个是一个思路,但是考虑到MDX数据源头的准确性,做学术研究可能不够严谨;我想这种成熟的数据库,类似NOW和COCA,或许有一个方式;我再想想其它办法。谢谢您的回复,祝您生活愉快!
使用emeditor的“合并CSV”可以满足楼主的要求。下面两个链接供参考:
下面两个链接应该是官方教程,但我没打开,不知具体是什么内容。
https://zh-cn.emeditor.com/text-editor-features/powerful-csv-tools/combine-split-columns/
下面是简单的演示:
这个功能用好了,可以做很多事情。比如提供一个词表,然后从某词典中提取出对应的单词及释义,等等……
谢谢您不辞辛劳的回复,但是我的问题首要其实是在于database,而不是工具。最近发现,免费版本的EM-editor居然自动断开程序,只能说日本人防盗心情很强啊。谢谢您的回复,我后期也会仔细学习一下,这个软件我每次只用来取词目。祝好!
什么时代了,上chatGPT,不会编程没关系,手把手教你解决哈哈
look at this 词频统计
随便弄个整理好的词频字典,专门显示词频的,论坛里应该有的是,你自己看着那个顺眼就用那个就是了。然后,拿这样的字典,直接生成源数据文件,txt类型的,会用代码解析的话,自己dom解构,不会的话,直接把txt导入到Excel里,直接删除列,只保留词头和词频两个列就是了。
另外,真要是专门做词频统计的话,还是弄现成的库,直接调用人家的api看结果就是了。论坛毕竟是开源兴致,都是靠热情发电的,和严谨的科研两回事儿。真要是上升到论文文献级别的,样本数据,如何审查这块,都未必合适。