查字典的一个思路,用filelocator全文检索文本化的字典

在豆瓣看到有人发一个语法的问题

顺藤看到了一些文本化的字典

下载后用了emedit看了下,想到我以前用过的filelocator(我用的是官方lite版)
基本可以达到秒级,除了发音没什么毛病
来两张图

3 Likes

查翻译的precedent/双语对照语料库有用,但字典的全文搜索,GoldenDict自带的全文索引就很好用。

goldendict的全文需要建索引

emm这就没格式了。而且太杂乱了。当然,全文搜索也是好的。试试上G 的文本速度几何?

文本化之后,估计没多少。

github上那位提供的文本化字典282M,包括重复的,5秒

突然觉得从截图上看,隔壁作反查的那位,跟这个很相似

太长, filelocator是可以建立索引的。

第一次是2016年在知乎上面看见有人介绍这个方法,后来知道掌上百科上面有个人提出这个方法的时间更早。优点是比深蓝词典等的全文搜索更精准,正则表达式花样更多,缺点在于需要另行提取TXT。
https://www.pdawiki.com/forum/thread-20067-1-1.html
https://www.pdawiki.com/forum/thread-11546-1-1.html
https://www.pdawiki.com/forum/thread-20250-1-1.html
https://www.pdawiki.com/forum/thread-18358-1-1.html
https://www.pdawiki.com/forum/thread-11741-1-1.html

见笑,孤陋寡闻了。

看到人家做好的txt版字典,谢谢

filelocator其实没什么高级的,无非是 cat file | grep keyword 的图形化,不过这是世界,大部分人对技术都是“憨憨”,所以一个趁手的GUI工具还是很好用的。

txt作为词典,除了查询性能可能不够,其他方面都很不错。不过如果不是成百上千的txt词典,其实txt词典查起来也是够快的。(毕竟人去读词条还是更慢的嘛)

多谢!以前用过两个小工具,可以用正则搜索文本,好像还能对比文件内容。回忆并搜索了一下,其中一个是search and replace,另一个与此类似,实在想不起来了。