查字典的一个思路,用filelocator全文检索文本化的字典

在豆瓣看到有人发一个语法的问题

顺藤看到了一些文本化的字典

下载后用了emedit看了下,想到我以前用过的filelocator(我用的是官方lite版)
基本可以达到秒级,除了发音没什么毛病
来两张图

4 Likes

查翻译的precedent/双语对照语料库有用,但字典的全文搜索,GoldenDict自带的全文索引就很好用。

goldendict的全文需要建索引

1 Like

emm这就没格式了。而且太杂乱了。当然,全文搜索也是好的。试试上G 的文本速度几何?

文本化之后,估计没多少。

github上那位提供的文本化字典282M,包括重复的,5秒

突然觉得从截图上看,隔壁作反查的那位,跟这个很相似

太长, filelocator是可以建立索引的。

第一次是2016年在知乎上面看见有人介绍这个方法,后来知道掌上百科上面有个人提出这个方法的时间更早。优点是比深蓝词典等的全文搜索更精准,正则表达式花样更多,缺点在于需要另行提取TXT。
https://www.pdawiki.com/forum/thread-20067-1-1.html
https://www.pdawiki.com/forum/thread-11546-1-1.html

https://www.pdawiki.com/forum/thread-18358-1-1.html
https://www.pdawiki.com/forum/thread-11741-1-1.html

1 Like

见笑,孤陋寡闻了。

看到人家做好的txt版字典,谢谢

1 Like

多谢!以前用过两个小工具,可以用正则搜索文本,好像还能对比文件内容。回忆并搜索了一下,其中一个是search and replace,另一个与此类似,实在想不起来了。

记得是知乎@Frank_Huang写的一篇文章,现在被删了,微信公众号上还有存稿,作者还好心帮忙编译了大约10部常用词典(包括柯林斯、剑桥、朗文等)

是可以的,就是没有格式
更常见的场景是索引电子书,然后检索

我上面第一个链接,有一个叫取进止的人(就是我),就提到了你说的这个人:

2 Likes

确实,以前有一次用的时候我就发现他分享的剑桥和柯林斯词典是反过来的

先不说速度,反查到需要的内容后,为了准确理解和使用,往往还需要跳转回原词典查看释义、例句等信息。用这个没法做到吧?

当然可以做到了,对于词典作为数据库来说,反查出来的内容包括词典释义+例句,双击可以看到 (原词典中)对应词条的详情

该方法特别适合例句检索,词组检索,搭配检索,也不是没用。起码省去了做词典的费劲事。我也是看了知乎的文章,用过一段时间。

我用grep找几个文本字典就能搞定了。但用处真的不大。

grep --color=always -ne “$@” * |less -r

这是我用的命令, 把 $@ 替换成你要查找的词就可以啦。在控制台下运行,运行环境为windows的subsystem,mac直接运行。

这是什么?能不能说具体点

使用filelocator全文检索文本化的字典,这种思路真好!看大家讨论,这种方法的实现需要有文本化的词典才行,本人小白一枚,向大家请教一下,采用我们论坛中众多词典的mdx,然后将其解压开来,也会产生一个txt文件,那么这种文本文件可以利用filelocator进行全文检索吗?望大家不吝赐教啊!

基本是这样的思路,最好把标签洗去