如何按照列表提取词典数据

新年好!
我有一个很大的txt文件,931M,是从mdx文件转换的,每个词条一行,有html标签,我想按照一个单词表从中提取数据,请问如何实现?
链接:https://pan.baidu.com/s/1yR87VBmPnDOL6fSpwCvkAQ?pwd=drc1
提取码:drc1

简单,几个步骤操作就行。首先,整理文本,一行一条。开CSV模式。第二步,粘贴要提取的词头。第三步,重要操作:删除/把重复行设为书签。操作要点,看图。(注意,默认是包括所有重复行,如果不是,请勾选)。第四步,复制或者剪切书签行。粘贴到新文档。



推荐用剪切书签行的方法,这个方法,可以方便看出那些词头没有提取到。

5 Likes

这个方法真是好用!已经成功提取。非常感谢告知。祝万事如意!

另一种方法供参考。
极简:CSV→合并
详细:①准备好原文本和用于提取的词表,每条一行。
②都打开CSV模式。
image

image

③CSV→高级→合并。红框处按需调整。(不同版本在菜单的位置可能不同)

image

此方法还有其它用处,比如,为词典排序。

1 Like

非常感谢告知这个方法,祝新年心想事成!

还有其它方法啊。比如按词头排序+正则提取。批处理用正则直接提取。会点数据库的话,一句查询了事。以前还试过在电子表格,用vlookup弄,就是麻烦点。

1 Like

我现在学会了这两种方法,先用着

这应该是最简单的了

1 Like

这个软件就刚发布时用了一下,很久没有用了,都忘记了,非常感谢提醒