求助一例正则表达式,即每行提取 2 至 5 个汉字的行

求助一例正则表达式,即每行提取 2 至 5 个汉字的行。凡是含有标点、字母、数字者皆不取。

如图所示:提取【八本】【把印时】【白录】等

下面附件是小样

样例.txt (6.7 KB)

1 个赞

如果把它导入excel 然后建立一列辅助列,计算字符,然后筛选,就可以。应该是不需要技术储备的最简单方法了
然后excel的晋级软件,微软出的power bi,我在i5 16g ram 500g固态 1t机械盘的笔记本上,处理过7千万行的表格。同样只需要excel知识即可,入门比较简单。且,免费。

Emeditor:

^[一-龥]{2,5}$
1 个赞

我经常用[\u4E00-\u9FA5],正则表达式里字符跟Unicode值是等价的