请教一例正则或excel:由每行若干汉字及页码,变成每行一个汉字一个页码

如下图,还请教前辈指点:

变成:

image

Emeditor汉字匹配
注意:重要一个,正则表达式引擎修改为:Onigmo。
[\x{4e00}-\x{9fff}]
包含扩展区的汉字匹配
([\x{3007}\x{4e00}-\x{9fff}\x{3400}-\x{4DBF}\x{20000}-\x{2A6DF}\x{2A700}-\x{2B73F}\x{2B740}-\x{2B81F}\x{2B820}-\x{2CEA1}\x{2CEB0}-\x{2EBE0}\x{30000}-\x{3134A}\x{2F800}-\x{2FA1D}])



查找([\x{4e00}-\x{9fff}])([\x{4e00}-\x{9fff}]+)\t(\d+)
替换\1\t\3\n\2\t\3
3 个赞

感谢前辈出手,已顺利解决

@jcz777 请教下,用 EmEditor,不写脚本,只是在对话框中操作,可以反复替换直到全部替换完成吗?

重复几次直到无匹配结果。
方法简单,就是有可能按到手酸。

1 个赞

谢谢!我想是不是有什么设置可以干这个

我用的是emeditor,里面有个“替换全部”,是不是可以一次性替换完

应该要一直按到找不到为止

这个正则引擎很强啊, ruby竟然也再用

你要多次点全部替换才行,因为每一次替换结果都有可能产生新的匹配。

曾经类似的操作,我点了几百次。总是以为下一次就结束,哪知点到手软了。

如果事先知道需要很多次点击,可以录一下宏。然后复制N次。运行宏会省事的。