程序处理・一分钟与几十个小时

之前进行中英专业词头的合并处理,把文件分成十个部分,同时进行,耗时四个小时左右,如今,重写了处理程序,耗时如下:

一个好的程序代码,是多么的重要。。。

确实很重要,不知道之前的程序是浪费时间在什么上了?

1 Like

之前纯用正则表达式实现,循环时套正则,正则里套正则,小文件感受不出来,文件大,加之循环多,一下就不好了。
这次用hash表来存储查找,速度杠杠的

1 Like

处理大点的文本文件正则是个拖油瓶,之前微调海词的时候体验过,改为自主标签解析处理几分钟就好了。