这种[as…as]怎么提取出来做成词头?看了是span.cf想不到怎么弄

搜了搜as…as…,它被dictionary[.]com判定为 idioms and phrases

中文省略号的一半…

要提取出来,那么肯定有一个原始的文本,里面包含了想提取的内容。
然后可以写个程序,按行处理,每次处理一行的内容,大体的思路是:
在这一行字符中,查找字符串“. . .”(需要用到字符串匹配算法),如果找到了,记录下此时的位置(假定最右边的.位置为n),再由此位置n向后读取字符(如果n后面有空格的话先跳过空格),一直读取到空格为止,保存读取到的字符为StringBack,然后再由位置n-2向前读取字符(如果n-2前面有空格的话先跳过空格),一直读取到空格为止,保存读取到的字符为StringForward,最后得到想要提取的字符为StringForward加上 “. . . ” 和StringBack,可以选择把要提取的字符串输出到另外一个新的文本中。

想提取其他字符用类似的思路。

span.cf不知道是什么意思,只能说到这了。