想删除一串字符 前后相同,中间引号加单词

想把一本意大利语反向动词查询的链接去掉,换成@@@link=动词不定式,请问如何用正则替换。就是想删除每一个单词的span class=verb style 这一项,有没有简单的方法。

你是想让大家凭想象力解题嘛 :rofl:
建议你附上文件或者多来几张图

想删除span class标签,把跳转链接转换成@@@LINK,请问该怎么弄,简单点的办法,正则小白1534d69c729858ea294c15511b6add1d

后面相同的部分替换为空,前面的部分
.*entry:// 替换成 @@@LINK=

只是给你一个思路,自行探索一下

谢谢hua,前面知道替换,就是后面每个单词不同,不会删除,能教教我吗?

老哥,你是啥意思,就是想把一个这个 image

变成:@@@link=entry://abbacare 吗?

给出个示例?要不不知道你要啥emm?另外可以发段文本,方便测试一下?哈哈

这样?

举个英语单词的例:
went
@@@LINK=go
</>
就是想输入意大利语动词各种变位直接查动词不定式,也就是动词原型。
hua的办法和我一样,就是把entry://直接替换成@@@link=,可后面每个单词跳转链接不一样,没法全删除,只能一个个删,几十万行,得删到猴年马月

是不是我上面那个图结果,再把 entry:// 去掉?

能不能发一段文本出来? 没文本,恩。。你自己朝着思路来吧

image

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"(<a href=\"entry://)(?P<link>.*?)(\"> <span.*?/span>) </a>"

test_str = (" Vedi <a href=\"entry://abbacare\"> <span class=\"verb\" style=\"font-family: Georgia, Verdana, Serif; font-size: 1.2em; font-weightbold; \">abbacare</span> </a>\n\n"
	" Hello <a href=\"entry://abbacare\"> <span class=\"verb\" style=\"font-family: Georgia, Verdana, Serif; font-size: 1.2em; font-weightbold; \">abbacare</span> </a>")

subst = "@@@LINK=\\g<link>"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

if result:
    print (result)

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

没有文本,我 ocr 的文本,格式可能和你的文本不一致,因此仅供参考。

你直接拿出一段文本来,说它应该变成啥文本,不就好了? 你要是老这样解释,我是理解不了了,那我就溜了。

不明白,意大利语动词反向查询的跳转链接,跳转动词,变形词转到headword 啥我都不知道是啥emm。
没学过意大利语,没做过字典的我,瑟瑟发抖。哈哈。

嗯,就像我举的英语go那样的模版

谢谢你的耐心解答,我没有说清楚。这个是一份意大利语动词反向查询的跳转链接,制作者在txt里加了每个跳转动词的颜色,字体,所以后面除了跳转动词不一致,整个标签其实是一样的。不知道我这么解释,你明白了不?

谢谢你的耐心解答,我没有说清楚。这个是一份意大利语动词反向查询的跳转链接,制作者在txt里加了每个跳转动词的颜色,字体,所以后面除了跳转动词不一致,整个标签其实是一样的。不知道我这么解释,你明白了不?

其实,制作原理是一样的,英语词典里很多人都加了这种链接,就是把它的变形词转到headword

后面是不定式的字体和颜色,单词都不同,怎么替换啊?只能替换相同部分。说清楚点,可以吗?

觉得可以琢磨下vim应该可以搞定,查找替换应该就可以了