想删除一串字符前后相同，中间引号加单词

simon · 2020 年6 月 1 日 16:21

想把一本意大利语反向动词查询的链接去掉，换成@@@link=动词不定式，请问如何用正则替换。就是想删除每一个单词的span class=verb style 这一项，有没有简单的方法。

Arlin · 2020 年6 月 2 日 09:19

你是想让大家凭想象力解题嘛
建议你附上文件或者多来几张图

simon · 2020 年6 月 3 日 01:11

想删除span class标签，把跳转链接转换成@@@LINK，请问该怎么弄，简单点的办法，正则小白

hua · 2020 年6 月 3 日 02:32

后面相同的部分替换为空，前面的部分
.*entry:// 替换成 @@@LINK=

只是给你一个思路，自行探索一下

simon · 2020 年6 月 3 日 03:24

谢谢hua，前面知道替换，就是后面每个单词不同，不会删除，能教教我吗？

violetu · 2020 年6 月 3 日 13:04

老哥，你是啥意思，就是想把一个这个

变成：@@@link=entry://abbacare 吗？

violetu · 2020 年6 月 3 日 13:40

给出个示例？要不不知道你要啥emm？另外可以发段文本，方便测试一下？哈哈

这样？

simon · 2020 年6 月 4 日 00:18

举个英语单词的例：
went
@@@LINK=go
</>
就是想输入意大利语动词各种变位直接查动词不定式，也就是动词原型。
hua的办法和我一样，就是把entry：//直接替换成@@@link=，可后面每个单词跳转链接不一样，没法全删除，只能一个个删，几十万行，得删到猴年马月

violetu · 2020 年6 月 4 日 00:20

是不是我上面那个图结果，再把 entry：// 去掉？

能不能发一段文本出来？没文本，恩。。你自己朝着思路来吧

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"(<a href=\"entry://)(?P<link>.*?)(\"> <span.*?/span>) </a>"

test_str = (" Vedi <a href=\"entry://abbacare\"> <span class=\"verb\" style=\"font-family: Georgia, Verdana, Serif; font-size: 1.2em; font-weightbold; \">abbacare</span> </a>\n\n"
	" Hello <a href=\"entry://abbacare\"> <span class=\"verb\" style=\"font-family: Georgia, Verdana, Serif; font-size: 1.2em; font-weightbold; \">abbacare</span> </a>")

subst = "@@@LINK=\\g<link>"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

if result:
    print (result)

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

没有文本，我 ocr 的文本，格式可能和你的文本不一致，因此仅供参考。

你直接拿出一段文本来，说它应该变成啥文本，不就好了？你要是老这样解释，我是理解不了了，那我就溜了。

不明白，意大利语动词反向查询的跳转链接，跳转动词，变形词转到headword 啥我都不知道是啥emm。
没学过意大利语，没做过字典的我，瑟瑟发抖。哈哈。

simon · 2020 年6 月 4 日 00:21

嗯，就像我举的英语go那样的模版

simon · 2020 年6 月 4 日 00:38

谢谢你的耐心解答，我没有说清楚。这个是一份意大利语动词反向查询的跳转链接，制作者在txt里加了每个跳转动词的颜色，字体，所以后面除了跳转动词不一致，整个标签其实是一样的。不知道我这么解释，你明白了不？

simon · 2020 年6 月 4 日 00:43

谢谢你的耐心解答，我没有说清楚。这个是一份意大利语动词反向查询的跳转链接，制作者在txt里加了每个跳转动词的颜色，字体，所以后面除了跳转动词不一致，整个标签其实是一样的。不知道我这么解释，你明白了不？

simon · 2020 年6 月 4 日 00:46

其实，制作原理是一样的，英语词典里很多人都加了这种链接，就是把它的变形词转到headword

simon · 2020 年6 月 4 日 05:50

后面是不定式的字体和颜色，单词都不同，怎么替换啊？只能替换相同部分。说清楚点，可以吗？

guochaoxxl · 2020 年6 月 5 日 01:27

觉得可以琢磨下vim应该可以搞定，查找替换应该就可以了

想删除一串字符 前后相同，中间引号加单词

想删除一串字符前后相同，中间引号加单词