请教下: 如何精准匹配对应的闭合标签

就是在面对标签多次嵌套的情况.
如:

我想要匹配类名为ok下的所有内容. 如何精准的匹配到类名ok相对应的闭合标签呢.

有什么工具,或者有效的正则表达式吗?

有的词典没有提取动词短语。我想自己动手提取,所以就遇到了这么一个难题。不知道如何精准匹配到相对应的闭合标签。

如果只是想手动编辑,而且文件不大,换VSCode、WebStorm之类的前端IDE吧,他们的格式化工具可以很轻松的区分不同层级的标签

如果是要批量编辑,就很麻烦了,这个涉及到语法树解析,对算法有一定要求(好吧,我就是个连抄JSON解析器都抄不明白的废物2333)

如果是编程,JS的有jQuery, C++有pugixml, GO有goquery,如果不想用第三库,可以参考我写的:https://github.com/csg2008/tools/blob/master/MDictTools/tidy.go 中DOM.Find方法实现。

笨方法:<div>前面加个\n,就能精确匹配最里面的div,然后删除\n,又能匹配上一级
重复操作……
建议操作时换个标签或者插入一个不需要的字符。

有的词典没有提取动词短语。我想自己动手提取,所以就遇到了这么一个难题。不知道如何精准匹配到相对应的闭合标签。

用python的bs4库

正则很难,提取动词短语,需要用楼上说的python+bs4。

https://beautifulsoup.readthedocs.io/zh-cn/v4.4.0/