black2
1
韦氏高阶英汉双解词典2019完美版, <span class="dx"> see also <a class="dx_link" href="entry://adam's%20apple">adam's apple</a>, 词条 Adam's apple
牛津高阶英汉双解词典第10版完美版,<a class="Ref" href="entry://adam-s-apple#adam-s-apple"><span class="xr-g"><span class="xh">Adam’s apple</span></span></a><span class="sep">,</span> ,词条 adam-s-apple (adam's apple
@@@LINK=adam-s-apple)
<a class="Ref" href="entry://@topic_food_level=a1"><span class="topic" href="l2:food_and_drink:food?cefr=a1"><span class="topic_name">Food</span><span class="topic_cefr">a1</span></span></a>
第9版,<a href="entry://entry://Adam's apple">Adam's apple</a> , 词条 Adam's apple
韦氏双解,<a href="entry://Adam%27s%20apple" class="otherwords">Adam's apple<span> , 词条 Adam's apple
谁知道啊,给点建议。
感谢各位的支持,原来想通过分析href的超链部分得到词头再查询,但超链中的特殊符号多个词库都各用各的,难以兼容。现直接取用显示文本作为词头,再处理一些例外,比较方便。
black2
3
做一个mdx的查词词典,简单主词条的话都没问题,但是你看他的二级词条,比如你查apple ,apple页面出来了以后,apple页的最下面有一个see also,see also行的链接,不同的词典有不同的代码及格式。
这些链接实际上链接的都是 adamsapple,代码参考这里:
1 个赞
winn
5
我也没看明白要做什么。html完整的话,提取〈a〉到〈/a〉之间的文本不就行了?
amob
6
从楼主前面多个帖子和此贴都能看出来,楼主对html和正则都所知甚少,这搞开发多吃力啊。这是零基础编程吗?有的问题实在无言以对,都感觉是缺乏检索信息和思考。
black2
8
谢谢,各个词库的a 标签的格式都还不一致。想通吃的话,搞不定。不知道欧路是咋能通吃的
amob
10
都是一样的,跳转就是href=“entry://{词条}”,链接到的就是entry://后方的内容,只有这个部分需要处理,别的保持原样就行了。
根本没有什么技术含量,所以说基本知识要具备的。
你问的都是最低级的问题了。不过你都完全不知道HTML怎么回事,那就很难理解了。
1 个赞
winn
11
首先你要说明你想提取的是什么?是要跳转的词条还是链接文本?有些词典两者一致,有些不一致。这个确定之后再做下一步。你可以先熟悉HTML里的链接标签〈a〉的用法,这样问题就可以迎刃而解了。