选取一部分内容:
愤懑
<link rel="stylesheet" type="text/css" href="hycd.css"><entry><hw>愤懑</hw><py>fènmèn</py><def><pt>书</pt><ps>形</ps>气愤;抑郁不平:~之情,溢于言表。</def></entry>
</>
羞花闭月
<link rel="stylesheet" type="text/css" href="hycd.css"><entry><hw>羞花闭月</hw><py>xiūhuā-bìyuè</py><def>见〖<a href="entry://闭月羞花">闭月羞花</a>〗。</def></entry>
</>
羞赧
<link rel="stylesheet" type="text/css" href="hycd.css"><entry><hw>羞赧</hw><py>xiūnǎn</py><def><pt>书</pt><ps>形</ps>因害臊而红了脸的样子。</def></entry>
</>
羞辱
<link rel="stylesheet" type="text/css" href="hycd.css"><entry><hw>羞辱</hw><py>xiūrǔ</py><def><num>①</num><ps>名</ps>耻辱。</def><def><num>②</num><ps>动</ps>使受耻辱:~了他一顿。</def></entry>
</>
麟
<link rel="stylesheet" type="text/css" href="hycd.css"><entry><hw>麟(<sup>⁎</sup>麐)</hw><py>lín</py><def><pt>书</pt>麒麟:凤毛~角。</def><ci><div class="title">词语</div><div class="cont"><a href="entry://麟凤龟龙">麟凤龟龙</a></div></ci></entry>
</>
为了正确提取目标单词,我们需要在每个标记内再次使用正则表达式来提取包含书的内容。
找“书”,提取单词,结果为:
愤懑
羞赧
麟(麐)
这只是一个小小的demo,我想知道怎么把txt文本文件内容填充到excel第一列为单词,第二列为解释,我感觉好像更复杂一些……
现汉7书面语.txt (45.6 KB)