vdict_books 上的词典有几十个词典的xml(纯文字、无图片)。
有些词典,如辞源、现汉能从官网 vdict 官网 上找到图片地址。
- 现汉:
https://cdn-juzi-res.vdict.com.cn/xianhanv7/images/P0097I001.png
- 新时代中文
https://cdn-juzi-res.vdict.com.cn/juzi/image/ZA10802.png
但其他词典,如中国艺术百科辞典,有 image 标签 2459 个,但猜不出词典网址。
<EntryMessage id="81445049-YSBK1075">
<Entry>阳泉使者舍薰炉铭</Entry>
<ExplainText><item>西汉时期金文作品。隶书,偶尔间杂一些篆书笔意。其书作单线式笔画,但撇捺的八分挑法与长横波势,均有恰当的体现。依照隶书体演进的情况和西汉金文书风,该铭最早不过昭、宣时期,或晚至西汉末年。体势雄阔开张,既有自身的特点,又有简牍书及刻石的意味,是一件难得的早期八分隶书的代表作。《中国美术全集·书法篆刻编·商周至秦汉书法》收录。</item></ExplainText>
<Image>XC086.TIF</Image>
</EntryMessage>
请教懂网络爬虫相关的坛友指点一二。
【新华写字字典】有大量图片,也找不到资源网址。
<IMG><img align="absmiddle" width="77" height="78" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b0b7.jpg"/></IMG>
<BiShun><img align="absmiddle" width="203" height="27" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b091.jpg"/></BiShun>
<BuChong><img align="absmiddle" width="88" height="38" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b0a9.jpg"/>
《新时代英汉大词典》也有未知图片,有资源的可以先备份,mdx词典可以慢慢做。
<explanation level="1" wordclass="[C]" field="【动】">
<interp>紫貂,黑貂(
<italic>Martes zibellina</italic>)(见图)
<ref refID="S1.TIF" title="sable<sup>1</sup> -1"/>
</interp>
</explanation>
官方源可能在网站、app找到,而坛友的pdf版的图片显示 有900 多张: 【切词版】新时代英汉大词典 ,如果用pdf版的图片补录,需要900张匹配图片地址 =.= ,这几天看前辈们修改词典数据所劳甚多,最好是有现成的资源而非人工匹配。