Vdict 图片数据的地址

vdict_books 上的词典有几十个词典的xml(纯文字、无图片)。

有些词典,如辞源、现汉能从官网 vdict 官网 上找到图片地址。

  • 现汉:https://cdn-juzi-res.vdict.com.cn/xianhanv7/images/P0097I001.png
  • 新时代中文 https://cdn-juzi-res.vdict.com.cn/juzi/image/ZA10802.png

但其他词典,如中国艺术百科辞典,有 image 标签 2459 个,但猜不出词典网址。

	<EntryMessage id="81445049-YSBK1075">
		<Entry>阳泉使者舍薰炉铭</Entry>
		<ExplainText><item>西汉时期金文作品。隶书,偶尔间杂一些篆书笔意。其书作单线式笔画,但撇捺的八分挑法与长横波势,均有恰当的体现。依照隶书体演进的情况和西汉金文书风,该铭最早不过昭、宣时期,或晚至西汉末年。体势雄阔开张,既有自身的特点,又有简牍书及刻石的意味,是一件难得的早期八分隶书的代表作。《中国美术全集·书法篆刻编·商周至秦汉书法》收录。</item></ExplainText>
		<Image>XC086.TIF</Image>
	</EntryMessage>

请教懂网络爬虫相关的坛友指点一二。

【新华写字字典】有大量图片,也找不到资源网址。

	<IMG><img align="absmiddle" width="77" height="78" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b0b7.jpg"/></IMG>
	<BiShun><img align="absmiddle" width="203" height="27" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b091.jpg"/></BiShun>
	<BuChong><img align="absmiddle" width="88" height="38" src="/CRFDPIC/R201108077/r201108077_tm1.txt.79b0a9.jpg"/>

《新时代英汉大词典》也有未知图片,有资源的可以先备份,mdx词典可以慢慢做。

      <explanation level="1" wordclass="[C]" field="【动】"> 
        <interp>紫貂,黑貂(
          <italic>Martes zibellina</italic>)(见图)
          <ref refID="S1.TIF" title="sable&lt;sup&gt;1&lt;/sup&gt; -1"/>
        </interp> 
      </explanation>  

官方源可能在网站、app找到,而坛友的pdf版的图片显示 有900 多张: 【切词版】新时代英汉大词典 ,如果用pdf版的图片补录,需要900张匹配图片地址 =.= ,这几天看前辈们修改词典数据所劳甚多,最好是有现成的资源而非人工匹配。

访问不了了 :sob:

1 Like