初來乍到,如有失禮懇請見諒。
我想基於 辞源-第三版 將 MDX 格式的辭書轉換成 MOBI 格式的辭書以供 Kindle 使用。
我使用 PyGlossary 將 MDX 解包成
content.opf
g000***.xhtml
等文件,置於工作目錄下,並將原辭書文件中的 css 拷貝到工作目錄並更名爲style.css
。
編輯完元信息,使用 kindlegen 生成 mobi 辭書,我發現生成出來的大多數詞項都沒有釋義。
起初我以爲是 <idx:orth> ... </idx:orth>
中間有代碼的緣故,將它轉成純文本,似乎無濟於事。
我截取了一段 XHTML
代碼:
<idx:entry scriptable="yes" spell="yes">
<idx:orth>
三節棍
</idx:orth>
<br/>
<link href="cy3.css" rel="stylesheet"/>
<main id="IZN373">
<header class="phrase_header">
<div class="info">
<span class="col">
3
</span>
<span class="yema">
1460392135
</span>
<span class="parentid">
1460142797
</span>
</div>
<div class="phr_hw">
<span class="key">
<a href="bword://三">
三
</a>
<a href="bword://節">節</a>
<a href="bword://棍">棍</a>
</span>
<pron>
<a href="bword://sān">sān</a>
<a href="bword://jié">jié</a>
<a href="bword://hùn">hùn</a>
</pron>
</div>
</header>
<div class="img_box">
<img alt="三節棍" src="A100006.png"/>
</div>
<section class="phrase_def">
<div class="sense_box">
<div class="sense no_num">
古武器名。在棍的一頭用鐵索連接短棍兩節,用以擊敵,可破刀牌。
<z>明</z><z> 茅元儀</z> <q>武備志</q>一〇四 <q>軍資乘</q>稱爲連珠雙鐵鞭。</div>
</div>
</section>
</main>
</idx:entry>
<hr/>
<idx:entry scriptable="yes" spell="yes">
<idx:orth>
三精
</idx:orth>
<br/>
<link href="cy3.css" rel="stylesheet"/>
<main id="manualId">
<header class="phrase_header">
<div class="phr_hw">
<span class="key">
<a href="bword://三">三 </a>
<a href="bword://精">精 </a>
</span>
<pron>
<a href="bword://sān">sān </a><a href="bword://jīng">
jīng</a>
</pron>
</div>
</header>
<section class="phrase_def">
<div class="sense_box">
<div class="sense no_num">
日、月、星。
<shuzheng>
<q>後漢</q><q>書</q> <q>光武帝紀</q> <q>贊 </q>:“九縣飆回,三精霧塞。”
</shuzheng> <q>注 </q>:“三精,日、月、星也。”
</div>
</div>
</section>
</main>
</idx:entry>
<hr/>
這兩項中,「三節棍」的釋義出現在了結果中,而「三精」沒有,僅有詞頭。
我不知道究竟二者有何本質區別而影響了它們是否能在最終的 MOBI 文件中出現。
如有朋友想要測試,我裁剪了一下源文件:
Test.tar.gz (82.5 KB)
我的作業系統是 Arch Linux,而 Kindlegen 版本:
*************************************************************
Amazon kindlegen(Linux) V2.9 build 1028-0897292
A command line e-book compiler
Copyright Amazon.com and its Affiliates 2014
*************************************************************