在下愚钝,自己尝试了一个多星期,除了头大了一些圈后,没有任何收获,无奈只得请大侠帮助,把它转换成mdx词典,如蒙惠赐,不胜感激。先谢为敬。
The American Heritage Essential English Dictionary 2011.epub (9.1 MB)
这个早就有人求过,好像没有结果。你自己动手吧。参见:
密码:本坛
Thanks. I put this request several months ago. Thanks again
If @kadioguy modify its css.
收到,看后非常满意,无论内容和版式,对大侠的慷慨相助万分感谢,给大侠拜个早年,祝大侠新的一年里如意快乐。
另有一不情之请,大侠能否于百忙之际,抽出时间,以此为例新开一贴,给新手小白科普下到底应该怎样正确地转换epub到mdx,因为我曾试转换过,只进行到解压、合并、打开emeditor看着头脑中一片茫然、惶然,不知到该删除什么、保留什么,应该进行怎样的正确操作,急需大侠于关键重要处指点迷津。教程如能越详细步骤越具体越好。再次真心感谢并衷心祝好。
密码是本站的域名?试了几种都不对,算了,不用了。
Password: forum.freemdict.com
EPUB to mdx
1,解压。
2,合并文件。不用转txt,也不用改后缀,直接合并成txt。
也可以用emeditor合并。方法众多。
3、分隔词条:
1),词条间的分隔。找到词条与词条分隔的地方。这次分隔点非常明显。
2),文件间的分隔,这个简单,直接在
</html>
后加入一个标志,如####。每个文件第一条,要特别处理,为和后面进行统一处理,这个标签应该改在<body class="calibre">
<body class="calibre">\n(<div (id="filepos\d+" )?class="calibre1"><div class="calibre1"><span class="bold"><span class="calibre5">.*)
<body class="calibre">\n####\1\n\1
4、找到词头,非常明显<hr class="calibre_4"/>
后面就是词头。
<span class="bold"><span class="calibre5">
就是词头的关键标志。
<hr class="calibre_4"/>(<div (id="filepos\d+" )?class="calibre1"><div class="calibre1"><span class="bold"><span class="calibre5">.*) \n####\1\n\1
5,去除词头这一行标签。查找####.+
,全选。替换<.*?>
,清除标签。再整理一下,就符合mdx源格式。注意勾选 仅限于选区。
不要忘记加入样式。
整理完,就可以用MdxBuilder制作mdx。
6、其它:
1),无用内容清理:主要是html文件首尾内容清理。
2),文中链接,用ID作中间跳转。直接提取 词头+ID。整理一下就行。
3),文中存在一些图片,复制到相应位置,注意文件路径,特别是打包成MDD。
4),样式上,基本直接套用用来的样式就可以。
关键就是分隔词条和处理词头。
需要懂一点正则,难度不大。
感谢!我再试一试。
I roughly modified the css file.
大致修改了一下,因為有加入新標籤,因此mdx要一併更新 。
[mdx v.1.1a]
The American Heritage Essential English Dictionary 2011.rar (10.0 MB)
[CSS 例句分行]
TAHEED.css (4.5 KB)
若不喜欢分行,把这里删去即可:
.calibre_3>.italic
{
display: block;
margin-left: 14px;
font-style: normal;
}
[已知問题]
有些词头,如live,有分1、2,查询时只能用live 1、live 2等方式查到(原来的版本即是如此)。
You are such a great person.
If possible, example sentences should be in a new line. Thanks for your immediate response.
很棒的教程!
I’ve updated my post #12.
If you like these a, b, and c in new lines, this is what I can do for now:
TAHEED.css (4.5 KB)