请大侠帮忙,把它转成MDX格式

在下愚钝,自己尝试了一个多星期,除了头大了一些圈后,没有任何收获,无奈只得请大侠帮助,把它转换成mdx词典,如蒙惠赐,不胜感激。先谢为敬。
The American Heritage Essential English Dictionary 2011.epub (9.1 MB)

1 个赞

这个早就有人求过,好像没有结果。你自己动手吧。参见:

2 个赞

密码:本坛

4 个赞

Thanks. I put this request several months ago. Thanks again

If @kadioguy modify its css.

收到,看后非常满意,无论内容和版式,对大侠的慷慨相助万分感谢,给大侠拜个早年,祝大侠新的一年里如意快乐。
另有一不情之请,大侠能否于百忙之际,抽出时间,以此为例新开一贴,给新手小白科普下到底应该怎样正确地转换epub到mdx,因为我曾试转换过,只进行到解压、合并、打开emeditor看着头脑中一片茫然、惶然,不知到该删除什么、保留什么,应该进行怎样的正确操作,急需大侠于关键重要处指点迷津。教程如能越详细步骤越具体越好。再次真心感谢并衷心祝好。

1 个赞

密码是本站的域名?试了几种都不对,算了,不用了。

Password: forum.freemdict.com

EPUB to mdx
1,解压。
2,合并文件。不用转txt,也不用改后缀,直接合并成txt。


也可以用emeditor合并。方法众多。

3、分隔词条
1),词条间的分隔。找到词条与词条分隔的地方。这次分隔点非常明显。


2),文件间的分隔,这个简单,直接在</html>后加入一个标志,如####。每个文件第一条,要特别处理,为和后面进行统一处理,这个标签应该改在<body class="calibre">

<body class="calibre">\n(<div (id="filepos\d+" )?class="calibre1"><div class="calibre1"><span class="bold"><span class="calibre5">.*)
<body class="calibre">\n####\1\n\1
4、找到词头,非常明显<hr class="calibre_4"/>后面就是词头。
<span class="bold"><span class="calibre5">就是词头的关键标志。

<hr class="calibre_4"/>(<div (id="filepos\d+" )?class="calibre1"><div class="calibre1"><span class="bold"><span class="calibre5">.*) \n####\1\n\1
5,去除词头这一行标签。查找####.+,全选。替换<.*?>,清除标签。再整理一下,就符合mdx源格式。注意勾选 仅限于选区。


不要忘记加入样式。
整理完,就可以用MdxBuilder制作mdx。
6、其它:
1),无用内容清理:主要是html文件首尾内容清理。
2),文中链接,用ID作中间跳转。直接提取 词头+ID。整理一下就行。
3),文中存在一些图片,复制到相应位置,注意文件路径,特别是打包成MDD。
4),样式上,基本直接套用用来的样式就可以。

关键就是分隔词条和处理词头。
需要懂一点正则,难度不大。

7 个赞

感谢!我再试一试。

I roughly modified the css file.

大致修改了一下,因為有加入新標籤,因此mdx要一併更新 :smile:

[mdx v.1.1a]
The American Heritage Essential English Dictionary 2011.rar (10.0 MB)

[CSS 例句分行]
TAHEED.css (4.5 KB)

若不喜欢分行,把这里删去即可:

.calibre_3>.italic
{
display: block;
margin-left: 14px;
font-style: normal;
}

[已知問题]
有些词头,如live,有分1、2,查询时只能用live 1、live 2等方式查到(原来的版本即是如此)。

2 个赞

You are such a great person. :+1:
If possible, example sentences should be in a new line. Thanks for your immediate response.

很棒的教程!

Look at these numbers, I think these should be in a new line, and example sentences too.

I’ve updated my post #12.

If you like these a, b, and c in new lines, this is what I can do for now:

TAHEED.css (4.5 KB)

2 个赞

You know better. On android it’s look like this.

It is better to deal it with your own choice.