【v1.6_20240123】AutoMdxBuilder 自动化制作 mdx 词典

这个是实现问题,关系到上面导航的 >>词目[P2],小瑕疵不改了影响不大

新年好,能否加个可选项显示图片辞典一页内所有词头?

2 个赞

大神,全索引模板D建议再提供一种文件形式。

一般人爬虫网站获取到的目录结构都是与词条在同一界面,比如知网。按照现在的模板,目录放在前而所有词条列在后,要处理成这样真不太容易,只用文本编辑器的正则肯定就办不到,给小白难度比较高。
再比如有的百科网站之类的也有分类目录,目录下词条顺序是不明的,也没有根据分类层级列出所有词条的网页。
综合以上两种情况,也许只好处理成这样的结构,比如【L0】建筑【L1】中国【L2】古代→万里长城→词条正文。如何呢?

遇到具体的网站,还是得具体分析写程序。要求AutoMdxBuilder通杀也许奢望过多了 :face_with_monocle:,若不提供新结构能理解。

哈哈,目前在用模板D的用户估计只有我了吧 :yum:(除您外没见谁分享过模板D词典),望楼主考虑下我的拙见 :laughing:

1 个赞

我有段时间没去制作词典了,最近在修炼,可能暂时不能给AMB加新功能。至于你提的这个需求,我还不是太清楚,最好能加上示例(能贴图或格式文本更好),比如需要从什么样的原材料,得到什么样的结果。

1 个赞

就拿这个例子而言,爬取到的源数据可能是这样的。
<header>建筑→中国→古代</header>
<headword>万里长城</headword>
所以处理成例子这样会比较容易,而如果要按照现在模板结构,得写一个程序先找到同目录的,再分类放置在后方,写起来会很复杂,基本要把AutoMdxBuilder的模板D轮子再造一遍了。

目录层级下有多少词条未知,词条顺序也未知,最终得到的结果就是类似于现在模板D的把同层级词条放在一起作为目录。目录下的词条排序可以调用现成的拼音库,部首库等来排序。

1 个赞

明白你意思了。这种在 Emeditor 中也可以手动处理,每个词条都处理成向这样的一行

<header>建筑→中国→古代</header>      <headword>万里长城</headword><body>...</body>

然后排序,这样同章节的词条就汇集到一块儿去了。后续模板D的 index_all.txt 可以考虑兼容类似这样的格式:

建筑→中国→古代→万里长城      <headword>万里长城</headword><body>...</body>
建筑→中国→现代→东方明珠      <headword>东方明珠</headword><body>...</body>
...

其中各行没有顺序要求,想必这样就能覆盖你的这种需求了。

1 个赞

楼主您好,想请教您一下,帖子标题中版本已更新至1.6,不过目前似乎还未发布?

不急,目前正用著1.5,很受用。受益於您工具良多,由衷感谢。

也祝福您修炼平安,出关後一切顺遂!

用automdxbuilder打包,mdict会无法读取。明明单独用mdict-utils没问题。

这个功能是还没加入吗,没有任何反应?


image

嗯还没加,这个工具有段时间没更新了,暂无计划


toml 默认配置文件中列举的应该就这项还没落实

首先感谢Mandolin大神设计此软件,这给电子词典制作小白的我又提供了一条新路径。但是,我在跟从B站相关教程一步步制作后在最后一步显示不成功


翻阅了之前的回复发现可能是txt文件编码存在问题,于是经前辈指点用emeditor另存为utf-8(无签名)的编码格式,但是重新运行后还是出现了以上同样的结果。不知能否劳您解答一二 :face_holding_back_tears:

INFO 的提示是安全的,可以忽略

图像处理完毕。

再后续呢,应该制作成功了吧,看看有没有输出 <词典名>_mdx 文件夹

1 个赞

感谢您的回复 :handshake:
但是并没有mdx文件生成,准确来说什么都没有生成 :sob:我点了一下enter键之后AMB就闪退了


(因为我操作比较缓慢,该录屏从24s后才是真正的步骤)

试试用下面这个 index 索引文件(这是正确的格式),把你旧的文本拷贝覆盖进来就行

index.txt (21 字节)

注意文件内容最后是要留一个换行的
image

1 个赞

谢谢您提供的方法,按照您的要求去做了但是还是不行 :sob:

后面的忘记录制了,就是结果还是没有mdx文件 :face_holding_back_tears:

这个 AMB 1.5 确实可能会有莫名的问题,不介意的话可以把原材料发私发我,我这边帮你试试。

1 个赞

希望制作linux版

再來這個帖子下求助大神。我有一個別人做的MDX,想提取其中的詞條和頁碼表,這樣可以重新製作。但是用AMB好像無法還原?操作後只出現了空文件。
不知道大神有什麼建議嗎?

如果这个mdx是通过AMB生成的,那么可以再通过AMB直接还原成index索引文件;如果不是,那么只能通过AMB解包成txt和图片,再手动通过文本编辑器从txt中提取页码索引。