这个是实现问题,关系到上面导航的 >>词目[P2],小瑕疵不改了影响不大
新年好,能否加个可选项显示图片辞典一页内所有词头?
大神,全索引模板D建议再提供一种文件形式。
一般人爬虫网站获取到的目录结构都是与词条在同一界面,比如知网。按照现在的模板,目录放在前而所有词条列在后,要处理成这样真不太容易,只用文本编辑器的正则肯定就办不到,给小白难度比较高。
再比如有的百科网站之类的也有分类目录,目录下词条顺序是不明的,也没有根据分类层级列出所有词条的网页。
综合以上两种情况,也许只好处理成这样的结构,比如【L0】建筑【L1】中国【L2】古代→万里长城→词条正文。如何呢?
遇到具体的网站,还是得具体分析写程序。要求AutoMdxBuilder通杀也许奢望过多了 ,若不提供新结构能理解。
哈哈,目前在用模板D的用户估计只有我了吧 (除您外没见谁分享过模板D词典),望楼主考虑下我的拙见 。
我有段时间没去制作词典了,最近在修炼,可能暂时不能给AMB加新功能。至于你提的这个需求,我还不是太清楚,最好能加上示例(能贴图或格式文本更好),比如需要从什么样的原材料,得到什么样的结果。
就拿这个例子而言,爬取到的源数据可能是这样的。
<header>建筑→中国→古代</header>
<headword>万里长城</headword>
所以处理成例子这样会比较容易,而如果要按照现在模板结构,得写一个程序先找到同目录的,再分类放置在后方,写起来会很复杂,基本要把AutoMdxBuilder的模板D轮子再造一遍了。
目录层级下有多少词条未知,词条顺序也未知,最终得到的结果就是类似于现在模板D的把同层级词条放在一起作为目录。目录下的词条排序可以调用现成的拼音库,部首库等来排序。
明白你意思了。这种在 Emeditor 中也可以手动处理,每个词条都处理成向这样的一行
<header>建筑→中国→古代</header> <headword>万里长城</headword><body>...</body>
然后排序,这样同章节的词条就汇集到一块儿去了。后续模板D的 index_all.txt 可以考虑兼容类似这样的格式:
建筑→中国→古代→万里长城 <headword>万里长城</headword><body>...</body>
建筑→中国→现代→东方明珠 <headword>东方明珠</headword><body>...</body>
...
其中各行没有顺序要求,想必这样就能覆盖你的这种需求了。
楼主您好,想请教您一下,帖子标题中版本已更新至1.6,不过目前似乎还未发布?
不急,目前正用著1.5,很受用。受益於您工具良多,由衷感谢。
也祝福您修炼平安,出关後一切顺遂!
用automdxbuilder打包,mdict会无法读取。明明单独用mdict-utils没问题。
嗯还没加,这个工具有段时间没更新了,暂无计划
toml 默认配置文件中列举的应该就这项还没落实
首先感谢Mandolin大神设计此软件,这给电子词典制作小白的我又提供了一条新路径。但是,我在跟从B站相关教程一步步制作后在最后一步显示不成功
翻阅了之前的回复发现可能是txt文件编码存在问题,于是经前辈指点用emeditor另存为utf-8(无签名)的编码格式,但是重新运行后还是出现了以上同样的结果。不知能否劳您解答一二
INFO 的提示是安全的,可以忽略
图像处理完毕。
再后续呢,应该制作成功了吧,看看有没有输出 <词典名>_mdx
文件夹
感谢您的回复
但是并没有mdx文件生成,准确来说什么都没有生成 我点了一下enter键之后AMB就闪退了
(因为我操作比较缓慢,该录屏从24s后才是真正的步骤)
谢谢您提供的方法,按照您的要求去做了但是还是不行
后面的忘记录制了,就是结果还是没有mdx文件
这个 AMB 1.5 确实可能会有莫名的问题,不介意的话可以把原材料发私发我,我这边帮你试试。
希望制作linux版
再來這個帖子下求助大神。我有一個別人做的MDX,想提取其中的詞條和頁碼表,這樣可以重新製作。但是用AMB好像無法還原?操作後只出現了空文件。
不知道大神有什麼建議嗎?
如果这个mdx是通过AMB生成的,那么可以再通过AMB直接还原成index索引文件;如果不是,那么只能通过AMB解包成txt和图片,再手动通过文本编辑器从txt中提取页码索引。