Mdx無法轉為txt

https://downloads.freemdict.com/尚未整理/集合/Cambridge%20Dictionaries/Cambridge%20Online(190521)/
這個詞典圖片很美觀,我想要刪除沒有圖片的詞條,只保留有圖片的詞條,但是無論是mdx export 3.5還是3.6,都報錯,有沒有大神幫忙看看怎麼回事

1 个赞

這個圖片很好,五千多張,很精緻,但是mdd順利解開,mdx卻每次都解析失敗,重新下載N次,3.5和3.6都試過了,還是不行,不知道咋回事,有沒有大神知道這種情況是哪裡出現問題了。
我另外提取了FF柯林斯的只含有圖片的詞條,很簡陋但是成功了,雖然圖片不多(一兩千張)但是也不錯很清晰,但我這個沒有刪掉詞條內含的其他內容,所以卡在了css上,不知道咋屏蔽所有內容,只顯示圖片:joy:
你的步驟有點複雜,我就是用了emeditor的提取功能,很簡陋不過已經滿足我的想法了

CambridgeOnline.mdx 251mb

用MdxExport导出失败,但已经导出的部分有800mb。

CambridgeOnline.txt 800mb

我估计是内存不足。有兴趣可以用Mdict-util试一下。

我也是差不多800M中斷,info說明是Mdx Builder 3.0做的,不知道為什麼解析不了

用GetDict2.6解压的结果:
image
但是报告两处有错。
GetDict2.6.rar (42.5 KB)

1 个赞

喔喔,GetDict2.6确实可以,它会显示出错的项目,然后继续处理接下来的内容,而MdxExport则是显示遇到错误,下一步就关闭程式了。

期待楼主分享做好的图片词典 :kissing_heart:

image

贊,應該是mdx builder遇到錯誤就直接退出程序了,這個還能繼續處理。原文本是沒換行的,處理成能識別的格式,簡單地改好了,對我來說已經完美收官 :grinning:謝謝各位的幫助

链接:https://pan.baidu.com/s/1RXJTRAIlPOmHPXU96_uHug
提取码:4y11

5154個詞條,但是瀏覽了一下好像有幾個是空白的(比如aegean, acropolis),我自己不在意,但是放了源文本覺得需要改的可以看看,或者解包mdx自己改下,我純小白,改動的文本不知道會不會有出錯。
圖片我設置了最大高度限制,因為我在手機上用,不想太長,電腦覺得不夠大可以自己改下。
mdd用原來的就可以,不同名得改名下。
———
發現:空白不是mdx的問題,是圖片在什麼組里,被我css暴力屏蔽了,我自己將就著用了:joy:

感謝感謝,製作成功 :grin:

編輯太多次,編輯不了了,我的css有問題,大家自己改一下只顯示圖片的。我的就是一鍵替換display:none;然後刪掉圖片部分的,很快速很暴力,結果有些地方有圖片也被屏蔽了。

查了一下,angular这个词就算用原本的css好像也是没图案的?

原來的mdx這個沒有圖片,絕對是我提取的時候提取錯了:joy:

我这边也改了一个,有含词条名称和词性。有些词条有两个词性,第二个词性没删掉的原因在于,有的图片是放在第二个词性底下的。

搭配 CambridgeOnline.1.mdd使用,但下载后,要改名为 CambridgeOnline.mdd,因为原本的CambridgeOnline.mdd是音档,我们不需要,而顺序上则得要先是.mdd,不能直接是.1.mdd,不然读不到。

CambridgeOnline.rar (17.8 MB) [mdx]

CambridgeOnline.css (66.8 KB)

1 个赞

aegean, acropolis這些mdx都有,沒顯示是我原來的css太暴力了,大概率在css里包裹在某個組被一起屏蔽掉了:laughing:

1 个赞

尝试改出来了 :smile:
CambridgeOnline.css (66.9 KB) v.1.0b [2023.08.15更新]

不过缺点是红框处的部份也显现了,无法两全其美 :sweat_smile:

2 个赞

:+1: :+1:

转换另一个mdx的时候,报这个错误,很奇怪…
MxdExport,mdict命令行工具,GetDict工具都不行

f11e2e012f5779bbcbf845c0bc4b711a

你是要自己轉換嗎,原文件從Getdict得出来的格式不对,mdx builder好像不認識,得手動改一下

我在转另一个mdx

誤會了 :joy: :joy:

试试不同的版本。记得隔壁的有人说过有的mdx只能用某个特定的版本。