《教育部重編國語辭典修訂本》mdx版

《教育部重編國語辭典修訂本》 MDX版
共 162806 條目,包含 1494 個異體字條目
原資料來自《教育部重編國語辭典修訂本》網路版 https://dict.revised.moe.edu.tw/
由最新版號 2015_20220328 的開放資料檔為底本製作

2022-06-28版

修正前一版 17項 錯誤,調整了排版,讓手機閱讀更舒服

全宋體98MB 打包為 WOFF 格式後僅 3MB,解決了缺字問題

這次的版本行動裝置都可以正常閱讀了

請先刪除舊版,不要直接覆蓋

0628版下載:https://cloud.freemdict.com/index.php/s/yknNrEfLw2ynMTq


2022-06-20版

這辭典非常噁心,圖片字一堆,還有自造字,基本上可看出沒Unicode時代的遺跡
我把錯字轉碼為 WFG 的全宋體,170個字僅6個字無對應,其餘都修正了

因為使用了全宋體的編碼
使用需至 https://fgwang.blogspot.com 安裝 WFG 的 全宋體
行動裝置無法安裝全宋體,所以應該無法正常使用

第一次嘗試製作 MDX,各方面還沒熟悉
聽說可以把字體刪減轉成WOFF,之後打包成 MDD,不過我還沒找到教學
如果學會了會回來更新移動端適用的版本

gycd_edutw.zip.001 (8 MB)
gycd_edutw.zip.002 (8 MB)
gycd_edutw.zip.003 (6.2 MB)

6 Likes

Example:

@font-face {font-family: FSung-F; src: url("FSung-F.ttf");}
a {font-family: FSung-F;}
3 Likes
  • 有兩種實現方式:

    1. 如樓主所言,轉化為 WOFF 檔,打包入 MDD

    2. 將超出 30MB 體積的那些字體文件用 FontCreator 拆分,然後 CSS 中配置字體項,所有字體文件須隨同 MDX 處於同一路徑。【注:理論上也可以打包入 MDD,敝人未曾嘗試,期待壇友測試】

【參考代碼】

/* 字體設定 */
@font-face {
    font-family: FSung-p;
    src: local(FSung-p), local(FSung-m), url('./FSung-p.ttf'), url('./FSung-m.ttf');
    unicode-range: U+0-FFFD;
}

@font-face {
    font-family: FSung-1;
    src: local(FSung-1), url('./FSung-1.ttf');
    unicode-range: U+10000-1FFFF;
}

@font-face {
    font-family: FSung-2_01;
    src: local(FSung-2_01), url('./FSung-2_01.ttf');
    unicode-range: U+20000-2FFFF;
}

@font-face {
    font-family: FSung-2_02;
    src: local(FSung-2_02), url('./FSung-2_02.ttf');
    unicode-range: U+20000-2FFFF;
}

@font-face {
    font-family: FSung-3;
    src: local(FSung-3), url('./FSung-3.ttf');
    unicode-range: U+30000-3FFFF;
}

@font-face {
    font-family: FSung-F_01;
    src: local(FSung-F_01), url('./FSung-F_01.ttf');
    unicode-range: U+F0000-FFFFF;
}

@font-face {
    font-family: FSung-F_02;
    src: local(FSung-F_02), url('./FSung-F_02.ttf');
    unicode-range: U+F0000-FFFFF;
}

@font-face {
    font-family: FSung-X;
    src: local(FSung-X), url('./FSung-X.ttf');
    unicode-range: U+100000-10FFFF;
}

/* 字目 */
.entry {
    font-family: FSung-p, FSung-1, FSung-2_01, FSung-2_02, FSung-3, FSung-F_01, FSung-F_02, FSung-X;
}

【字體拆分參考】【部件檢索】〖手機專用〗【樣式表+全宋體】

4 Likes

感謝更新与分享! :+1:

1 Like

0628更新

第一個是解決了行動端的缺字,將全宋體包了進去
就是沒學會如何包成 Mdd,但仍然可以正常使用
PC端 與 Android端 都在 MDict 測試過都沒出現問題
如果其他環境無法使用請回覆在下面

另外也一併更新了全宋體的版本,重新校對了一次
附上2個製作辭典時的文字校正記錄檔

1.教育部重編國語辭典修訂本 20220628.html
2.異體字索引表.html

目前全宋體僅缺5個字,但不知道如何回報給 WFG
這2個 html 對辭典使用無影響,解包後可直接刪除

還有加入了4個詞條,解決手機無法打特殊字的問題

1.教育部國語辭典_辭典簡介:收錄本辭典自1931年起編輯歷史
2.教育部國語辭典_別名索引表:辭典的別名條目索引
3.教育部國語辭典_異體字索引表:辭典的異體字條目索引
4.教育部國語辭典_特殊字詞索引表:製作MDX曾經修正過的條目索引

最後就是第一版發現了17個錯誤,我全部修正了
調整了一些 css 讓版面更簡潔,看起來更舒服

因為台灣無法使用 微信、百度盘、阿里云盘 等服務
原本要切割4個壓縮檔上傳,速度很慢
後在 FreeMdict TG 群有好心人提到論壇有提供雲盤
直接解決了我上傳檔案的問題,這裡實在太好了

下載請至本討論串第一篇

3 Likes

我看了半天,才反应过来您说的 行动装置 就是手机( mobile phone)

太牛了,楼主如果愿意可以分享一下怎样嵌入精简字体,其实这个还蛮有用的,特别是制作电子读物,嵌入字体的尺寸一直是个头疼的问题。全局字体对移动设备是个灾难,特别是当下移动设备无法安装自定义字体的情况下。

FontCreator 這類工具無法跨平臺使用,我看 GitHub 上也有此類精簡的工具:Fontmin - 字体子集化方案 ,這個 FontMini 終端使用實際是跨平臺的,可以直接安裝 npm 包。

更新:
我安裝上面 fontmin 後疑似我當前的 nodejs 版本會不兼容,有嘗試的可以使用:GitHub - flashlizi/fontsubset: A font subset extraction tool using google sfntly 。我這邊使用電子書測試是可以的,缺點貌似只支持 ttf,得到的 ttf 可以使用在線轉換工具轉(支持不同類型到不同類型,不唯獨 ttf):TTF to OTF | CloudConvert

  • 同感,拆分 TTF 也只是治標,佔用空間還是太大了,
  • 我嘗試使用 FontCreator 徑直將 TTF 轉換為 WOFF2 格式,
  • 但手機中未能正確調用,應當有額外的操作沒有做到。

之前的帖子刪除了,因爲從 otf 字體轉換成了 ttf(本質是不能這樣轉換的),但是步驟總體來說是正確的。

我在這裏列一下大約使用的步驟(我就拿之前做的電子書「 Release Snapshot build · Ancient-China-Books/guwenguanzhi · GitHub 」來說):

  • 首先我把字體從 Noto Serif TC 換成了 思源宋,他兩個其實來源是一樣的,但是爲什麼換呢,原因是我沒有找到前者的 ttf 版(畢竟要配合上面的工具做字體精簡);

  • 把電子書中所有的字進行聚合:

    $ cat index.html OEBPS/Text/*.html OEBPS/toc.ncx OEBPS/content.opf > all.text
    
  • 下載思源宋的 ttf 字體:SourceHanSerifTW-Medium.ttf,ttf 字體主要是配合上面的 fontsubset,然後進行精簡(具體使用方法可以參見上面的軟件地址):

    $ fontsubset -t all.text ~/Downloads/SourceHanSerifTW/SourceHanSerifTW-Medium.ttf SourceHanSerifTW-Medium.ttf
    
  • 經過上面的步驟你其實已經得到了你當前電子書的精簡版本的:SourceHanSerifTW-Medium.ttf,就在你當前目錄;

  • 最後把上面得到的 ttf 字體引用到你的電子書,完畢

通過以上的步驟我其實將字體縮減了 3.5 倍(之前是 9M,現在只有 2M):

精簡後的字體做成的電子書:

「更新」:

關於上面沒有找到 Noto 字體對應 ttf 的問題,實際上可以通過工具進行字體的轉換:GitHub - fonttools/fonttools: A library to manipulate font files from Python.

1 Like

适合单独开一贴教学。

感谢楼主更新。发现一个问题。查“全”字,阿弥陀佛兄的版本里面有【词义辨析】部分,但楼主的版本中没有。见附图,上部是阿弥陀佛兄的版本,下面是楼主的版本。

此外,阿弥陀佛兄的版本,词义跟例句是分开的,建议楼主也分开。

貌似官网也没有了词义辨析部分

@douglarek 我沒有用什麼 FontCreator ,也不懂 nodejs 或 python 等編程

就是依照 TG 群裡 Ryee、MG 這2位好心人的回答,再去網上搜索相關教學

1.先用 Fontsmaller Fontmin 等工具轉出 ttf 格式

2.再用 CloudConvert 轉出 woff2格式

最後就能將 98 MB的全宋體壓成了 3 MB

缺點是上面2個步驟的工具都有使用限制,而且不能本機作業完成

如果打包 woff2 格式時有更方便、無限制、本機作業的工具,那就更好了

@sanwan09 我製作的MDX 原資料來自《教育部重編國語辭典修訂本》網路版 https://dict.revised.moe.edu.tw/
由最新版號 2015_20220328 的開放資料檔為底本製作。

原始資料中 "全"字 沒有辨析,例句也沒分開。

原資料中存在的內文,我不去刪減,而原資料中沒有的內文,我不去添加。

我認為能夠最大程度保留原版的內容,是對辭典原作者的一種尊重。

所以我不會去添加辭典內的 辨析 或是 例句。

字詞辨析是官方不知什麼原因刪掉了,尊重那樣的決定也無妨。

不過建議例句能否考慮加個css標籤,這樣要上色或換行都方便。

例句光是上色和釋義區分,整本辭典就好讀很多。

谢谢楼主回答。我没去过官网,惭愧了。

工具是有的,我不確定你是不是會使用終端、命令這種,比如你上面的步驟其實就可以使用如下的兩個工具完成: