分享:《小學堂文字學資料庫》25萬個漢字字型+134萬個漢字字音

小學堂文字學資料庫
https://xiaoxue.iis.sinica.edu.tw/

目前共收錄字形257760個,字音1341886筆,索引366529筆。

「小學堂文字學資料庫」由臺灣大學中國文學系、中央研究院歷史語言研究所、資訊科學研究所、數位文化中心共同開發,是一個形、音、義綜合的文字學資料庫,可提供使用者根據文字的形、音等屬性先檢索出字頭,再透過字頭連接到個別的形、音、義資料庫或字書索引。本資料庫收錄的字形涵蓋甲骨文、金文、戰國文字、小篆及楷書,總數超過22萬字;收錄的聲韻資料涵蓋上古、中古、近代及現代,總數超過134萬筆; 收錄的字書索引資料則超過36萬筆。

●小學堂異體字表、字形演變、隸書、小篆、金文、甲骨文、楚系簡帛文字、秦系簡牘文字、傳抄古文字。
●小學堂上古音、中古音、官話、晉語、吳語、贛語、湘語、閩語、粵語、平話、客語、其他土話。
●小學堂韻書集成、廣韻、集韻、附釋文互註禮部韻略、增修互注禮部韻略、中原音韻、中州音韻、洪武正韻。
●國際電腦漢字與異體字知識庫。
●教育部異體字字典、常用國字標準字體筆順。
●開放康熙字典。
●遠流活用中文大辭典。
●漢語多功能字庫。
●漢字古今字資料庫:字形演變、族徽、甲骨文、金文、小篆、隸變資料庫。
●漢字古今音資料庫:上古音、中古音、韻書集成、廣韻、集韻資料庫。

小學堂漢字古今字資料庫
https://xiaoxue.iis.sinica.edu.tw/ccdb

小學堂漢字古今音資料庫
https://xiaoxue.iis.sinica.edu.tw/ccr

版權聲明

使用者操作本網站查詢介面所得之各解析度「字形圖片」及字形屬性資訊,權利人特於此明示主張以CC0 1.0通用方式,在法律許可的範圍內,拋棄該字形圖片及字形屬性資訊依著作權法可得享有之權利,使用者當可安心再行利用該查詢字形圖片及字形屬性資訊。

5 个赞

还以为你弄了离线版呢。

1 个赞

台灣的網站,在線打開都是問題。離線版才=得到。

4 个赞

附议,离线=揣兜里=安全感

1 个赞

第一时间先把声韵东西先下载了,打开是能正常打开

小學堂全站字形圖片以 CC0 1.0通用 方式授權。製作離線版不可能一個字一個字下載,可以直接使用透過 小學堂聯絡信箱 看是否提供打包下載。

字音部分比較簡單,直接從下載頁面取得
https://xiaoxue.iis.sinica.edu.tw/ccrdata/
14個zip檔總共60MB,如果連不上,我可以再轉傳一份上來

1 个赞

台湾的网站还是不稳定,能够制作离线版就好了

2 个赞

这弄下来了也没法检索吧?

其实索引已经有了,不过是字,韵母等,不过如何跟其他挂钩对应,就难弄了

小學堂是將索引跟資料庫分開
舉例來說 查找漢字 “虎” 得到文字索引號後
利用索引號各別對應 9個字形資料庫

小學堂 異體字表 資料庫,"虎"共搜尋到10字
xiao異體字字表

小學堂 字形演變 資料庫,"虎"共搜尋到20字

小學堂 隸書 資料庫,"虎"共搜尋到21字

小學堂 小篆 資料庫,"虎"共搜尋到3字
xiao小篆

小學堂 金文 資料庫,"虎"共搜尋到41字

小學堂 甲骨文 資料庫,"虎"共搜尋到34字

小學堂 楚系簡帛文字 資料庫,"虎"共搜尋到40字

小學堂 秦系簡牘文字 資料庫,"虎"共搜尋到2字
xiao秦系簡牘文字

小學堂 傳抄古文字 資料庫,"虎"共搜尋到22字

小學堂字音資料庫也是把14個字音資料庫分開對應,跟字形資料對應方式相同,不再重述

2 个赞

小学堂现在不给抓了,去年年底我想抓一下,结果把我宿舍的IP封了。
我学校还是他们合作方诶……

發現隔壁群已經有人做了 mdx,總共有3個資料庫

PDAWIKI 小學堂/小学堂系列:漢字古今字資料庫
PDAWIKI 小學堂/小学堂系列:漢字古今音資料庫
PDAWIKI 小學堂/小学堂系列:小學堂聲韻資料

等待好心人轉來這邊…

03/31更新:自己推一下,隔壁群改版前最後一天,希望好心人趕快出現

3 个赞