⿰𤔔辛⿰氵原

说明

  • 感謝 amob、bud 分享辭典,青蘋凨 分享 pua
  • 官網 https://ciyuan.cp.com.cn/ 體例說明、反饋錯誤。
  • 成熟可靠請選用 Mastameta 版。
  • 繁簡通搜:整理古漢語詞典、現漢7繁簡轉化數據後可能加上。建議用rime、形碼準確輸入繁體或使用簡體辭典。
  • 辭典錯誤:請提供修改前後數據,如詞條 id 義項 所有 A 應替換爲B 。

已知問題

  • pua:完。puas2unicodes.json.txt (16.7 KB)
  • 區分連續的書名號標記:完。通過彎曲border區分。
  • 書證含子釋義時排版亂:幾十條,縮進亂,數量少,保持原樣不改。
  • 釋義前缺序號:幾十條,保持原樣不改。
  • 書證和釋義標籤亂用:未檢測,結構複雜,保持原樣不改。
  • 部分鏈接無跳轉:沒空修,請複製搜索。
err linkId <a class="cy240719_lianjie">嘲<sub class="cy240719_sub">2</sub>𠹗</a>”。
err linkId <a class="cy240719_lianjie">莐藩</a>”。
err linkId <a class="cy240719_lianjie">飅</a>”、“

下載

  • mdx版本20240804_xml版本20240719: FreeMdict Cloud
  • 最新製作批次請檢查下方帖子是否有更新。

預覽

14 个赞

要是有新版辞海就好了,不知道能否抓取

上辭不如商務大氣 數據免費測試。 :rofl:

看了二十几字,情况如下,可能这本书必须要用一些PUA字了。
“”: “.”
“”: “-”,
“”: “ˋ”,
“”: “ˇ”,
“”: “㊀”,
“”: “㊁”,
“”: “㊂”,
“”: “ŋ”,
“”: “ˊ”,
“”: 带圈汉字序号“十一”,
“”: 带圈汉字序号“十二”,
“”: 带圈汉字序号“十三”,
“”: 带圈汉字序号“十四”,
“”: 带圈汉字序号“十五”,
“”: 带圈汉字序号“十六”,
“”: 带圈汉字序号“十七”,
“”: 带圈汉字序号“十八”,
“”: 带圈汉字序号“十九”,
“”: 带圈汉字序号“二五”,
“”: “𬞱”,
“”: 带圈汉字序号“二十”,
“”: 带圈汉字序号“二一”,
“”: 带圈汉字序号“二二”,
“”: 带圈汉字序号“二三”,
“”: 带圈汉字序号“二四”,
“”: “ㄙ”,
“”: 四条平行竖线组成的一个字符,最左和最右的竖线稍长,
“”: “[⿲氵玄玄]”,

我有一計: :rofl:

丨	iaaa	45	ia
㇚	iaaa	40
𘠁	iaaa	35
𘮔	iaaa	30
㇑	iaaa	25
亅	iaaa	20	ia
⼁	iaaa	15
⼅	iaaa	10
  • ⿰⿰丨𘮔⿰𘮔丨

这几个之前我用了带圈数字替换试了下,语义变化不大,中文数字跟阿拉伯数字一定程度上可以互义。但是到了另外几个数字发现跨度很大,没继续替换完。

"": "⑪",
"": "⑫",
"": "⑬",
"": "⑭",
"": "⑮",
"": "⑯",
"": "⑰",
"": "⑱",
"": "⑲",

有的释义左侧直接没有【带圈数字】,比如十一、十二数据直接没了。

且后面的数字并没有顺延,从19跳到23好像,我拿不准,所以替换工作停止了下来。

这个序号显示,可以参考论坛之前的辞源文字版。

缺少的11是凹下,12是迷信者……

1 个赞

我沒下載這個版本,這是用兩個數字漢字縱向排版,然後加圈、縮小處理嗎?

從這張圖看,中文數字好像不如阿拉伯數字好辨認啊

①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㉑ ㉒ ㉓ ㉔ ㉕ ㉖ ㉗ ㉘ ㉙ ㉚ ㉛ ㉜ ㉝ ㉞ ㉟
㊱ ㊲ ㊳ ㊴ ㊵ ㊶ ㊷ ㊸ ㊹ ㊺ ㊻ ㊼ ㊽ ㊾ ㊿

所以很奇怪,這兩條數據有什麼特殊的,竟然不帶序號。

我對義項帶圈數字的看法是:前10個說明重要,用原文帶圈漢字數字。

後面的數字,爲了能去掉 PUA,用統一的帶圈阿拉伯數字替換。重點是替換後有了統一的碼,想要變回去的可以用css變成漢字、或者用私有字體重新定義字形。反正這詞典也有現代標點符號,也不是古代繁體原汁原味有的,用阿拉伯數字也不會破壞整體美感。

看纸质书这里也没什么特殊的,也许是我眼拙。

更新了一版,頂樓下載。現在能搜詞了,基本能用了。


義項的檢測邏輯有點多,好在這種情況不到二十個,可以篩一篩加上數字。

這個數據有點複雜,我看不懂這個【國語】是誰的。

按 HTML 標籤 算,這裏【齊】應該單獨算一個釋義。

按釋文算,這個【齊】是國語的,不應該有義項標籤。

這官方數據不行啊 :rofl:

只能打繁体搜索吗

puas_o2n (copy).json整理:white_flower:.txt|attachment (4.2 KB)
“”: “滋”,
“”: “𭳬”,
“”: “𬺾”,
“”: “𱰭”,
“”: “𧮬”,按:纸质版作"⿰谷凡",误。
……
“”: “𮮝”,
“”: “𪰋”,
“”: “𪼐”,
“”: “𬋖”,
“”: “⚊”,
“”: “⚋”,
“”: “☰”,
“”: “☷”,
“”: “☳”,
“”: “☴”,
“”: “☵”,
“”: “☲”,
“”: “☶”,
“”: “☱”,
“”: “𬰩”,
“”: “椔”,
“”: “滋”,
“”: “災”,
“”: “𮉎”,
“”: “”,
“”: “ˇ”,
“”: “”,
“”: “卍”,
“”: “龺”,
“”: “𤣥”,
“”: “”
有几个没有找到

1 个赞

理論上,字目可以根據現代漢語補一部分跳轉。

詞目就沒辦法了,除非犧牲準確性用程序自動轉換出更多可能形式,用來方便搜索(即加入錯誤詞目來保證能搜到)

後面有功夫的話可以添加繁簡通搜的鏈接,不過這數據我草草看了幾個詞就有一堆問題,雖然不是錯誤,但是排版亂糟糟的好難受,不知道官網 ciyuan.cp.com.cn 的數據會不會更好。

FZCiYuanSong.ttf (17.6 MB)
提供一份字体供参考

對的,這詞典我就是看着有數據做一份。論準確、功能,還是 Mastameta 的很多辭典可靠。

此版本的目標,大家想做成什麼樣看大家的意見,我的個人願望是去掉 PUA(或者不去也行),當一本普通古漢語釋義辭典(古音部分我都隱藏了沒染色因爲用不到,所以 pua 涉及的部分其實也很幾乎用不到)。

數據有問題,錯誤的地方,大家有反饋的,我會跟進改。上面隨手翻到的排版問題、內部標籤問題的,就不改動源數據了,情況比較複雜,一改動會引入更多問題。

這個需要呼籲 ciyuan.cp.com.cp 的付費用戶反饋給官方,趕緊讓官方團隊數據改了,靠個人改問題任務量大、引入問題多。 :rofl:

这可是个大工程。我知道的几处错字:
“南宫括”条释文中:括,一作“適”、“紹”。应改作:括,一作“适”、“縚”。
“死綏”、“樸樕”、“事由”等条,书证中的“黨項”应改作“党項”。

这两处都涉及错误的简繁转换问题。“南宫适”这个人名的简繁转换问题,在《图书编校质量差错认定细则(修订版)》(中国出版工作者协会,2005)中被特别举例指出(见该《细则》第九条)。

1 个赞