说明
- 感謝 amob、bud 分享辭典,青蘋凨 分享 pua
- 官網 https://ciyuan.cp.com.cn/ 體例說明、反饋錯誤。
- 成熟可靠請選用 Mastameta 版。
- 繁簡通搜:整理古漢語詞典、現漢7繁簡轉化數據後可能加上。建議用rime、形碼準確輸入繁體或使用簡體辭典。
- 辭典錯誤:請提供修改前後數據,如詞條 id 義項 所有 A 應替換爲B 。
已知問題
- pua:完。puas2unicodes.json.txt (16.7 KB)
- 區分連續的書名號標記:完。通過彎曲border區分。
- 書證含子釋義時排版亂:幾十條,縮進亂,數量少,保持原樣不改。
- 釋義前缺序號:幾十條,保持原樣不改。
- 書證和釋義標籤亂用:未檢測,結構複雜,保持原樣不改。
- 部分鏈接無跳轉:沒空修,請複製搜索。
err linkId <a class="cy240719_lianjie">嘲<sub class="cy240719_sub">2</sub>𠹗</a>”。
err linkId <a class="cy240719_lianjie">莐藩</a>”。
err linkId <a class="cy240719_lianjie">飅</a>”、“
下載
預覽
14 个赞
看了二十几字,情况如下,可能这本书必须要用一些PUA字了。
“”: “.”
“”: “-”,
“”: “ˋ”,
“”: “ˇ”,
“”: “㊀”,
“”: “㊁”,
“”: “㊂”,
“”: “ŋ”,
“”: “ˊ”,
“”: 带圈汉字序号“十一”,
“”: 带圈汉字序号“十二”,
“”: 带圈汉字序号“十三”,
“”: 带圈汉字序号“十四”,
“”: 带圈汉字序号“十五”,
“”: 带圈汉字序号“十六”,
“”: 带圈汉字序号“十七”,
“”: 带圈汉字序号“十八”,
“”: 带圈汉字序号“十九”,
“”: 带圈汉字序号“二五”,
“”: “𬞱”,
“”: 带圈汉字序号“二十”,
“”: 带圈汉字序号“二一”,
“”: 带圈汉字序号“二二”,
“”: 带圈汉字序号“二三”,
“”: 带圈汉字序号“二四”,
“”: “ㄙ”,
“”: 四条平行竖线组成的一个字符,最左和最右的竖线稍长,
“”: “[⿲氵玄玄]”,
我有一計:
丨 iaaa 45 ia
㇚ iaaa 40
𘠁 iaaa 35
𘮔 iaaa 30
㇑ iaaa 25
亅 iaaa 20 ia
⼁ iaaa 15
⼅ iaaa 10
这几个之前我用了带圈数字替换试了下,语义变化不大,中文数字跟阿拉伯数字一定程度上可以互义。但是到了另外几个数字发现跨度很大,没继续替换完。
"": "⑪",
"": "⑫",
"": "⑬",
"": "⑭",
"": "⑮",
"": "⑯",
"": "⑰",
"": "⑱",
"": "⑲",
有的释义左侧直接没有【带圈数字】,比如十一、十二数据直接没了。
且后面的数字并没有顺延,从19跳到23好像,我拿不准,所以替换工作停止了下来。
匿名1719
10
我沒下載這個版本,這是用兩個數字漢字縱向排版,然後加圈、縮小處理嗎?
從這張圖看,中文數字好像不如阿拉伯數字好辨認啊
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㉑ ㉒ ㉓ ㉔ ㉕ ㉖ ㉗ ㉘ ㉙ ㉚ ㉛ ㉜ ㉝ ㉞ ㉟
㊱ ㊲ ㊳ ㊴ ㊵ ㊶ ㊷ ㊸ ㊹ ㊺ ㊻ ㊼ ㊽ ㊾ ㊿
所以很奇怪,這兩條數據有什麼特殊的,竟然不帶序號。
匿名1719
11
我對義項帶圈數字的看法是:前10個說明重要,用原文帶圈漢字數字。
後面的數字,爲了能去掉 PUA,用統一的帶圈阿拉伯數字替換。重點是替換後有了統一的碼,想要變回去的可以用css變成漢字、或者用私有字體重新定義字形。反正這詞典也有現代標點符號,也不是古代繁體原汁原味有的,用阿拉伯數字也不會破壞整體美感。
匿名1719
13
更新了一版,頂樓下載。現在能搜詞了,基本能用了。
義項的檢測邏輯有點多,好在這種情況不到二十個,可以篩一篩加上數字。
匿名1719
14
這個數據有點複雜,我看不懂這個【國語】是誰的。
按 HTML 標籤 算,這裏【齊】應該單獨算一個釋義。
按釋文算,這個【齊】是國語的,不應該有義項標籤。
這官方數據不行啊
青蘋凨
16
puas_o2n (copy).json整理.txt|attachment (4.2 KB)
“”: “滋”,
“”: “𭳬”,
“”: “𬺾”,
“”: “𱰭”,
“”: “𧮬”,按:纸质版作"⿰谷凡",误。
……
“”: “𮮝”,
“”: “𪰋”,
“”: “𪼐”,
“”: “𬋖”,
“”: “⚊”,
“”: “⚋”,
“”: “☰”,
“”: “☷”,
“”: “☳”,
“”: “☴”,
“”: “☵”,
“”: “☲”,
“”: “☶”,
“”: “☱”,
“”: “𬰩”,
“”: “椔”,
“”: “滋”,
“”: “災”,
“”: “𮉎”,
“”: “”,
“”: “ˇ”,
“”: “”,
“”: “卍”,
“”: “龺”,
“”: “𤣥”,
“”: “”
有几个没有找到
1 个赞
匿名1719
17
理論上,字目可以根據現代漢語補一部分跳轉。
詞目就沒辦法了,除非犧牲準確性用程序自動轉換出更多可能形式,用來方便搜索(即加入錯誤詞目來保證能搜到)
後面有功夫的話可以添加繁簡通搜的鏈接,不過這數據我草草看了幾個詞就有一堆問題,雖然不是錯誤,但是排版亂糟糟的好難受,不知道官網 ciyuan.cp.com.cn 的數據會不會更好。
青蘋凨
18
FZCiYuanSong.ttf (17.6 MB)
提供一份字体供参考
匿名1719
20
對的,這詞典我就是看着有數據做一份。論準確、功能,還是 Mastameta 的很多辭典可靠。
此版本的目標,大家想做成什麼樣看大家的意見,我的個人願望是去掉 PUA(或者不去也行),當一本普通古漢語釋義辭典(古音部分我都隱藏了沒染色因爲用不到,所以 pua 涉及的部分其實也很幾乎用不到)。
數據有問題,錯誤的地方,大家有反饋的,我會跟進改。上面隨手翻到的排版問題、內部標籤問題的,就不改動源數據了,情況比較複雜,一改動會引入更多問題。
匿名1719
21
這個需要呼籲 ciyuan.cp.com.cp 的付費用戶反饋給官方,趕緊讓官方團隊數據改了,靠個人改問題任務量大、引入問題多。
匿名1684
23
这可是个大工程。我知道的几处错字:
“南宫括”条释文中:括,一作“適”、“紹”。应改作:括,一作“适”、“縚”。
“死綏”、“樸樕”、“事由”等条,书证中的“黨項”应改作“党項”。
这两处都涉及错误的简繁转换问题。“南宫适”这个人名的简繁转换问题,在《图书编校质量差错认定细则(修订版)》(中国出版工作者协会,2005)中被特别举例指出(见该《细则》第九条)。
1 个赞