《Unicode汉字字典》完整收录并显示Unicode16中98682个汉字,17预览版102998个汉字

如果Unicode打过来了,我第一个跑 :rofl:

2025.06.30更新:
更新css,mdd,
Unicode17预览版,102998个字头,102998个字的图片,来自pdf,
Unicode16,补全98682个字的图片,来自pdf,


已知不足:部首,序号有撇号的,没有修改完善,多个部首的,也没完善, 有87个带两撇,6个带三撇,
6个带三撇

U+31DE5,𱷥
U+31E22,𱸢
U+3267E,𲙾
U+32A83,𲪃
U+32C47,𲱇
U+33479,𳑹

87个带两撇

U+4E80,亀
U+5264,剤
U+6589,斉
U+6B6F,歯
U+7ADC,竜
U+9F21,鼡
U+9F62,齢
U+21676,𡙶
U+232F0,𣋰
U+23BE1,𣯡
U+2412F,𤄯
U+25269,𥉩
U+25A9D,𥪝
U+25A9E,𥪞
U+29091,𩂑
U+2964C,𩙌
U+2A5F1,𪗱
U+2A602,𪘂
U+2A61A,𪘚
U+2A6B2,𪚲
U+2A95B,𪥛
U+2AC6F,𪱯
U+2ADF9,𪷹
U+2AF5E,𪽞
U+2AFC1,𪿁
U+2B3FD,𫏽
U+2B5BC,𫖼
U+2B5BD,𫖽
U+2B5BE,𫖾
U+2B5BF,𫖿
U+2B5C0,𫗀
U+2B5C1,𫗁
U+2B5C2,𫗂
U+2B5C3,𫗃
U+2B5C4,𫗄
U+2B818,𫠘
U+2B81A,𫠚
U+2B81D,𫠝
U+2B840,𫡀
U+2BDD9,𫷙
U+2C099,𬂙
U+2C514,𬔔
U+2CC76,𬱶
U+2CC79,𬱹
U+2CC7B,𬱻
U+2CC81,𬲁
U+2CC82,𬲂
U+2CC83,𬲃
U+2CC84,𬲄
U+2CC87,𬲇
U+2CC88,𬲈
U+2CE74,𬹴
U+2CE97,𬺗
U+2CE98,𬺘
U+2CE99,𬺙
U+2CE9A,𬺚
U+2E13F,𮄿
U+2EBBE,𮮾
U+2EBC3,𮯃
U+2EBC5,𮯅
U+2EBC7,𮯇
U+2EBC8,𮯈
U+2EBCB,𮯋
U+2EBCC,𮯌
U+2EBCE,𮯎
U+313A4,𱎤
U+318C3,𱣃
U+318E8,𱣨
U+31DE5,𱷥
U+31E22,𱸢
U+31EE2,𱻢
U+31F50,𱽐
U+322C4,𲋄
U+322C7,𲋇
U+322C8,𲋈
U+322CB,𲋋
U+323AC,𲎬
U+323AD,𲎭
U+3267E,𲙾
U+32A83,𲪃
U+32C47,𲱇
U+332CF,𳋏
U+332D0,𳋐
U+33472,𳑲
U+33477,𳑷
U+33478,𳑸
U+33479,𳑹

繁简部首

乛/乙(亅) 艹/艸 丬/爿 门/門 辶/辵 飞/飛 马/馬
王/玉 韦/韋 车/車 贝/貝 见/見 长/長 风/風 户/戶
龙/龍 鸟/鳥 覀/襾 页/頁 齐/齊 麦/麥 卤/鹵 龟/龜
青/靑 齿/齒 黾/黽 鱼/魚 黄/黃

2025.06.29更新:
更新css和mdd,
使得电脑dictango(一样的css和mdd,pc端的欧陆无法显示字体,dictango无法显示正确的排版)
手机安卓欧陆,dictango,MDict,能够显示全部的Unicode16汉字,
使用字体:

image
网页显示四个方框,
电脑dictango完美显示,图片未加载是因为,5位数字.png已在mdx中预留好了位置,但是png还没有提取,约有空缺98682-93981=4701


![D80@7X1$GO6W141EWKKGXG|690x388]

手机端:






数据来自Unicode官网,
完整收录目前最新Unicode16中的98682个汉字,

三种查询方式,字头,Unicode数字代码(不满5位的首位补0),Unicode代码

㐀,03400,U+3400

部首笔画按照官网214个部首已整理

214个部首
"1": "一",

“2”: “丨”,
“3”: “丶”,
“4”: “丿”,
“5”: “乙”,
“6”: “亅”,
“7”: “二”,
“8”: “亠”,
“9”: “人”,
“10”: “儿”,
“11”: “入”,
“12”: “八”,
“13”: “冂”,
“14”: “冖”,
“15”: “冫”,
“16”: “几”,
“17”: “凵”,
“18”: “刀”,
“19”: “力”,
“20”: “勹”,
“21”: “匕”,
“22”: “匚”,
“23”: “匸”,
“24”: “十”,
“25”: “卜”,
“26”: “卩”,
“27”: “厂”,
“28”: “厶”,
“29”: “又”,
“30”: “口”,
“31”: “囗”,
“32”: “土”,
“33”: “士”,
“34”: “夂”,
“35”: “夊”,
“36”: “夕”,
“37”: “大”,
“38”: “女”,
“39”: “子”,
“40”: “宀”,
“41”: “寸”,
“42”: “小”,
“43”: “尢”,
“44”: “尸”,
“45”: “屮”,
“46”: “山”,
“47”: “巛”,
“48”: “工”,
“49”: “己”,
“50”: “巾”,
“51”: “干”,
“52”: “幺”,
“53”: “广”,
“54”: “廴”,
“55”: “廾”,
“56”: “弋”,
“57”: “弓”,
“58”: “彐”,
“59”: “彡”,
“60”: “彳”,
“61”: “心”,
“62”: “戈”,
“63”: “戶”,
“64”: “手”,
“65”: “支”,
“66”: “攴”,
“67”: “文”,
“68”: “斗”,
“69”: “斤”,
“70”: “方”,
“71”: “无”,
“72”: “日”,
“73”: “曰”,
“74”: “月”,
“75”: “木”,
“76”: “欠”,
“77”: “止”,
“78”: “歹”,
“79”: “殳”,
“80”: “毋”,
“81”: “比”,
“82”: “毛”,
“83”: “氏”,
“84”: “气”,
“85”: “水”,
“86”: “火”,
“87”: “爪”,
“88”: “父”,
“89”: “爻”,
“90”: “爿”,
“91”: “片”,
“92”: “牙”,
“93”: “牛”,
“94”: “犬”,
“95”: “玄”,
“96”: “玉”,
“97”: “瓜”,
“98”: “瓦”,
“99”: “甘”,
“100”: “生”,
“101”: “用”,
“102”: “田”,
“103”: “疋”,
“104”: “疒”,
“105”: “癶”,
“106”: “白”,
“107”: “皮”,
“108”: “皿”,
“109”: “目”,
“110”: “矛”,
“111”: “矢”,
“112”: “石”,
“113”: “示”,
“114”: “禸”,
“115”: “禾”,
“116”: “穴”,
“117”: “立”,
“118”: “竹”,
“119”: “米”,
“120”: “糸”,
“121”: “缶”,
“122”: “网”,
“123”: “羊”,
“124”: “羽”,
“125”: “老”,
“126”: “而”,
“127”: “耒”,
“128”: “耳”,
“129”: “聿”,
“130”: “肉”,
“131”: “臣”,
“132”: “自”,
“133”: “至”,
“134”: “臼”,
“135”: “舌”,
“136”: “舛”,
“137”: “舟”,
“138”: “艮”,
“139”: “色”,
“140”: “艸”,
“141”: “虍”,
“142”: “虫”,
“143”: “血”,
“144”: “行”,
“145”: “衣”,
“146”: “襾”,
“147”: “見”,
“148”: “角”,
“149”: “言”,
“150”: “谷”,
“151”: “豆”,
“152”: “豕”,
“153”: “豸”,
“154”: “貝”,
“155”: “赤”,
“156”: “走”,
“157”: “足”,
“158”: “身”,
“159”: “車”,
“160”: “辛”,
“161”: “辰”,
“162”: “辵”,
“163”: “邑”,
“164”: “酉”,
“165”: “采”,
“166”: “里”,
“167”: “金”,
“168”: “長”,
“169”: “門”,
“170”: “阜”,
“171”: “隶”,
“172”: “隹”,
“173”: “雨”,
“174”: “青”,
“175”: “非”,
“176”: “面”,
“177”: “革”,
“178”: “韋”,
“179”: “韭”,
“180”: “音”,
“181”: “頁”,
“182”: “風”,
“183”: “飛”,
“184”: “食”,
“185”: “首”,
“186”: “香”,
“187”: “馬”,
“188”: “骨”,
“189”: “髙”,
“190”: “髟”,
“191”: “鬥”,
“192”: “鬯”,
“193”: “鬲”,
“194”: “鬼”,
“195”: “魚”,
“196”: “鳥”,
“197”: “鹵”,
“198”: “鹿”,
“199”: “麥”,
“200”: “麻”,
“201”: “黃”,
“202”: “黍”,
“203”: “黑”,
“204”: “黹”,
“205”: “黽”,
“206”: “鼎”,
“207”: “鼓”,
“208”: “鼠”,
“209”: “鼻”,
“210”: “齊”,
“211”: “齒”,
“212”: “龍”,
“213”: “龜”,
“214”: “龠”,

官网8个txt的内容

8个txt及其具体内容

1. Unihan_IRGSources.txt

文件描述:包含汉字在各国或地区编码标准中的映射关系,以及部首笔画等信息。
关键字段

  • kCompatibilityVariant:兼容变体(通常指在Unicode中为兼容其他标准而编码的字符)
  • kIICore:IICore(一个紧凑的汉字子集,用于国际交换)
  • kIRG_GSource:中国大陆的源映射(如GB系列的编码)
  • kIRG_HSource:中国香港的源映射
  • kIRG_JSource:日本的源映射(如JIS编码)
  • kIRG_KPSource:朝鲜的源映射(KPS标准)
  • kIRG_KSource:韩国的源映射(KS标准)
  • kIRG_MSource:蒙古的源映射
  • kIRG_SSource:新加坡的源映射
  • kIRG_TSource:中国台湾的源映射(如Big5)
  • kIRG_UKSource:英国的源映射(很少使用)
  • kIRG_USource:美国的源映射(如Hanyu-Da Zidian)
  • kIRG_VSource:越南的源映射
  • kRSUnicode:Unicode部首笔画(部首和剩余笔画数,格式如“149.4”表示部首149,剩余4画)
  • kTotalStrokes:总笔画数

2. Unihan_DictionaryIndices.txt

文件描述:包含各种字典索引信息,这些索引指向不同字典中的位置。
关键字段

  • kCheungBauerIndex:张群显-白瑞德(Cheung-Bauer)索引(《漢語多功能字庫》)
  • kCihaiT:《辞海》的页码(传统版)
  • kCowles:Cowles索引(《A Chinese and English Dictionary》)
  • kDaeJaweon:大字典(Dae Jaweon)的页码(韩国的一部字典)
  • kFennIndex:Fenn索引(《Fenn’s Chinese-English Pocket Dictionary》)
  • kGSR:Karlgren’s Grammata Serica Recensa(高本汉的《汉文典》修订本)的编号
  • kHanYu:《汉语大字典》的页码和位置(格式为“卷号.页码.位置”)
  • kIRGDaeJaweon:IRG(表意文字小组)统一的大字典页码
  • kIRGHanyuDaZidian:IRG统一的《汉语大字典》位置
  • kIRGKangXi:IRG统一的《康熙字典》页码
  • kKangXi:《康熙字典》的页码和位置(格式为“页码.位置”)
  • kKarlgren:高本汉(Bernhard Karlgren)的索引(《Analytic Dictionary of Chinese and Sino-Japanese》)
  • kLau:Lau索引(《A Practical Chinese-English Dictionary》)
  • kMatthews:Matthews索引(《Mathews’ Chinese-English Dictionary》)
  • kMeyerWempe:Meyer-Wempe索引(《The Student’s Chinese-English Dictionary》)
  • kMorohashi:《大汉和辞典》的索引(Morohashi)
  • kNelson:《Nelson’s Japanese-English Character Dictionary》的索引
  • kSBGY:《宋本广韵》(Song Ben Guang Yun)的页码和位置
  • kSMSZD2003Index:《现代汉语规范词典》(2003)的索引

3. Unihan_Readings.txt

文件描述:包含汉字的读音(拼音、注音、粤语、日语、韩语、越南语等)和定义。
关键字段

  • kCantonese:粤语拼音(常用罗马化表示)
  • kDefinition:英文定义
  • kFanqie:反切(古代注音方法)
  • kHangul:韩语发音(韩文)
  • kHanyuPinlu:汉语拼音频率(来自《现代汉语频率词典》)
  • kHanyuPinyin:《汉语大字典》中的拼音(多音字会有多个拼音)
  • kJapanese:日语发音(罗马字,包括音读和训读的混合)
  • kJapaneseKun:日语训读
  • kJapaneseOn:日语音读
  • kKorean:韩语罗马字发音
  • kMandarin:普通话拼音(最常用的拼音)
  • kSMSZD2003Readings:《现代汉语规范词典》(2003)的拼音
  • kTang:中古汉语发音(唐朝发音,重构)
  • kTGHZ2013:《通用规范汉字表》(2013)的拼音
  • kVietnamese:越南语发音(汉越音)
  • kXHC1983:《现代汉语词典》(1983)的拼音
  • kZhuang:壮语发音(用拉丁字母表示)

4. Unihan_DictionaryLikeData.txt

文件描述:包含字典类型的数据,如字形结构、四角号码、仓颉码等。
关键字段

  • kAlternateTotalStrokes:替代总笔画数(当存在多个写法时)
  • kCangjie:仓颉输入法编码
  • kCheungBauer:张群显-白瑞德(Cheung-Bauer)的编码和位置
  • kFenn:Fenn编码(Fenn’s Chinese-English Pocket Dictionary)
  • kFourCornerCode:四角号码
  • kGradeLevel:汉字的学习等级(常用于教育,如日本的小学汉字等级)
  • kHDZRadBreak:《汉语大字典》的部首和拆分
  • kHKGlyph:香港字形(香港增补字符集的字形描述)
  • kMojiJoho:文字情报(Moji Joho)的编码(日本)
  • kPhonetic:音标(通常为其他注音系统)
  • kStrange:特殊标记(用于标记特殊字形)
  • kUnihanCore2020:Unihan核心2020(一个汉字子集)

5. Unihan_OtherMappings.txt

文件描述:包含其他编码标准的映射,如Big5、GB、CNS、电报码等。
关键字段

  • kBigFive:Big5编码(台湾繁体字编码)
  • kCCCII:CCCII编码(中文资讯交换码)
  • kCNS1986:CNS 11643-1986(台湾标准交换码)
  • kCNS1992:CNS 11643-1992(台湾标准交换码)
  • kEACC:EACC(东亚字符编码,ANSI Z39.64)
  • kGB0:GB2312-80编码(区位码)
  • kGB1:GB/T 12345-90(繁体字集)
  • kGB3:GB7589-87(简体字集)
  • kGB5:GB7590-87(简体字集)
  • kGB7:GB/T 8565.2-1988(用于信息处理)
  • kGB8:GB/T 8565.3-1988(用于信息处理)
  • kIBMJapan:IBM日本使用的编码
  • kJa:日本工业标准(JIS)编码(旧版本)
  • kJinmeiyoKanji:日本人名用汉字(JIS X 0213)
  • kJis0:JIS X 0208-1983
  • kJis1:JIS X 0212-1990
  • kJIS0213:JIS X 0213:2000
  • kJoyoKanji:日本常用汉字(教育用)
  • kKoreanEducationHanja:韩国教育用汉字
  • kKoreanName:韩国人名用汉字
  • kMainlandTelegraph:中国大陆电报码
  • kPseudoGB1:伪GB1(非标准映射)
  • kTaiwanTelegraph:台湾电报码
  • kTGH:《通用规范汉字表》的编号
  • kXerox:施乐公司使用的编码

6. Unihan_Variants.txt

文件描述:包含汉字的变体关系(如简体、繁体、异体等)。
关键字段

  • kSemanticVariant:语义变体(意义相同但写法不同的字)
  • kSimplifiedVariant:简体变体(对应的简体字)
  • kSpecializedSemanticVariant:专业语义变体(在特定领域意义相同)
  • kSpoofingVariant:欺骗性变体(易混淆的字)
  • kTraditionalVariant:繁体变体(对应的繁体字)
  • kZVariant:字形变体(字形不同但可视为相同)

7. Unihan_RadicalStrokeCounts.txt

文件描述:包含部首和笔画数信息(主要针对Adobe-Japan1-6标准)。
关键字段

  • kRSAdobe_Japan1_6:Adobe-Japan1-6标准中的部首笔画(格式:部首+剩余笔画,可能包含多个,用空格分隔)

8. Unihan_NumericValues.txt

文件描述:包含汉字的数字含义(用于表示数字的汉字)。
关键字段

  • kAccountingNumeric:会计数字(大写数字,如壹、贰)
  • kOtherNumeric:其他数字(如干支、特殊计数)
  • kPrimaryNumeric:基本数字(一、二、三……)
  • kVietnameseNumeric:越南语中的数字
  • kZhuangNumeric:壮语中的数字

词典界面翻译,

100种属性
"字符": "字符",
"兼容变体": "兼容变体",
"国际表意文字核心子集(IICore)": "IICore",
"中国大陆源": "中国大陆源",
"中国香港源": "中国香港源",
"日本源": "日本源",
"朝鲜源": "朝鲜源",
"韩国源": "韩国源",
"蒙古源": "蒙古源",
"新加坡源": "新加坡源",
"中国台湾源": "中国台湾源",
"英国源": "英国源",
"美国源": "美国源",
"越南源": "越南源",
"Unicode部首笔画": "部首笔画",
"总笔画数": "总笔画数",
"张群显-白瑞德索引(香港中文大学汉字数据库索引)": "张群显-白瑞德索引",
"辞海(繁体版)": "辞海",
"Cowles索引": "Cowles索引",
"韩语大字典(Dae Jaweon)页码": "韩语大字典",
"Fenn索引": "Fenn索引",
"高本汉《汉文典》(Grammata Serica Recensa)": "高本汉《汉文典》",
"汉语大字典": "汉语大字典",
"IRG韩语大字典": "IRG韩语大字典",
"IRG汉语大字典": "IRG汉语大字典",
"IRG康熙字典": "IRG康熙字典",
"康熙字典": "康熙字典",
"高本汉索引": "高本汉索引",
"Lau索引": "Lau索引",
"Matthews索引": "Matthews索引",
"Meyer-Wempe索引": "Meyer-Wempe索引",
"日本《大汉和辞典》(Morohashi)": "大汉和辞典",
"Nelson索引": "Nelson索引",
"《宋本广韵》(韵书)": "宋本广韵",
"《现代汉语规范字典》(2003年版)": "现代汉语规范字典",
"粤语拼音": "粤语拼音",
"英文定义": "英文定义",
"反切": "反切",
"韩语发音": "韩语发音",
"拼音频率": "拼音频率",
"汉语拼音": "汉语拼音",
"日语发音": "日语发音",
"日语训读": "日语训读",
"日语音读": "日语音读",
"韩语罗马字": "韩语罗马字",
"普通话拼音": "普通话拼音",
"《现代汉语规范字典》(2003年版)拼音": "现代汉语规范字典拼音",
"中古汉语": "中古汉语",
"《通用规范汉字表》(2013年版)": "通用规范汉字表",
"越南语发音": "越南语发音",
"《现代汉语词典》(1983年版)": "现代汉语词典",
"壮语发音": "壮语发音",
"替代笔画数": "替代笔画数",
"仓颉编码": "仓颉编码",
"张群显-白瑞德的研究数据": "张群显-白瑞德数据",
"Fenn编码": "Fenn编码",
"四角号码": "四角号码",
"学习等级": "学习等级",
"《汉语大字典》部首拆分": "汉语大字典部首拆分",
"香港字形": "香港字形",
"日本文字情报数据库(Moji Joho Kiban)": "日本文字情报数据库",
"音标": "音标",
"特殊标记": "特殊标记",
"2020年版的Unihan核心字符集": "Unihan核心2020",
"Big5编码": "Big5编码",
"CCCII编码": "CCCII编码",
"CNS1986": "CNS1986",
"CNS1992": "CNS1992",
"EACC编码": "EACC编码",
"GB2312-80": "GB2312",
"GB/T12345-90": "GB12345",
"GB7589-87": "GB7589",
"GB7590-87": "GB7590",
"GB/T8565.2-1988": "GB8565-2",
"GB/T8565.3-1988": "GB8565-3",
"IBM日本": "IBM日本",
"日本工业标准": "日本工业标准",
"日本人名用汉字": "日本人名用汉字",
"JIS X0208-1983": "JIS X0208",
"JIS X0212-1990": "JIS X0212",
"JIS X0213:2000": "JIS X0213",
"日本常用汉字": "日本常用汉字",
"韩国教育用汉字": "韩国教育用汉字",
"韩国人名用汉字": "韩国人名用汉字",
"大陆电报码": "大陆电报码",
"伪GB1": "伪GB1",
"台湾电报码": "台湾电报码",
"《通用规范汉字表》编号": "通用规范汉字表编号",
"施乐编码": "施乐编码",
"语义变体": "语义变体",
"简体变体": "简体变体",
"专业语义变体": "专业语义变体",
"欺骗性变体": "欺骗性变体",
"繁体变体": "繁体变体",
"字形变体": "字形变体",
"Adobe Japan1-6字符部首笔画": "Adobe部首笔画",
"会计数字": "会计数字",
"其他数字": "其他数字",
"基本数字": "基本数字",
"越南语数字": "越南语数字",
"壮语数字": "壮语数字"

已经预留好同名css和js的开头,效果如图
支持变体跳转,图片93981张,来自電腦漢字字典
如果能从pdf中补齐图片就更好了,
同样的css在欧陆中和tango中显示不一样,我无能为力,



数据全收录,无修改,未删节,仅供参考,仅供网络带宽下载测试,

98682个字头和对应的码点,也可以后缀改csv打开,
98682.txt (1.3 MB)
Unicode17新增.txt (59.0 KB)

10 个赞

汉字辅助字典
这个词典也包含了之前的unicode,可以相互补充。

1 个赞

再等等吧,17快出来了。目前是草稿

2 个赞

在这个基础上加上非汉字词,是否可行?

加什么?请具体一点,
或者说,你的意思是,加上非汉字的词头?把15w个Unicode字符都做成词头,然后两种跳转,三种查询方式,理论上是可以的,但是,感觉意义不感觉不大啊

Unicode 符号表

版本: 16.0.0发布日期: 2024年9月10日字符总数: 154 998

感觉做个分类emoji还不错,:telescope::drum::watermelon:

想了一下,收集资料txt是一方面,主要的是词头不好处理,除了本体,还有Unicode代码,不可能把剩下的词头都用中文翻译一遍吧
除非能像这个网站一样,猜你喜欢,猜你想要,提供关联性从高到低的Unicode

那除非爬取这个网站,三种查询方式,还要加分类查询,那还不如直接在这个网站查询了, :rofl:

Unicode› 块› 杂项符号和象形文字› 天氣符號› 白日小云

一个方向是制作每个符号的简短的含义进行反查
(在什么位面上,历史,以及不同编码(GBK,GB28030-2022,Shift-JIS),等等技术信息,也可以加加,感觉可以和现在这个已经制作好的mdx区分开来另外做一个)
主要是有些特殊符号真到用的时候不好找在什么地方,
比如说查个云朵的符号 :cloud:
就差不多是你给的这个网站的右上角那个搜索功能的效果。

还有像是这种功能

我找了一圈方法,没想到我有眼不识泰山, :rofl:Unicodecharts.pdf请教如何把单字导出成png呢,

用pdf补丁丁把页面转成图片,dpi600以上。然后就可以用photoshop等工具把单字切下来。

1 个赞

我猜中了开头却没有猜中结尾, :sweat_smile:难道没有Python批处理的方法吗
WFG的 可是 Unicode 有近十萬漢字,如果再加上大陸、香港、台灣、日本、韓國、越南等各分區,光是這些字形圖片就有幾十萬幅,根本不可能用純人工來截圖製作。於是這次我嘗試了一項新的製作技術,把數據、字形從 Unicode 官方發布的 Unicode Character Code Charts PDF 中萃取出來
不会也是这种方法吧

我能力不足,又不懂python,只会笨方法。

呃,你假如会用Chigre3自制的切图软件工具,就可以批量切图。

切图大神Chigre3自制切图软件工具

工具是可以下载的,不过太过复杂,没几个人会用。

切图python也有的。Python不是我喝的茶,所以别问我效果怎样。

python模块切图

1 个赞

WFG肯定不是这样手动,

也不可能,软件太复杂了,

WFG的原话中,有一种,当年费马猜想那种“我确信已发现了一种美妙的证法 ,可惜这里空白的地方太小,写不下。”的精妙感, :rofl:
既然wfg既不是手动处理也不是复杂Python处理,复杂软件处理,
那只有是简单Python处理了,
找到方法了,

总结

虽然这个Unicodechart.pdf是加密的,但是可以搜索汉字,所以不能像处理扫描版的pdf那样去复杂处理,而是要像处理大型txt那样,搜索字头,然后截图
工作量少了100倍,而且有理由相信未来Unicode17出来之后,可以第一时间整理出新字头,以及对应的字形

1 个赞

不管是手动还是自动。数量一多了,处理都是很耗时间的。


cjk J区(草案),pdf转图,切字,做的字体。
CJK-ext-J-Regular(unicode17.0草案).ttf (2.4 MB)
unicode17.0(草案).cjk-ext-j.pdf (7.8 MB)

1 个赞

666,好像又加了13个字

C区7个,E区12


用了你的字体文件,做了一个17的版本,新增字头能在pc欧陆完美显示,甚至搜索栏

1 个赞

真是大海捞针,这个字体应该是陆标字形中比较贴合Unicode的,日标的字云,台标的全字库正宋体(WFG不是免费商用的),算是补了免费商用陆标unicode字体方面的空白了。

这个字体最大的贡献倒不是字形而是那个参考文档,值得使用者一读。

楼主,楼层的链接都失效了, :sweat_smile:你有备份吗,

通过网盘分享的文件:汉字辅助字典
链接: https://pan.baidu.com/s/1hFtFUsmvrqioWHGOth4Xqw?pwd=csmy 提取码: csmy
–来自百度网盘超级会员v9的分享

2 个赞