关于香港《常用字字形表》的疑问

last_idol · 2022 年10 月 3 日 08:19

在维基文库的香港《常用字字形表》里，有收录：

任、仼

这两字里，任为正字，仼为异体字。我的疑问是这里的仼是否为误录？目前只看到《常用字字形表》里有这样映射关系，在《香港小學學習字詞表》里只收录了任字，字形和仼也不一致，但网上不同来源的《常用字字形表》都有仼这个字。

https://zh.m.wikisource.org/zh/常用字字形表

https://www.edbchinese.hk/lexlist_ch/

shaoshi · 2022 年10 月 3 日 08:40

《汉语大字典》说“仼”同“彺”。

但是Unicode资料说“仼”是“U+4EFB 任”的异体字。

这大概是个俗字，就是说有很多人写错了，很多人将错就错，当它是“任”字。

《汉语大字典》第2版
〖仼〗
仼同“彺”。《改併四聲篇海·人部》引《餘文》：“仼，急行也。”按：《玉篇·彳部》：“彺，急行皃。”“仼”与“彺”音义相同，“仼”当即“彺”的异体。

仼 U+4EFC
Data type Value
kSemanticVariant U+4EFB 任
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=4EFC

last_idol · 2022 年10 月 3 日 09:07

Unicode的资料需要配合原始来源才用得放心。比如鹃和鹂，从Unicode13.0开始视作Z变体，到15.0移除，而Z变体要求词源相同，这对映射就很莫名其妙。

U+9E42	kZVariant	U+9E43
U+9E43	kZVariant	U+9E42

shaoshi · 2022 年10 月 3 日 09:12

这两个字没可能是异体字关系。假如这样显示，应该纯粹是资料输入错误。

由一些不是词典学家的人去编这么复杂的一个资料库，搞出一些错误来实在不足为奇。不过错误似乎不多。

endnote · 2022 年10 月 3 日 09:16

汉字编码最开始的时候是两岸三地分头推进，以香港为例，本地一开始有多个商业公司分头自己造字编码。我也是做这本MDX时才知道
Use the Right Word英文字用法指南

后来要规范要统一，但汉字字形过于复杂，最省事保险的方式是简单合并，这也导致Unicode里头同一字有多个编码的情况并不少见。

不过话说回来，汉字字形稍有差异的，谁敢打包票说就是同一个字呢？

last_idol · 2022 年10 月 3 日 09:16

现在就很疑惑任仼的正异体关系，有没有其它的权威字典/词典可以印证。

last_idol · 2022 年10 月 3 日 09:50

香港《常用字字形表》標準字體表里的任字形如下：

再参考《香港小學學習字詞表》，把任视为正字，Unicode的编码相同，只是首笔作横，有没有可能仼字是在后期文本整理时误录的？

《常用字字形表》標準字體表.pdf (3.9 MB)

Mastameta · 2022 年10 月 3 日 11:49

這兩個字形都用 U+4EFB 表現。但任何電腦環境只能顯示其中一個，除非用圖片或私有區補充。（與 U+4EFC 無關。應付簡體字型無法顯示 4EFB 之H、T形，勉強借用4EFC 罷了，但字形、音義都不相同。）

G 形，繼承康熙字典字體。
H、T 形，更接近說文字體。參見篆形。

58EC 有一樣的分歧。

shaoshi · 2022 年10 月 3 日 11:55

香港中文大學 newsletter42

其中对比了香港与大陆的标准字形：

last_idol · 2022 年10 月 3 日 12:14

多个开源字表/汉字数据库都把仼字收录了，个人觉得危害有点大。

Mastameta · 2022 年10 月 3 日 12:16

我同意。那做法誤導人。

endnote · 2022 年10 月 3 日 13:20

如果是常用字字体，同时收录“任、仼”，那确实不应该。

尤其是搜索索引方面，会出现查询错误。

历史遗留问题，只能慢慢规范了。

【Mastameta】王力古漢語字典（綜合版）9.30更新

古籍印刷通用字规范字形表
标准编号：GB/Z 40637-2021
标准状态：即将实施
标准价格：126.0 元
标准简介
本文件规定了古籍印刷通用字收字的原则和计算机宋体字字形规范的原则，并给出了14 250个古籍印刷通用字的字形、字音和在国际编码字符集ISO/IEC 10646中的码位。
本文件适用于1911年以前历代传世古籍的印刷与出版，也适用于现代书刊的繁体版印刷。
英文名称： Standard glyph list of generally used Chinese characters for ancient books publishing
标准状态：即将实施
中标分类：综合>>基础标准>>A22术语、符号
ICS分类：综合、术语学、标准化、文献>>词汇>>01.040.01综合、术语学、标准化、文献 (词汇)
发布部门：国家市场监督管理总局国家标准化管理委员会
发布日期：2021-10-11
实施日期：2022-05-01 即将实施距离实施日期还有164天
提出单位：教育部(语言)
归口单位：教育部(语言)
起草单位：北京师范大学文学院、商务印书馆有限公司、中华书局有限公司
起草人：王宁、**、王晓明、卜师霞、凌丽君、胡佳佳、周洪波、余桂林、孙述学、徐从权、马益新、洪涛、苏瑞欣、朱翠萍、秦淑华、胡珂
页数：236页
出版社：中国标准出版社
出版日期：2021-10-01