关于香港《常用字字形表》的疑问

在维基文库的香港《常用字字形表》里,有收录:

任、仼

这两字里,为正字,为异体字。我的疑问是这里的是否为误录?目前只看到《常用字字形表》里有这样映射关系,在《香港小學學習字詞表》里只收录了字,字形和也不一致,但网上不同来源的《常用字字形表》都有这个字。

https://zh.m.wikisource.org/zh/常用字字形表

https://www.edbchinese.hk/lexlist_ch/

《汉语大字典》说“仼”同“彺”。

但是Unicode资料说“仼”是“U+4EFB 任”的异体字。

这大概是个俗字,就是说有很多人写错了,很多人将错就错,当它是“任”字。

《汉语大字典》第2版
〖仼〗
仼同“彺”。《改併四聲篇海·人部》引《餘文》:“仼,急行也。”按:《玉篇·彳部》:“彺,急行皃。”“仼”与“彺”音义相同,“仼”当即“彺”的异体。

仼 U+4EFC
Data type Value
kSemanticVariant U+4EFB 任
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=4EFC

1 个赞

Unicode的资料需要配合原始来源才用得放心。比如鹃和鹂,从Unicode13.0开始视作Z变体,到15.0移除,而Z变体要求词源相同,这对映射就很莫名其妙。

U+9E42	kZVariant	U+9E43
U+9E43	kZVariant	U+9E42

这两个字没可能是异体字关系。假如这样显示,应该纯粹是资料输入错误。

由一些不是词典学家的人去编这么复杂的一个资料库,搞出一些错误来实在不足为奇。不过错误似乎不多。

1 个赞

汉字编码最开始的时候是两岸三地分头推进,以香港为例,本地一开始有多个商业公司分头自己造字编码。我也是做这本MDX时才知道
Use the Right Word英文字用法指南

后来要规范要统一,但汉字字形过于复杂,最省事保险的方式是简单合并,这也导致Unicode里头同一字有多个编码的情况并不少见。

不过话说回来,汉字字形稍有差异的,谁敢打包票说就是同一个字呢?

1 个赞

现在就很疑惑任仼的正异体关系,有没有其它的权威字典/词典可以印证。

香港《常用字字形表》標準字體表里的字形如下:

任2

再参考《香港小學學習字詞表》,把视为正字,Unicode的编码相同,只是首笔作横,有没有可能字是在后期文本整理时误录的?

《常用字字形表》標準字體表.pdf (3.9 MB)

image

這兩個字形都用 U+4EFB 表現。但任何電腦環境只能顯示其中一個,除非用圖片或私有區補充。(與 U+4EFC 無關。應付簡體字型無法顯示 4EFB 之H、T形,勉強借用4EFC 罷了,但字形、音義都不相同。)

image

G 形,繼承康熙字典字體。
H、T 形,更接近說文字體。參見篆形。

58EC 有一樣的分歧。

image

2 个赞

香港中文大學 newsletter42

其中对比了香港与大陆的标准字形:

1 个赞

多个开源字表/汉字数据库都把字收录了,个人觉得危害有点大。

我同意。那做法誤導人。

1 个赞

如果是常用字字体,同时收录“任、仼”,那确实不应该。

尤其是搜索索引方面,会出现查询错误。

历史遗留问题,只能慢慢规范了。

1 个赞