王力古汉语字典更新(2021年8月26日已核对完)

美丑是对比辞源和王力古的文本说的,这两家自带的字体,单字看上去差别不大,但整体应用上去会很协调。全宋体单字看上去还行,用于大段文本上很难看(个人看法,没有其他意思),不过可以理解的,以个人的力量做到这种程度已经很尽力了。

是不是有这种情况,同一个unicode在两地的显示的字是有区别的呀?

感觉挺麻烦。

回答hua的疑問,申請註冊新的unicode統漢碼的過程中,各地會提供該字的字形,若unicode組織把這組字形當作(在意義上)是同一個字的不同表現,這組字形就會被“unified”,被統一,之所以叫統漢碼。既然如此,就出現 “一碼多形” 的現象。換言之,同一個字碼會包含不同異體字。

到底包含哪些字形,要看Unicode code chart,定出規範範圍。拿上面“瘝”字為例,因為日本、南韓提供該字在王力字典的字形,這個紙書上的字就應當用那個電子字碼來表現。

參考我上面列的“瘝”字表,可以看出日本、南韓提供的字形跟康熙字典一樣,反而是大陸、台灣跟康熙字體有脫離!(一般來說,南韓字形最遵照康熙字體,所以南韓漢字才是地道的舊字體,哈哈。中華文明偉大而多元,看字表,不要只看兩岸三地的字形。)

發佈字碼的規範字形範圍是unicode辦的角色,到時候製造電腦字型的字庫公司,按照規範字表來造字形,一般是配合地區的。但也有特殊狀況,例如B擴展區,原來2003年的字表,主要是由北京中易定的,繁體字型的B區字,當時大多也沿著中易,甚至中易作出的錯字形也繼續複製了。後來其他地區也提供了別的字形,灌入字表。

辭源字型雖是大陸的,它跟中易和中華書局的字體不完全合,差距不少,所以同一區也有區分。

跟 unified 相對的就是 disunified,也就是說給異體字分別分配不同字碼。所以 “內、說、呂”等等字有兩個寫法,各有自己的統漢碼。在這情況下,字碼與字形的關係是一對一,是穩定的,沒有“一碼多形”的現象。

咱們作mdx的,需要知道哪些字是 unified,哪些是disunified。問題是unicode字表包裝成鎖碼的pdf,不方便翻,我看煩了所以作了統漢碼字形譜。

1 个赞

同感,我比較小眾,傾向於古代漢語、古典文獻專著,這塊儘可能用傳統字、傳統字形。

可以用全宋体,只不过字体过大,要一分为二,深蓝和dicttango 放二图,分享下最新的



FSung-1_01.ttf (4.9 MB)
FSung-2_01.ttf (29.3 MB)
FSung-2_02.ttf (14.0 MB)
FSung-3_01.ttf (3.1 MB)
FSung-F_01.ttf (29.4 MB)
FSung-F_02.ttf (19.6 MB)
FSung-m_01.ttf (28.6 MB)

3 个赞

据我所知,早期Unicode汉字部分相当于直接把各地标准并入Unicode,这些字不同字形编码不同;后来改了标准,如果仅字形不同,则共用同一个编码,在不同地区(陆港台日韩越)显示效果不同,其中代表有走之旁。

1 个赞

全宋体似乎基于中易宋体?那不好看也可以理解。
http://cheonhyeong.com/Simplified/download.html
这个字体不知全不全?

感谢,这样对于其他词典我也可以按照这个使用全宋体了,太感谢了

你講的主要是Unicode早期的基本區字的來歷,我講的主要針對後來加的擴展區字,因為大字典才需要多用擴展區字。

還有,Unicode規範字表是一會事,mingliu.ttc(細明)在不同windows環境會顯出不同的字形,這是另外一件事。後者跟hua的疑問也有關係。

mingliu.ttc(不是普通ttf)的格式,按照windows所設的地區會顯出台灣或香港的字形。這是特殊的字型,特殊的行為。mingliu.ttc只有在windows才會有這樣的反應,因為是微軟安排的。

1 个赞

在欧路里怎么用呢?

目前不行,就算切分开字体还是没法引用这么多这么大的字体
欧路跟深蓝差不多,你需要在css中添加字体
你可以去网上搜css引用外部字体
你依葫芦画瓢就可以弄成