汉语大词典光盘版2.0,另附3.0光盤版

后面用这个试试看

或者再加上

1 个赞

2.0
「䴉目」条

此其旋目乎?'䴉音旋

英文问号,经检索,正文内约有45270条
问号后多一「'」,仅此一处

验证了几条,都是光盘版没有的条目

據我所遇到的,那範圍的私有區漢字,即平面0私有區,本來來自方正字庫。

所以跟方正辭源字型大多重疊。流傳很廣:開心宋的平面0私有區,大多從方正拷貝過去的。後來經過Unicode的幾次更新,方正平面0私區都有了標準unicode字碼了,應當被淘汰,但很多資料還卡在舊的Unicode版本。

附帶一提,全宋體私有區僅在平面15,以後會擴到16。也就是說,跟那個範圍沒關係。

1 个赞

我不懂字码分区,只是因 feiwu兄提醒,在网上查了私用区,然后搜索,确实搜到这类字326个,在我这儿一少部分显示为常体的异体,大部分都是方框。

流傳很廣,成了一個非Unicode的標準了。

平面0就是 “U+XXXX” 四個字位。15平面,五個字位。16平面,六個字位。

此版本(2.0)“殿下”一词的2、3、4、5意项有重叠,3.0和纸书将这四项合为一个大意项的四个子项。

1 个赞

大哥,我见这张图上有集韵、群经音变、和篆隶万象,可否分享下呀?万分感谢!

我没有这些字典,是 tsiank的,应该没有放出来。原帖在国学数典网站。https://bbs.ugxsd.com/t-1019020.html

2 个赞

谢谢老哥,谢谢老哥

这样做是为了兼容性,使生僻字在不同字体里头的码位相一致,并没有侵犯版权,是好事。

汉字生僻字实在太多,现在使用场景又太杂(手机电脑、各种操作系统),兼容性是大问题,不得不稍微了解一些。

可参考这位老兄的科普系列,应该是他上大学时的笔记,全面通俗易懂。虽然一些观点略偏激,但用来入门足够了

等等
编程方面的技术内容可跳过不看。

3 个赞

css美化

u {
text-decoration: none;
/*取消<u>标签的下划线*/
border-bottom: 1px solid blue;
/*下边框线,solid实线,dashed虚线,blue边框线颜色,可更改*/
margin: 0 1px;
/*使下划线间界限分明*/
color: red;
/*字体颜色*/
}

对比:前



1 个赞

我上面說的話沒有別的意思,只是分享我的心得,對於這私有區字的來源。
關於版權問題,我沒資格談這個呵呵。

1 个赞

要先有2.0,2.0訂補,3.0的可靠文本才行吧,現在合在一起的版本,感覺部分內容經過了簡體->繁體->簡體->繁體。。。

2.0、3.0合并,不可取。从版本学的角度看,是把不同版本都污染了,不可分辨。

不建议用3.0,理由如下帖所述:

从资料齐全的角度来说,《汉语大词典》光盘3.0其实不是2.0的升级版,而是一个降级版。

港台可能不得不用《汉语大词典》光盘3.0,因为是big 5,能在big 5的系统上使用。

港台之外的使用者就别碰3.0了。想把资料转码使用,会无端制造出许多新的错误。就应该用2.0。

依我个人的浅见,兄台的目的假如是希望对照,最好的方法是把2.0、3.0、订补的独立版本,放在Goldendict里同时检索。这样既可以对比,资料又全然不会相混。

没有人会愿意人工合并这种大书,再人工校对。

假如用程式合并,一定会制造出许多新的错误。

附带说一句:所谓《订补》,是《汉语大词典订补》,这是一本独立的书,是《汉语大词典》纸本的订补,只是有书友做成了mdict。

还是2、3分着用好些

1 个赞

先搞出一个与《汉语大词典》纸本相一致的完善版本吧,目标不能太分散了。
目前最放心的做法是:以光盤版2.0为底本,参照图片版和光盘版3.0订正。

《汉语大词典订补》的内容可稍后再加上。
新的补正(与纸本不同的)发新帖探讨,再往后考虑是否以新的标签加入。

目前使用上而言,合并为一个mdx和几个mdx一起查询没有什么区别,合并的意义不大。

1 个赞

是这样,建议把2.0内订补的部分也删去,质量和2.0不可同日而语,同时2.0也被简繁转换了,不过没有直接换,而是用<SY></SY>后后增加了<SYF></SYF>,建议一并删去。

1 个赞

我就喜欢各个版本独立,互不相混。但是现在似乎找不到干净的、没受过污染的《汉语大词典》2.0版了。

这个2.0版也是受到污染的。繁简转换过,只是用css隐藏起来。加了《订补》,还有来历不明的东西。

手动改是不可能的。我是不会手动去改三十几万条的资料的。我只会随用随改,有用到的部分才改。