《粤语发音字典》重新改版优化

《粤语发声字典》是2008年由hjwen11制作的,基于粵語審音配詞字庫,据我所知是唯一一本有粤语发音的字典,显得十分珍贵。但是这本字典没有做简体中文跳转,也基本没有样式。

我用MdxExport把里面的数据导出,重做了整个html结构,加上了样式。因为样式比较现代,所以有的软件可能会显示不对,我只测试了欧路词典和mdict。欧路词典底层用的就是浏览器的渲染引擎,所以能完美显示。mdict就不行,图标显示不出来。不知道goldendict怎么样。我主用欧路词典,暂时先这样吧。有需要的可以在这里反馈。(或者自行修改,样式文件是style.css,没有打包进mdd里)

我还根据粤典羊羊粤语校对并修改了原作者增补的词条,也补全了缺失的发音,最后加上了简体中文的跳转。

  • 字典收录了13079个字(包括原作者增补的28个字,增补字以「*」作标记)
  • 支持简繁体中文查询
  • 支持粤语拼音反查
  • 点击音标即可发音
  • 样式文件在style.css没有打包进mdd里,方便自行修改

预览:

下载:
粤语发音字典.zip (9.7 MB)

————

碎碎念:我是从高中开始接触mdict词典的,当时帮了我很多。但是当时不懂html、css这些东西,想着以后学会一定要回馈社区。就这样过了10几年。当我重新关注这个圈子的时候,pdawiki都已经不允许分享词典资源了。真是时过境迁啊。版权问题我也能理解,只能说,那个无私、自由的互联网时代真的过去了吧。

13 个赞

多谢分享。

感谢无私奉献! :muscle:

先生若有余兴,乘热打铁,再做一本粤语发音词典,岂非功德一件?光单字发音,外地尤其是北方人就是拿着字典,对粤语依旧不知所云啊。

感谢分享。安卓版DictTango经测试可用

用简体字查字无跳转,只显示@@@LINK=x, 词条跳转应该是直接在词条下加上@@@LINK=x即可,无须在词条下再加上 < link rel=“stylesheet” type=“text/css” href=“style.css”> 这一行。
只是跟你互相学习一下而已。冒昧之处请见谅。楼主的词典做得很美观,谢谢你的分享。

1 个赞

哪位大神如有兴致,可以考虑重新抓取一下网站数据,重制一个新版的mdx。原mdx毕竟是15年前的数据。这个字库网站隶属于香港中文大学文学院,是学习粤语不可多得的工具。

2 个赞

调整了适合我这边GD的版面,喜欢可自行取用 :slightly_smiling_face:
style.css (3.8 KB)

另外,不知能否将网站的音档抓下来做成mdd?以免日后网站下线就没发音了。

2 个赞

是的,我找到原因了,等我编辑一下更新到主文里

谢谢楼主的分享.
但似乎我这里旧版也是可以查询简体字的

我看了一下网站,上面有收字统计,比目前的字典多了10个字。等我有空对比一下,把新增的10个字加进去。不过如果能重新爬,肯定是最好的。

我看了下总字表,一共是13051个字,和收字统计说的不一样。我正文里写错了,原作者增补了28个字。也就是说,网站目前至少是没有新增字的,当然也不排除修订了内容。不过目前的数据是够用的。

按照汉字笔画索引给出的数字总和是13060

居然,我有空再对比一下

经过查找和对比,确实网站有些字是目前的字典里没有的,比如“粨”,“凈”等。

另外,08年的mdx数据也有问题,有的词条被不正确地繁体化了。比如“儿”和“兒”,在里是两个不一样的字,在mdx两个词条都是“兒”,还有“云”和“雲”、“几”和“幾”等,一共有100多处这样的错误。我找时间慢慢校对一下再发个新版吧。

除了这个字库,还有一个粵音資料集叢。收录多本粤音资料,如能做成mdx,亦是一件幸事。

爬了一下粤语发音字体的网页
html和发音文件wav在此,不知道有没有用

粤语发音字典_20230908.rar
链接:百度网盘 请输入提取码
提取码:rp9j

2 个赞

关于 粵音資料集叢 的文档资料,其主页上在 github 存放有副本

1 个赞

非常感谢,有了新的数据我应该可以重新做了

1 个赞

谢谢回复:writing_hand::writing_hand: