粤典资料_20240310

简单收集 粵典資料 相关文档的超简单小字典(技术不行),丑到爆!

粵典資料 网站

文字资料来源粵典資料,
录音文件来源于粵音資料集叢和粤语审音配词字库.
在MDictPC和无限词典测试通过.

感谢所有文档提供者的无私奉献
欢迎修改.本人没技术,只是随便捣弄一下.

20240310
重新制作
为了不错误去重,有些没有解释和例句的字词发音可能会有重复,水平不足,请多多见谅

20240306
增加粤拼查字

20240118
根据粤典网站单字发音文档添加单字缺少的发音
文档网址:粵典字表 words.hk character list | 數據 | 粵典 words.hk
删除重复的简体字跳转词条
修正其它一些错误

20240113
初次发布

网站云盘:

百度盘也分享了(没有其它网盘).

发音文件mdd把网盘里的粤音资料集从的mdd改名为同名mdd即可(粤音和粤典两个词典用的mdd是同一个).

网盘两个mdd大小不一样是因为声音文件大小的差异

链接:百度网盘 请输入提取码
提取码:loyo






8 个赞

楼主的文件,mdx只有1.3m,mdd有208.2m。

包括我在内,许多人无法用大陆网盘。mdx非常小,希望楼主把mdx直接上载到这个帖子中,让大家都能使用。mdd太大,就算了,反正是音频文件,不是所有人都需要。

假如欢迎别人改进,也说一声。那么,有兴趣的人可能就会发布改版。

中_粤典资料.mdx (9.7 MB)

上传了mdx,尝试上传mdd说文件太大,不知道怎么搞.

欢迎修改.我没啥技术,只是随便捣弄一下.

3 个赞

在论坛上载超过20mb的附件,需要分割文件。几百mb的文件,要分割就比较麻烦。

不分割上载大文件可以用本坛云盘,使用本坛云盘需要另外申请账号。

使用本坛云盘

当然,放到本坛云盘,也会有人唉声叹气,说无法下载,要求放百度盘。

放百度盘,又会有人要求放阿里,放123。

假如有人发了一个允许修改的词典,有人修改了再重发,几年后就会出现相对完善的改本。

补个123链接

提取码:5Tzy

1 个赞

请问为何网盘里的男版发音比男女发音的文件更大?


free网盘的mdd名字是不是弄错了,是不是应该是粤音资料集从?

一字多音都只有一个音的项目被保留,是原数据不佳还是错误处理?

是哪些词条?
有可能是搞错了,也有可能是原数据不佳.
原数据是粤典网站下载的csv

你随便拿一个多音单字查一下就能知道,对比下官网或者pleco里的都不对劲。

我找了两个词,暂时没发现什么问题.
如果有其它错误,就帮我修改吧.
我没什么编辑能力.

如 对立,
原数据csv文件:

18257,對立:deoi3 laap6:deoi3 lap6,“(pos:形容詞)

yue:將對方當成競爭對手或者敵人
eng:opposing; antagonistic

yue:勞資應該合作,唔應該為咗薪酬問題而對立。 (lou4 zi1 jing1 goi1 hap6 zok3, m4 jing1 goi1 wai6 zo2 san1 cau4 man6 tai4 ji4 deoi3 laap6.)
eng:Between labour and capital, there shall be cooperation, not opposition, on salary.”,OK,已公開

词典:

對立

发音: deoi3 laap6
或者: deoi3 lap6
(pos:形容詞)
<解释>
粤语:將對方當成競爭對手或者敵人
英文:opposing; antagonistic
<例句>
粤语:勞資應該合作,唔應該為咗薪酬問題而對立。 ( lou4 zi1 jing1 goi1 hap6 zok3 , m4 jing1 goi1 wai6 zo2 san1 cau4 man6 tai4 ji4 deoi3 laap6 .)
英文:Between labour and capital, there shall be cooperation, not opposition, on salary.

官网:

「對立」
#1
读音: deoi3 laap6 deoi3 lap6
词性: 形容词
解释:
(广东话) 將對方當成競爭對手或者敵人
(英文) opposing; antagonistic
例句:
(粵) 勞lou4資zi1應jing1該goi1合hap6作zok3,唔m4應jing1該goi1為wai6咗zo2薪san1酬cau4問man6題tai4而ji4對deoi3立laap6。
(英) Between labour and capital, there shall be cooperation, not opposition, on salary.
参看: 對 對抗 反 反對 對壘 反派 對手 冤家 敵對 分歧 勢不兩立 壁壘分明 對壘 意識形態 敵對 敵視 水火不容 矛盾 紛爭

又如 近,
原数据csv文件(部分):

47669,近:gan6:kan5,"(pos:動詞)(pos:形容詞)(ant:遠)

yue:相隔嘅物理或者地理#距離、#差距 好#短;單用會跟白讀 kan5,構詞嗰時會跟文讀 gan6
eng:near; close; of a short physical or geographical distance; read as the colloquial reading kan5 when singly used, but as gan6 when forming other words

yue:#靠近 (kaau3 gan6)
eng:to stay close to

yue:拉近 (laai1 gan6)
eng:to keep closer

yue:呢度離#地鐵站 好近,行幾分鐘就到。 (ni1 dou6 lei4 dei6 tit3 zaam6 hou2 kan5, haang4 gei2 fan1 zung1 zau6 dou3.)
eng:The MTR station is near. You need to walk a few minutes only.

词典(部分):

发音: gan6
或者: kan5
(pos:動詞)(pos:形容詞)(ant : 遠)
<解释>
粤语:相隔嘅物理或者地理#距離、#差距 好#短;單用會跟白讀 kan5,構詞嗰時會跟文讀 gan6
英文:near; close; of a short physical or geographical distance; read as the colloquial reading kan5 when singly used, but as gan6 when forming other words
<例句>
粤语:#靠近 ( kaau3 gan6 )
英文:to stay close to
<例句>
粤语:拉近 ( laai1 gan6 )
英文:to keep closer
<例句>
粤语:呢度離#地鐵站 好近,行幾分鐘就到。 ( ni1 dou6 lei4 dei6 tit3 zaam6 hou2 kan5 , haang4 gei2 fan1 zung1 zau6 dou3 .)
英文:The MTR station is near. You need to walk a few minutes only.

官网是这样的:

近 [未公开]
遠近 距離嘅長短
類近 [未公开]
就近 [未公开]
靠近 令距離變短
接近 [未公开]
最近 距離而家並唔算長嘅一段時期
鄰近 [未公开]
鄰近 [未公开]
新近 [未公开]
附近 距離唔遠嘅一帶
上近 / 上緊 [未公开]
嗰頭近 指就快死
親近 [未公开]
挨近 [未公开]

点击"靠近"链接:

「靠近」
#1
读音: kaau3 gan6
词性: 动词
解释:
(广东话) 令距離變短
(英文) to get near; to come close to
例句:
(粵) 請cing2勿mat6靠kaau3近gan6車ce1門mun4。
(英) Please stand back from the door.
(粵) 有jau5個go3怪gwaai3人jan4靠kaau3近gan6我ngo5,點dim2算syun3?
(英) A weirdo is closing on me, what should I do?

再如, 派, 原数据只有一个音,
但学派,就有两个音:

90334,派:paai3,"(pos:動詞)

75653,學派:hok6 paai3:hok6 paai1,"(pos:名詞)


随手找了一条,真的不少内容缺了。如果元数据都没有,那估计只能靠爬虫官网了。

词语多音没看到缺,缺的都是字的。

那没办法了,不会抓取数据.

也可以查粤音资料集从
它的音还挺全的

这本粤典主要是例句多,收词量大,可惜了。

楼主在做粤语方言字典,本人觉得有一本旧的香港粤语词典内容比较有趣。完全是香港人的口语话,能做成MDX词典亦是功德一件,发个PDF文件试试看,不喜欢勿喷。

链接:百度网盘 请输入提取码
提取码:8ysk

既然要发,就介绍一下吧。

Chinese [zh], pdf, 203.1MB, Book (non-fiction), 香港粤语词典.郑定欧.pdf
香港粤语词典
江苏教育出版社, 1999
郑定欧
“现在为香港粤语而编纂的词典也有好几本,但这本词典因为有下列优点而值得向大家推荐:
(一)收词量是同类词典之冠,约有8000条;
(二)收录的词语新,以八、九十年代香港人口语常说的词语为主;
(三)词义分析以香港粤语为依据,并且有丰富的例句,有些例句更有书面语的翻译;
(四)附录,辑录研究香港粤语的论著,中文88条和英文23条,对想进一步了解香港粤语的读者很有用。”

这个收词少于《香港粤语大词典》。

香港粤语大词典
一部收录词条超过12,000条的《香港粤语大词典》以现有的主要粤语方言词典所收词条为基础,吸收近年香港粤语词汇研究的成果,增补近年出现的或重新流行的词语,收词尽量完备,实为认识与学习香港粤语之必要词典。

1 个赞

不好意思啊,我不懂怎么制作图片词典.其实文字类也只是随便瞎捣弄一下.帮不上忙了.

自顶一下,太小众了,更新估计过很久也没人知道…

2 个赞

我看了一下官网提供的源数据下载csv里面多音字的分条数据是有的,可能是处理的时候没有做词条合并?(比如:轉)
csv有一些多音字是官网源数据就做了词条合并(比如:近)

all-1709928301.zip (8.0 MB)





1 个赞

可能处理的时候被丢弃了,有空再搞过吧