FORVO Pronunciations in All Languages (>6.7 million)

Pronunciations from Forvo.com
Number of audios: > 6.7 million
Number of languages: 357
Format: .opus and .mp3
License: CC BY-NC-SA 3.0

Description: All Forvo audios from 2008 until 2021. All languages registered on Forvo are available. Languages are organized according to their code on Forvo.

If you are interested in a language just download the .zip file (eg. English is called “en.zip”). Then, decompress the zip file in a single folder.

Audios can be used to compile .mdx/.dsl dictionaries or used directly on GoldenDict as “Sound Directories”:


Then, Press Apply. Ready. The collection of audios in your target language should appear as a Dictionary available on GoldenDict.

Download:
Folder name: 0 Forvo Audio

Torrent:
Forvo.com Audios (rutracker).zip (208.0 KB)

Notes:
1) .opus audio format is ideal for human voices and the size is smaller than .mp3

Ready .DSL Dictionaries are available: (zips with sounds for them should be taken from the folder opus). Thanks to “Svirepov”.

PS. A member of Ru-Board (“Svirepov”) also published a Python script to automatically make .dsl files from the .zip files:
Download script HERE:

Source: Ошибка :: Компьютерный форум Ru.Board

Automatic Translation:
A Python script that takes zip with sound files from Forvo and generates a DSL for it so that the archive is not unpacked, but immediately used as .dsl.files.zip under GoldenDict.

It works like this ( <dict_name> <index_language> <contents_language>):

The code:

forvo-zip2dsl.py nl.zip ‘Forvo Dutch’ Dutch Dutch >ForvoDutch.dsl

nl.zip rename to

ForvoDutch.dsl.files.zip

and put them next to the .dsl
Or - if you use .dsl.dz - to .dsl.dz.files.zip (desktop GD doesn’t care, mobile GD seems not to).

20 Likes

Thanks for crawling and uploading.

2 Likes

Amazing resource. Thanks a lot.

2 Likes

文件有多大呢,我这边看不出多大,再盲下。。。不知硬盘容量还够不够

1 Like

卧槽,看到了,一个近30G,一个近50G
不知道有没有下下来的老哥弄个百度盘的链接的
我这边不知为啥,只有几十K的速度。。。。

1 Like

You can download only the language in which you are interested. For example, English is only 1.2 GiB in .opus format.

Regarding Baidu, I cannot upload there from my country. I would appreciate if someone uploads the whole collection into Baidu.

It would be good to upload in Baidu because the servers of FreeMDict might become congested…

3 Likes

多谢楼主,慢慢下载。

1 Like

Such a great work

1 Like

在执行的时候出现了这样的错误提示:
File “forvo-zip2dsl.py”, line 8
‘<contents_language> <index_language>’, file=sys.stderr)
^
SyntaxError: invalid syntax

解决了,是python版本问题。

2 Likes

Here is the METADATA off all Forvo audios.

It includes speaker’s country, gender, number of votes, etc. The file needs to be compressed and opened via terminal (only).

Also available there is the Python script that was used. The script needs the metadata (json file) in the same folder to work.


@okayer I hope it could be useful for your .mdd compilation

It would be ideal to compile an .mdd file that includes the speakers country, gender and number of votes (as in Forvo).

2 Likes

@hua Could you kindly offer some help to our friend @okayer to compile a .mdd from Forvo Audios ?

2 Likes

I admire your time and efforts!

2 Likes

发一下各国语言的代号:

语言代码缩写 语言 语言代码缩写 语言
af 南非公用荷兰语 sq 阿尔巴尼亚语
ar-sa 阿拉伯语(沙特阿拉伯) ar-iq 阿拉伯语(伊拉克)
ar-eg 阿拉伯语(埃及) ar-ly 阿拉伯文(利比亚)
ar-dz 阿拉伯文(阿尔及利亚) ar-ma 阿拉伯语(摩洛哥)
ar-tn 阿拉伯语(突尼斯) ar-om 阿拉伯文(阿曼)
ar-ye 阿拉伯文(也门) ar-sy 阿拉伯文(叙利亚)
ar-jo 阿拉伯文(约旦) ar-lb 阿拉伯语(黎巴嫩)
ar-kw 阿拉伯文(科威特) ar-ae 阿拉伯语(阿联酋)
ar-bh 阿拉伯语(巴林) ar-qa 阿拉伯文(卡塔尔)
eu 巴斯克语 bg 保加利亚语
be 白俄罗斯语 ca 加泰罗尼亚语
zh-tw 中文(台湾) zh-cn 中文(中华人民共和国)
zh-hk 中文(香港特区) zh-sg 中文(新加坡)
hr 克罗地亚语 cs 捷克语
da 丹麦语 nl 荷兰语(标准)
nl-be 荷兰语(比利时) en 英语
en-us 英语(美国) en-gb 英语(英国)
en-au 英语(澳大利亚) en-ca 英语(加拿大)
en-nz 英语(新西兰) en-ie 英国(爱尔兰)
en-za 英语(南非) en-jm 英语(牙买加)
en 英语(加勒比海) en-bz 英语(伯利兹)
en-tt 英语(特立尼达和多巴哥) et 爱沙尼亚语
fo 法罗语 fa 波斯语
fi 芬兰语 fr 法语(标准)
fr-be 法语(比利时) fr-ca 法语(加拿大)
fr-ch 法语(瑞士) fr-lu 法语(卢森堡)
gd 盖尔语(苏格兰) ga 爱尔兰语
de 德语(标准) de-ch 德语(瑞士)
de-at 德语(奥地利) de-lu 德语(卢森堡)
de-li 德语(列支敦士登) el 希腊
he 希伯来语 hi 印地文
hu 匈牙利语 is 冰岛语
id 印度尼西亚语 it 意大利语(标准)
it-ch 意大利语(瑞士) ja 日语
ko 韩语 ko 韩文(韓文)
lv 拉脱维亚语 lt 立陶宛语
mk 马其顿语(前南马其顿) ms 马来西亚语
mt 马耳他语 no 挪威文(巴克摩)
no 挪威文(耐诺斯克) pl 波兰语
pt-br 葡萄牙语(巴西) pt 葡萄牙语(葡萄牙)
rm 里托罗曼斯文 ro 罗马尼亚语
ro-mo 罗马尼亚语(摩尔多瓦共和国) ru 俄语
ru-mo 俄罗斯(摩尔多瓦共和国) sz 萨米语(拉普语)
sr 塞尔维亚语(西里尔文) sr 塞尔维亚语(拉丁)
sk 斯洛伐克语 sl 斯洛文尼亚语
sb 索布语 es 西班牙语(西班牙)
es-mx 西班牙语(墨西哥) es-gt 西班牙语(危地马拉)
es-cr 西班牙语(哥​​斯达黎加) es-pa 西班牙语(巴拿马)
es-do 西班牙文(多米尼加共和国) es-ve 西班牙语(委内瑞拉)
es-co 西班牙语(哥​​伦比亚) es-pe 西班牙语(秘鲁)
es-ar 西班牙语(阿根廷) es-ec 西班牙语(厄瓜多尔)
es-cl 西班牙语(智利) es-uy 西班牙语(乌拉圭)
es-py 西班牙语(巴拉圭) es-bo 西班牙语(玻利维亚)
es-sv 西班牙语(萨尔瓦多) es-hn 西班牙语(洪都拉斯)
es-ni 西班牙语(尼加拉瓜) es-pr 西班牙语(波多黎各)
sx 苏图语 sv 瑞典语
sv-fi 瑞典语(芬兰) th 泰国语
ts 特松加语 tn 茨瓦纳语
tr 土耳其语 uk 乌克兰语
ur 乌尔都语 ve 文达语
vi 越南语 xh 科萨语
ji 意第绪语 zu 祖鲁语
5 Likes

Thanks for your hard work @sannuofy . Very useful ! :slight_smile: