J̥H́-交流 - 词典数据之基于Wikitionary的有声有色的词库制作

背景信息: J̥H́-问询 - 词典数据之是否有包括图片,音频甚至视频的开放数据可以用来制作mdx词库

调研报告:Wikitionary - A Wiki-based Open Content Dictionary, https://catalogues.johannhuang.com/Dictionaries/1978923

相关工具:https://github.com/OZv/WKT
已有资源现状:有部分图片,但是并无音频。

本帖目标:基于Category:English lemmas, https://en.wiktionary.org/wiki/Category:English_lemmas ,筛选出有音频或者视频的词条,然后制作一份有声(音频)有色(视频画面/图片)的词库。

交流目的:希望对从Wikitionary提取数据的朋友,给点建议、方法或者最好是工具,以便能够更好的制作。

动手前,先来问问,免得搞无用功。

1 Like