关于词向量数据的提取、筛选问题,恳请技术大佬惠施援手!

事情是这样的,我自己统整了一个汉语词目表,想要提取腾讯AI实验室的1200万开源词向量数据,然后遍历词目表词头,做成一对多的映射集,亦即源词对应若干联想词/近似词,例如——戎马[‘戎马倥偬’‘疆场’‘军马’…]这样的呈现方式。可是我编程知识有点捉急,实在无从措手,故而想请懂些门道的兄弟施以援手!

有偿在本坛不妥。

哥,你后台帮我改了啊,谢谢 :joy: