ChatGPT 时代 各位大佬们如何看待(此篇同时回首当年形近词音近词词典问题)

This post was flagged by the community and is temporarily hidden.

看样子您也毕业多年了,不知在行业内发展如何,在任何一个行业乃至社会立足,成为令人尊重或者社会需要的人,最低标准是做好自己的事,最高标准是能推动事情的发展,对社会对他人或多或少形成实质帮助,而且优秀的人善于肯定他人,显然此贴目的是希望看到有优秀的形近词工具,而您不具备基本的读题能力,很任性的追求自己认为的嘴上痛快,容易让人误会屏幕那边是个随处可见的未婚中年 loser,不知平时职场上也如此幼稚任性的状态么,还是只是拿起键盘才这样,哎

我相信在这里讨论字典的都是对语言,对工作有一定追求,大家共同努力营造互帮互助的气氛,力争让每个浏览者都能有所收获吧

5 Likes

何出此言?为何如此愤慨?

这个词典看起来很好啊,何出此言

老话题,自己翻出来蹭蹭热度,各位大神近日可有什么此类资源新发现不?

1 Like

这个帖子里有一些:

2 Likes

排版很漂亮!不过看着像是The little dict + etymon +童哥说单词的合集?

非常感谢,就是它那个小程序支持元音推移和任意数量通配符那种形近,咱们这些mdx暂时只能必须是具有共同字符串才可以是吧

1 Like

自己再顶一顶吧,和这个小程序近似的资源,哪位大佬有比较好的版本么,最起码支持模糊近似匹配的

他这个就是相似度算法吧,比如余弦相似度、jaccard相似度,从软件层面比较容易实现,我以前做了个词典demo,做过这样的功能,现在网上很多开源代码,你有兴趣可以自己捣鼓一个,哈哈

1 Like

没时间做啊,而且也没有这个数据库,它这个是小程序,想坐等一份MDX,付费也可以,资源好就行

不需要数据库,词典软件做出来,把这个算法加进去,就可以对任意mdx词典进行这种查找,比如你输入patent,出来列表patent,potent,patient等等。我觉得你说的这个小程序应该就是这么干的,查词的时候临时从数据库或词典里把这些数据提取出来的,而不是有一个专门排版成这样的词典

2 Likes

可以去找词典作者,让他们加这个功能,比如本论坛的dictango,不知道他们愿不愿意

也对,拿本主流的词典作为蓝本就行,关键是很多人做的都是漏洞百出,没法用。这个小程序做的还行,我就想等它早日MDX化哈哈哈,我只做过一次同源词词典,手敲稿再机器校验,收录一万多组词根,1M多的mdx折腾俩月,再也不做了,人生苦短,好作品就直接付费买买买哈哈

这作者估计肯定不同意搞MDX,等于免费了,做小程序是想吸引流量也许

林子太大了,有些人活着真不容易

秦皇汉武 略输文采 唐宗宋祖 稍逊风骚 俱往矣

如果GPT能够带走我的问题,就像带走每条河流,所有回过的贴,所有抬过的杠,就让它随风飘走…

没有GPT的时候,rythming dictionary 应该是兄台需要的
论坛里能找到几本啊

恐怕不行吧,传统字典都是连续n字符串,视为形近词,实际没啥意义。而这个小程序是模糊字符接近,就是非连续字符串拼写近似,肯定需要一个算法的

这个在GoldenDict上可以很好实现,提供个思路:将词典弄成数据库,用一个外部程序,处理接收到的查寻,再将结果反回GoldenDict即可

这个二十多年前上线的网站就能查形近词、音近词。数字表示相似度。

potent 97 patents 90 Patten 90 patentee 90 pedant 90 paten 90 patient 85 peasant 85
patterned 85 patted 85 pageant 85 portant 85 pitot 85 passant 85
https://www.rhymezone.com/r/rhyme.cgi?Word=patent&typeofrhyme=sim&org1=syl&org2=l&org3=y

patient parent potent latent patet paten patens patena atent pament
https://www.rhymezone.com/r/rhyme.cgi?Word=patent&typeofrhyme=spell