有什么好的词典制作教程吗?

使用本地词典很久了。也想给社区贡献一份力。想知道有什么比较系统的材料能够帮助我学习词典制作吗?

虽然现在ai能够给出很多指导,但我相信社区里的大佬给出的建议应该是最佳实践 :grinning_face:

ps. 本人非计算机科班,但是是理工科的,经常写代码+自己捣鼓软硬件

数据收集
整理数据为html格式,编写样式

最后一步才是打包为mdx文件

最难的是数据收集,要么你就下app或者光盘去解析,要么就去想办法把pdf电子书转为文字稿一一校对

会自己写代码就容易很多了吧。我自己不会写代码纯靠regex加上一些小工具也能做,HTML的话,先有个大致的了解,用的时候查查就可以了。现在AI很强,只需要对着AI写出来CSS改改就可以了,不需要从零开始写CSS了。js倒是可以学学,原本就有写代码的能力应该会好学很多。

其实比起处理原始词典数据,更麻烦的事情是怎么把一些材料变成可以处理的数据,用的最多应该是爬虫和OCR,爬虫还是比较吃写代码的能力的,OCR最需要的其实是耐心。

我觉得你可以直接上手做一本试试,找一本你想做词典的材料,遇到问题就去查,多踩几回坑差不多就能大致摸清是怎么一回事了。

合理。html+css+js倒不是问题,也写过几个小项目。上手做一下,最近物色一个合适的、简单点的就开始。

看起来从html打包到mdx是最不需要格外关注的。我准备找个简单的项目试试水hhhhhh