使用本地词典很久了。也想给社区贡献一份力。想知道有什么比较系统的材料能够帮助我学习词典制作吗?
虽然现在ai能够给出很多指导,但我相信社区里的大佬给出的建议应该是最佳实践 ![]()
ps. 本人非计算机科班,但是是理工科的,经常写代码+自己捣鼓软硬件
使用本地词典很久了。也想给社区贡献一份力。想知道有什么比较系统的材料能够帮助我学习词典制作吗?
虽然现在ai能够给出很多指导,但我相信社区里的大佬给出的建议应该是最佳实践 ![]()
ps. 本人非计算机科班,但是是理工科的,经常写代码+自己捣鼓软硬件
数据收集
整理数据为html格式,编写样式
最后一步才是打包为mdx文件
最难的是数据收集,要么你就下app或者光盘去解析,要么就去想办法把pdf电子书转为文字稿一一校对
会自己写代码就容易很多了吧。我自己不会写代码纯靠regex加上一些小工具也能做,HTML的话,先有个大致的了解,用的时候查查就可以了。现在AI很强,只需要对着AI写出来CSS改改就可以了,不需要从零开始写CSS了。js倒是可以学学,原本就有写代码的能力应该会好学很多。
其实比起处理原始词典数据,更麻烦的事情是怎么把一些材料变成可以处理的数据,用的最多应该是爬虫和OCR,爬虫还是比较吃写代码的能力的,OCR最需要的其实是耐心。
我觉得你可以直接上手做一本试试,找一本你想做词典的材料,遇到问题就去查,多踩几回坑差不多就能大致摸清是怎么一回事了。
合理。html+css+js倒不是问题,也写过几个小项目。上手做一下,最近物色一个合适的、简单点的就开始。
看起来从html打包到mdx是最不需要格外关注的。我准备找个简单的项目试试水hhhhhh