你所描述的目标,需求场景是非常丰富的。补充几个我真实的需求场景:
-
小朋友学习非常有用。小学生第一次学习时,经常需要查字典,他们看到现有大部分学习型词典的长篇大论是完全没有耐心的,非常需要一个权威又简洁的版本。曾经花了点精力装修 Oxford Primary 这个词典,但是它的词汇量非常有限,义项也有限,真的就仅适用于小学生。曾经一度也参考 skywind3000 开发的 单词释义比例,很有创意,但其中也暗藏了很多问题,不太敢给小学生使用。
-
电子书或手机中使用。那些长篇大论的词典不太适合使用这些小屏(手机)、慢速(电子书)的情景,非常需要一个简洁、权威又有足够覆盖度的版本。COD9 挺好,但还不够好。
-
程序化加工词典。喜欢的各种词典,由于结构复杂,比如COD9,它并非 html 标签,而是 xml 一样的自定义标签,这给程序提出了新的挑战,比如使用 mdxscraper、ANKI等,默认无法正确提取它的词条。
-
作为 AI MCP 的数据源,各种场景使用。
一旦有了这个开源词典,那些大厂一定会乐疯,并偷偷使用。或许可以找它们赞助。
其实,最最最应该承担这个责任的是政府部门或大学的什么机构,它们有专门的词典计划,但那些当政者并不关心“开源”这种东西,巴不得卖个千八百万。相比之下,我觉得台湾在词典开源方面真正做了一点事。