不瞒你说我还的确认真考虑过 NoSQL,大致看过一下 MangoDB(结果是囫囵吞枣不明所以),因为:1. 数据导入Access 后数据库文件大小膨胀了至少5倍以上;2. 我的一个目标是要拆解词典的释义项目,我就想那是不是就要求每条记录的字段数是可变的,RDBMS 很有可能不支持。全文检索是必须的,我觉得倒是不难通过在搜索时把文本从 html 中剥离出来达到目的,不过也的确十分笨拙。(没想到全文搜索还有“分词”这样的技术真是学无止境)
我是数据库的完全门外汉,你说的 Sphinx 或 Elasticsearch 我真的要找时间好好学习一下,非常感谢老兄和前面的 @jiangws 老兄慷慨分享这么具体的技术细节 !
( [Tio词典网页版(中英、中日)] (Tio词典(中英、中日) | 登樓古籍全文檢索 - #184,来自 AnLuoRidge) 这个帖子之前没读过,刚看到,惭愧惭愧)