[生花笔]1.92.8安装教程(ocr,对话,智能搜索,文本纠错)

我不懂技术,只是从使用者的角度来构想的。例如在《诗词曲语辞汇释》中珍重的释义:珍重,猶云多謝也;難得也;幸虧也。又猶云仔細或保重也。我检索“幸亏”“难得”等,它最起码会显示出“珍重”这个词头。也就是它是真正理解了这个词在词典中的含义后,反馈给我结果;目前它好像是对词条表面意思的自解释反馈结果的,例如我检索“谢谢”,所有带“谢”字的词汇都会出现,例如“谢安”,可见它只是对词头的表面理解来反馈结果的,而不是自己了解了这个词在词典中的释义给出的答案

就目前的手段来说.没有真正的"理解"能力(包括搜索引擎),只有相似的能力,也就是说一句话或者一个词语,返回哪个更相近
如果说模型训练的比较好的话,是可以能返回这种引申含义的.但是这种相似搜索,始终是字相似优先
如果说您想扩大搜索结果的话.目前来讲可以去设置中改这个"shenghuabi.query": {"limit": 10},把数字改的更大,他会返回更多结果.可能就有想要的了.未来来说就是提高搜索结果就只能提高模型这方面了
举个例子就是假如一个词叫aa,他的解释有200个字,另一个词叫bb,他的解释是 aa的近义词.那么这个时候搜索aa,返回结果一定是bb在前面.因为就相似度来说.aa的解释200个字转成向量,那么维度中的属性就比较杂了.而bb的解释就6个字,他生成的维度属性肯定包含aa多一些.而这时搜索aa,自然就是bb靠前.
我说的这个意思就是目前的智能搜索.都是先优先字面意义上的相似(utf8字符的相似),如果没有字相似,才会去找引申看起来更相近的.

有bug了…勿用 :sweat_smile:
改过一次.因为之前的太小众,智能生成卡片,后来想改一个通用的(包括生成文本节点树之类的).但是功能太多没来得及做…
理论上不会太卡,因为做了懒加载,会在视窗内部的才显示

在输入的过程中,按删除键时,会弹出的这些提示词,它们是从哪里来的?我并没建立它们的卡片。
1、请问怎么批量建立提示词?
2、请问怎么批量建立卡片?
3、有弹出提示词的快捷方式么?
屏幕截图 2024-09-05 115401

图片这个是根据输入过的文章自动推断的
提示词目前是根据卡片来的.卡片目前可以手动创建,也可以生成(只要符合格式就可以,不过没录教程,等有空的演示下)
自动弹出的,使用卡片默认为定义标题,可以自定义或者拼音.也是等有空演示下

1 Like

目前词典的检索形式只限于文字版的,图片版的词典所在多有,博主是否可酌情打通关节,造福学林?

请提供相关字典供参考

我的显卡是英伟达4060的,更新了这个版本,速度不增反降,原来是50条一组上传,现在是20条一组,更慢了,奈何?

并且上传一会就出现bug:
b021d962e69338c9c967c5c38432e99

感觉很高大上,但是除了词典功能,没看明白到底要做啥。
安装Xenova/bge-base-zh-v1.5,但是一直下载不完,
着急就点了下边的步骤。结果ollama安装后不能运行。不知道是不是因为之前已经安装过了,忘了退出,还处在运行状态。
感觉小白玩不转。
想删删不干净。不想保留千问模型文件,但是不知道在什么地方。
请楼主指教!

在解决中.你可以尝试修改设置 "shenghuabi.dict.batchSize": 4,,默认20,有可能爆显存变慢了,另外报异常在解决中.测试的时候没有,但是换了台机器就发现偶尔出现.
另外经过测试确实发现有些字典好像原来的反而快…准备把原来的方法再加回来 :sweat_smile:

软件的资源管理器(左上角第一个)=>配置文件位置中有ollama=>模型位置

Xenova/bge-base-zh-v1.5这个一般要下多久才会显示成功或失败?

如果你用的是1.92.7的话默认是100m,看你的带宽…另外由于用的是镜像源,所以有时候不稳定(当然直连可能联不通)
1.92.8的话是全量的400m(不过由于性能不是太好,暂时不推荐,等我修改完的)

厉害(òωó):+1: