[生花笔]1.94.6安装教程（ocr,对话，智能搜索，文本纠错）

owlbaby · 2024 年9 月 4 日 00:35

我不懂技术，只是从使用者的角度来构想的。例如在《诗词曲语辞汇释》中珍重的释义：珍重，猶云多謝也；難得也；幸虧也。又猶云仔細或保重也。我检索“幸亏”“难得”等，它最起码会显示出“珍重”这个词头。也就是它是真正理解了这个词在词典中的含义后，反馈给我结果；目前它好像是对词条表面意思的自解释反馈结果的，例如我检索“谢谢”，所有带“谢”字的词汇都会出现，例如“谢安”，可见它只是对词头的表面理解来反馈结果的，而不是自己了解了这个词在词典中的释义给出的答案

wszgrcy · 2024 年9 月 4 日 12:34

就目前的手段来说.没有真正的"理解"能力(包括搜索引擎),只有相似的能力,也就是说一句话或者一个词语,返回哪个更相近
如果说模型训练的比较好的话,是可以能返回这种引申含义的.但是这种相似搜索,始终是字相似优先
如果说您想扩大搜索结果的话.目前来讲可以去设置中改这个"shenghuabi.query": {"limit": 10},把数字改的更大,他会返回更多结果.可能就有想要的了.未来来说就是提高搜索结果就只能提高模型这方面了
举个例子就是假如一个词叫aa,他的解释有200个字,另一个词叫bb,他的解释是 aa的近义词.那么这个时候搜索aa,返回结果一定是bb在前面.因为就相似度来说.aa的解释200个字转成向量,那么维度中的属性就比较杂了.而bb的解释就6个字,他生成的维度属性肯定包含aa多一些.而这时搜索aa,自然就是bb靠前.
我说的这个意思就是目前的智能搜索.都是先优先字面意义上的相似(utf8字符的相似),如果没有字相似,才会去找引申看起来更相近的.

wszgrcy · 2024 年9 月 4 日 12:39

有bug了…勿用
改过一次.因为之前的太小众,智能生成卡片,后来想改一个通用的(包括生成文本节点树之类的).但是功能太多没来得及做…
理论上不会太卡,因为做了懒加载,会在视窗内部的才显示

zhu1234 · 2024 年9 月 5 日 03:56

在输入的过程中，按删除键时，会弹出的这些提示词，它们是从哪里来的？我并没建立它们的卡片。
1、请问怎么批量建立提示词？
2、请问怎么批量建立卡片？
3、有弹出提示词的快捷方式么？
屏幕截图 2024-09-05 115401

wszgrcy · 2024 年9 月 5 日 11:43

图片这个是根据输入过的文章自动推断的
提示词目前是根据卡片来的.卡片目前可以手动创建,也可以生成(只要符合格式就可以,不过没录教程,等有空的演示下)
自动弹出的,使用卡片默认为定义标题,可以自定义或者拼音.也是等有空演示下

owlbaby · 2024 年9 月 7 日 00:25

目前词典的检索形式只限于文字版的，图片版的词典所在多有，博主是否可酌情打通关节，造福学林？

wszgrcy · 2024 年9 月 7 日 01:52

请提供相关字典供参考

owlbaby · 2024 年9 月 7 日 12:22

我的显卡是英伟达4060的，更新了这个版本，速度不增反降，原来是50条一组上传，现在是20条一组，更慢了，奈何？

owlbaby · 2024 年9 月 7 日 12:26

并且上传一会就出现bug：
b021d962e69338c9c967c5c38432e99

WalkingDictionary · 2024 年9 月 7 日 15:02

感觉很高大上，但是除了词典功能，没看明白到底要做啥。
安装Xenova/bge-base-zh-v1.5，但是一直下载不完，
着急就点了下边的步骤。结果ollama安装后不能运行。不知道是不是因为之前已经安装过了，忘了退出，还处在运行状态。
感觉小白玩不转。
想删删不干净。不想保留千问模型文件，但是不知道在什么地方。
请楼主指教！

wszgrcy · 2024 年9 月 8 日 02:18

在解决中.你可以尝试修改设置 "shenghuabi.dict.batchSize": 4,,默认20,有可能爆显存变慢了,另外报异常在解决中.测试的时候没有,但是换了台机器就发现偶尔出现.
另外经过测试确实发现有些字典好像原来的反而快…准备把原来的方法再加回来

wszgrcy · 2024 年9 月 8 日 02:20

软件的资源管理器(左上角第一个)=>配置文件位置中有ollama=>模型位置

WalkingDictionary · 2024 年9 月 8 日 08:26

Xenova/bge-base-zh-v1.5这个一般要下多久才会显示成功或失败？

wszgrcy · 2024 年9 月 8 日 10:50

如果你用的是1.92.7的话默认是100m,看你的带宽…另外由于用的是镜像源,所以有时候不稳定(当然直连可能联不通)
1.92.8的话是全量的400m(不过由于性能不是太好,暂时不推荐,等我修改完的)

zhu1234 · 2024 年9 月 9 日 13:53

厉害(òωó)

wszgrcy · 2024 年9 月 10 日 09:31

已经更新.您可以去阿里云盘下载现成的模型,假如还没有下载完成.国内哪怕挂了镜像有时候下载还是不行,这个真没办法

wszgrcy · 2024 年9 月 10 日 09:35

已经修复.您可以去下载链接处下载1.92.9.所反馈问题已经修复(速度慢+有异常跳出).如果还有问题请看1.92.9发布的视频,将异常发给我.
(我觉得应该没问题了,但是异常毕竟不是发生再我身上,我也不敢打包票)
最后是否能提供图片版的字典供开发参考.)

owlbaby · 2024 年9 月 10 日 09:42

有许多词典在上传时都会报错，我相信其他人应该也遇到过吧，不知何故，还望博主拨冗见察！

wszgrcy · 2024 年9 月 10 日 10:39

请点击左下角的文本到向量模型打开输出日志,然后发给我.这个bug没遇到过.

wszgrcy · 2024 年9 月 10 日 10:51

好像时Mdx词典的问题.我测试的时候忘测这个类型了.我看看什么问题.抱歉啊.搞了几天以为能完美解决.没想到还搞出新问题