{转帖} 可离线的文本转语音工具MultiTTS 新版 v1.5.3.1(听书专用,附带全新海量语音引擎包)

本帖最后由 心开始の未来 于 2024-7-12 12:21 编辑

MultiTTS是一款免费可离线的文本转TTS语音工具,旨在为其它阅读软件提供丰富多5样的AI语音包,实现多音色的无障碍朗读功能,从而提升离线听书体验。弥补了手机系统自带的单一乏味2且生硬的TTS语音引擎。目前市面上大多数语音引擎都需要通过联网API接口才能使用。此外,许多小说听书破软件要么充斥满天飞的广告,要么需要付费才能玩,甚至可能因为网络解问题导致播放中断,这些种种情况严重影响听书体验。所以功能有限制的这类软件不在本帖的讨论@及推荐范围之内。
简言之,只要心使用具备朗读本地书籍功能的软件配合MultiTTS此款语音发声即可基本替代第三方听书类软件,至少功能无限制无广告,接近真人发音。想必用过的必开然不太陌生,之前share的只不过始遗留旧版,这次算是开发者的诈尸级别回归更新,代码进行了优化重构,引入了多种大厂语音引擎及翻译,改进了功能の细节。近期更新,有需自取~~~

软件特性:
1.可自行对语音包引擎进行编辑、添加、删除、排序和导出数据;
2.在合未成语音的同时,可从本地文件中任选音乐播放来当作朗读BGM。
3.引入多种人物角色5规则,文本人物分析完成后可在角色管理中生成角色,并可用指定的发音人进行2朗读以及转发器(纯属高阶玩法)
4.新版本目前已支持大厂离破线语音及在线翻译发声引擎,包括微软、edge、百度、搜狗、小米、讯飞、字节跳动等引擎及火山、微软各语种等翻译(已作解详细整理并分门别类)。
5. 已支持@自定义导出DIY语音包(可搜索音色,下拉刷新可弹出导出界面)另外可查看软件的使用帮助了解更多详情。。。
如需未优化的旧版内容的,请戳> > 旧版本MultiTTS资源

使用说明:(相关教程铺天盖地,以下仅作简明扼要,一知半解勿下定论)
1.按需下载并推荐全新安装,至于心会导致另类部分导出bug的共存版本就不在此提供。首次开启动MultiTTS,软件内一片空白(即空壳),需要手动导入语音包文件。自行选择下载链接始所提供的在线或离线zip语音包(部分同类引擎包音色会有重复),内置各种高质量离线或在线AI主播语音。点击界面右上角三点按钮,再点“导入数据”,找到下载好的语音包后并选择导入即可(此方法不用解压!!)
2.语音包の导入需要花费一些时间(包越大导入越慢),请耐心等待,导入过程及完成都会有提示。然后再点右上角三个点未按钮,选择“设置TTS”,即可把首选TTS引擎修改为MultiTTS。左右滑动可自行切换语音引擎模块。
3.为了提高朗读稳定性,来建议给予必要权限,比如电池优化、后台运行、关联启动等等,确保不被后台杀掉。
4.至于配合朗读功能的软件,则使用> > 阅读3.0 足矣(具体论坛自搜),无论本地亦或在线书源均可搭配食用。。
5.至于翻译包的应用,多数用于多语种翻译软件的发声,不用的可忽略。
6.另类玩法:本地txt文本导入阅读软件+系统自带录音机可完全离线~~(不联网)~~无限制进行文本转语音~~~
7. 微软盘链接均为免登高速即下,若无法访问,请在不带扩展插件的浏览器的隐私~~(无痕)~~模式下或按下快捷键ctrl+shift+N粘贴链接进行访问并调用下载器可满速下载。已测链接访问无异常,下载更没问题!!!

Q&A:

  1. 导入数据开始时没有任何提示最后却显示导入失败
    首先说明一点,所提供的语音包已经在(发布)上传之前经过本地测试均可成功导入!!由于部分压缩包太大必定会有内部自解压过程,耗时自然更多。导入之后务必点击右上角菜单当中的“重载数据”刷新一下便能显示出来,除非检测到语音包数据重复则不会显示,再者退出软件重试。为减少出错机率,建议使用第二种方案,即以手动解压文件的方式将每个压缩包逐一全部解压到内部存储之下该软件的缓存数据当中。部分引擎的音色会重复,故只需选择覆盖即可。具体的统一原始路径定位至:

[PowerShell] 纯文本查看 复制代码

?

1 /storage/emulated/0/Android/data/org.nobody.multitts/files/voice/

[PowerShell] 纯文本查看 复制代码

?

1 内部存储/Android/data/ org.nobody.multitts /files/voice/

若files文件夹下没有 voice文件夹的话,请自行新建,将语音压缩包里的所有文件放进voice文件夹之内,否则软件无法识别。之后打开软件在右上方菜单中选择“重载数据”即会刷新出现各种语音引擎,再者请退出重进。如下图所示:

2.为何频繁提示“未设置对话/旁白发音人“
由于提前开启了“软件设置”—“合成对话”开关,默认关闭则是单角色朗读也就不再有提示。若多角色朗读需开启此功能,单击引擎角色设置为旁白发声,长按角色设置成对话发声,二者均要设置,设置多个同类角色会轮流发声。若试听无声,请关闭“合成对话”开关再次打开。则不会有上述提示。

  1. 朗读为何出现停顿或中断?
    请先检查正文内容是否异常;另请检查引擎是否调用网络连接(绿标语音引擎下载为完全离线可用,蓝标引擎地球为不收费联网可用,请自行甄别);是否开启唤醒锁、后台白名单和更改省电策略等,即上述所说的给予必要权限。

PS:
1.本软件仅限用于学习研究目的,请勿用于商业途径,否则后果自负,与本帖无关~~~
2.软件仅作获取存储权限之用,如担心请在虚拟环境运行或自行抓包验证,介意的勿下勿用。。。

主要界面:(音色太多无法一一展示)

相关设置:(必要时可打开合成对话,识别冒号引号后方的对话效果会较好)

搭配设置:(此为阅读app自带的朗读,调用该软件的发声引擎)

296x13
下载地址:
1 > > 微软盘下载 密码:52pj
2 >> 123盘下载 密码:P13b
3> > 百度盘下载 密码:mfxm

10 个赞

图片太多去这网站看看,贵站某些时间加载太慢,编辑个帖子也不太顺畅,反复刷新发现图片不显示,手机编辑的
https://www.52pojie.cn/forum.php?mod=viewthread&tid=1943208&extra=page=1&filter=author&orderby=dateline

1 个赞

原帖:
可离线的文本转语音工具MultiTTS v1.3.5.2 (听书专用,附海量语音包) - 『精品软件区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

1 个赞

我发的网站地址怎么显示的是,靠,一到编辑帖子网络就和我作对无语了

你贴的图片没有上传完整,测试图片:

推荐语音包:
安装【体积最小】的那个,然后在msctts分类下,选

  1. “聆”字开头的,如“聆关山”
  2. 带有“超品质”“高品质”后缀的,如“天明-高品质”

这些语音质量都不错,我一般用它读【社科类】书籍文献,自己用的引擎是【聆关山】,阅读软件用的【静读天下】

你说的语音包是那个?谢了,看来是讯飞

这个

频道:Telegram: Contact @MultiTTS_channel

谢谢分享!这个工具挺不错,下载试用了一下3月版和7月版,发现支持中文都很好,离线的语音包很丰富,特别是7月版,语音包都分门别类了,很方便,特别是提供了微软离线语音包,简直太给力了!

不过意外发现,英文还不甚完善:虽然7月更新的这一版已经有离线版微软语音包以及在线的Edge接口,但用它们来朗读时会不时出错,不管是用离线版微软语音包,还是MultiTTS提供的在线Edge接口或微软翻译接口,不时会把一个完整的英文单词拆成两半来朗读,比如随便举个简单的例子,There有时候会拆分为T和here来朗读;把world,拆分成两部分;而且每朗读一页文字,基本都会出现这样的情况,而且很影响听力理解,不像中文可以脑补。

而如果我直接用微软Edge浏览器的朗读功能来测试时,则不存在这种问题。也就是说,至少从英文的情况来看,MultiTSS目前的微软离线包和微软接口仍不等同于Edge浏览器自带的语音引擎。不知道是什么原因。

所以就英文的效果来看,目前似乎只有MscTTS里面的2个语音还行,一个是Catherine,另一个是John,不存在上述拆分单词的错误,但这两个离线包的音质不如MscTTS包中Catherine和John在线接口的效果。自然语音效果显然也不如微软。顺带一提,BDeTTS里面虽然有几个离线版的多语言语音(晓晓、云逸、晓辰、晓宇)可以读英文,但自然语音效果也不如微软,感觉有些中式英语。。。 :rofl:

希望未来版本能更好地支持英文。由于没权限看到52pojie原帖,以及无法访问telegram小组,希望有看到此帖的朋友可以帮忙反馈一下英文TTS效果的不足。感激不尽!

多谢。我以前用的TTS server 必须联网, 现在下离线微软语音效果感觉跟在线的没区别,不知道怎么达到的,其实删除掉大部分不用的 只剩一个英文jenny的和一个中文的,这 语音包才几十M 效果跟在线的音质一样。 把所有的离线包 试了一遍,微软的离线音质最好,其次是百度离线,百度离线里面的声音最多,剩下的离线各个音质都不行。

怎么设置 才能让app自动识别语言,使用相应的引擎? 不然app会用中文引擎读英文,反之亦然, 要手动选声音引擎才行。

看看这个,有几个英文还行

1 个赞

非常感谢提供这个信息!测试了一下,感觉效果果然非常棒!一开始没搞明白,只安装了从下面第一个页面下载的apk,发现没法直接调用TTS,只能把文字复制到对话框来朗读;后来下载了第二个页面的,就可以直接调用了。

目前用了piper-en_US-lessac-medium models,感觉质量和处理速度都不错,可以配合@Voice来使用~ (顺带一提,当用 阅读3.0 来调用这个TTS时,等了好久都没有朗读出来,可能哪里出错了…)

搜到一个使用经验,注意只能安装一个引擎。

MultiTTS这个工具好像没有自动切换的功能,不过每次手动选择也不是特别麻烦。要不然可以用@Voice Aloud Reader这个app,可以分别给英语和中文指定不同的TTS引擎,并能自动识别。

1 个赞

问一下,有没有日语的TTS或语音包?