![图片[1]-VoiceGPT v1.2.2-软件开发学习笔记](https://gamedevfan.cn/wp-content/uploads/2025/04/VoiceGPT.webp)
资产现在可用于离线模式!享受无限和不受约束的体验,从您当地的手件上的文本生成声音。
在在线模式下-无需注册,无需API密钥,无需定期付款,无需订阅费用,无需额外费用,只需在我们的语音模型上单击即可轻松使用推断。
也可以用来扩展字符数的VoiceGPT +DeepVoice至560,000 char/mon
示例
-声音
在命运的代码中,调试疑虑并执行坚定不移的程序。
在屏幕之外,发现坚持不懈的未知领域,并获得韧性的奖杯。
向前推,不管水平。下一帧等待着一生的冒险。
-口音
现在,退休了,我坐在我的小别墅里,喝着热茶,对同志的回忆和遥远的战斗温暖了我的心。我的babushka的罗宋汤,一种家的味道,在安静的日子里带来安慰。生活很艰难。
耶!现在一切都不同了 …..曾经骑自行车穿过郁金香田野,现在,躲避僵尸!我讨厌这个!
-非单词的声音
不同字符的非单词声音的汇编-慢笑,哎哟,嗯,啊哈,嗯,嗯,嗯,哦-
-语言
千里之行,始于足下
在新的道路上死去。
您可以使用您的服务。
自由,自由,博爱。
在不同的地区
Onde há vontade, há um caminho.
La vita è breve, l’arte è lunga.
A los Tontos No les Dura el Dinero
Doe normaal, dan doe je al gek genoeg
Az élet szép
Güzel şeylere inan
Fortuna kołem się toczy.
我 “英语.
Co tě nezabije, to tě posílí.
Береги платье снову, а честь смолоду.
注意: 所有语言都可以在所有60 + 的声音。
您可以在文档中找到更多示例
关于
VoiceGPT是一个LAM (大音频型号)网络和图书馆能够通过使用人工智能和深度学习的文本生成逼真的语音。工作在实时,无论是在编辑模式或播放模式内的统一编辑器或任何移动设备。该资产有一个点击,初学者友好的GUI,不需要任何编码使用。
配额
500,000个字符每月的画外音和旁白需要用VoiceGPT.500,000个字符转换为150页Calibri中的12点文本。该配额在每月1日发放。处理至8x字符更多。
请注意: 您在此描述和视频 (预告片和入门) 中听到的声音是AI生成的。
请查看论坛页面最新发展和讨论与此资产相关。我们正在不断研究和添加更多的功能。感谢您的支持。
特点
👥 超快速语音克隆:只需3-6秒的语音剪辑即可克隆任何语音。在本地和基于服务器的模型中均受支持。
🗣 文本到语音转换器:只需输入要说出的文本,然后单击generate。获取游戏准备的声音与您选择的任何声音加上60更多的选择。
👅语言和口音支持:VoiceGPT_X模型支持不同的语言,例如英语、中文、德语、印地语、法语、韩语、葡萄牙语、意大利语、西班牙语、荷兰语、匈牙利土耳其语、波兰语、阿拉伯语、捷克语和俄语。目前的离线版本仅支持英语。
🔊语音调制控制:离线版本可以控制情绪值、扩散参数和与给定语音的匹配接近度。通过操纵这些参数,用户可以定制生成的语音以更好地满足他们的需求和偏好。
〰️ 预览波形:在编辑器中播放声音片段,而无需进入播放模式。 擦洗播放头以播放剪辑的任何部分。时间戳和波形的简单图形显示为更好的清晰度内的编辑器。
✂️修剪音频:编辑器中的用户友好的GUI,用于在剪辑的一部分不需要或为空的情况下修剪音频剪辑的末端。
➕合并剪辑:多个音频剪辑可以合并成一个使用直观的用户友好的功能在编辑器。只需选择剪辑,轻松地重新排列它们的顺序,并将它们合并为一个。
⚙️均衡轨道:掌握音频剪辑涉及剪辑的均衡,这可以在编辑器本身内轻松完成。只需选择剪辑,调整增益,音调和频带滑块。编辑器中提供了6频段均衡。
📄编辑器脚本:编辑器脚本在一个面板中整齐地显示所有选项。编辑器有一个内置的预览音频播放器。简单的设计,用于修剪,组合和均衡或掌握音轨。
编辑
将其全部保存在编辑器中:将所有资产保留在编辑器内的一个工作区中,并且必须切换到更少的服务可以有几个好处,例如:
-提高效率:当所有资产都位于一个工作区中时,访问和管理它们变得更加容易。用户不必花费时间在不同的服务或应用之间切换,这可能是耗时的并且导致生产力的损失。
-简化的工作流程:将所有资产放在一个工作区中可以帮助创建更简化的工作流程。这是因为用户可以轻松地在不同的资产 (如代码文件、图像和文档) 之间移动,而无需在不同的服务之间导航。这可以帮助加快开发过程并使其更高效。
-降低复杂性:使用较少的服务有助于降低开发过程的复杂性。
在包中,你会发现一个演示场景和一个编辑器窗口,帮助您访问TTS模型。还有其他有用的音频设置,如修剪,组合和掌握可以通过VoiceGPT编辑器窗口访问的音轨。
依赖项
此工具需要编辑器协程和Python脚本v7.0.1 +从包管理器和活动的internet连接。
限制
由于此工具仍在开发中,因此存在一些限制:
-处理多达500个字符在一个单一的时间。随着规模的扩大,这个限制将会增加。
-有大约60 + 的声音可供选择。通过语音克隆,您可以添加您想要的数量。
-音频生成时间约为每个剪辑5秒。这可能随着令牌和用户基数的增加而增加。
脱机版本:
-根据音频剪辑的长度和提供的参数,生成时间约为10-20秒。
-离线版本只接受英语培训。
-处理多达750个字符在一个单一的时间。
VoiceGPT将很快完全离线。享受无限和不受约束的体验,从您当地的手件上的文本生成声音。
最好与:
现在我们在谈论!由喋喋不休-资产存储上的实时自动多语言口动画资产。
暂无评论内容