外链论坛

 找回密码
 立即注册
搜索
查看: 87|回复: 1

一上线就爆火?中文语音AI天花板ChatTTS到底是个啥?

[复制链接]

2584

主题

220

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99100718
发表于 2024-7-3 23:33:38 | 显示全部楼层 |阅读模式

在Github上大火的ChatTTS到底是个啥?

省流:文本转语音+声音克隆

听说很牛,到底有多牛?

牛到作者毫不掩饰的说是日前为止的开源项目天花板

仅仅5天斩获了16k的关注,真是个好项目。

我试了试其中的效果,真的很NB,难怪这么多人关注这个项目。

介绍

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型运用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

亮点

对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同期支持多说话人。细粒度掌控: 该模型能够预测和掌控细粒度的韵律特征,包含笑声、停顿和插进等。更好的韵律: ChatTTS在韵律方面超越了大部掰开源TTS模型。同期供给预训练模型,支持进一步的科研

ChatTTS的应用场景

ChatTTS适用于各样必须高质量语音合成的场景,包含但不限于:电商直播:为直播供给更加自然的语音配音,加强用户体验。自媒介:帮忙媒介创作者生成生动的配音,吸引更加多观众。在线教育:为在线课程供给清晰自然的讲解声音,提高学习效果。客服和售后服务:供给更人性化的语音服务,加强客户满意度。

运用介绍

1:下载资源压缩包

咱们供给了 2 套整合包,一套是软件君的,还有一套是ChatTTS-ui

2:本地起步程序

下载完成后,解压压缩包,点击"起步.exe"起步脚本

3:浏览器操作运用

text:指的是必须转换成语音的文字内容。Refine text:选取是不是自动对输入的文本进行优化处理。随机度:一个掌控输出随机性的参数,数值越大,生成的语音随机性越高,这可能引起生成的语音质量有时更好,有时更差。声音选取:默认值为2222,这是一个数字参数,用于选取声音的类型。可选的数字有2222、7869、6653、4099、5099,能够任选其一,输入其他数字以随机选取声音。定制声音:这是一个正整数参数,用于定制声音的音调和音色。倘若设置了此值,将优先运用,而忽略声音选取参数。提示设置:用于添加笑声、停顿等效果。例如,能够设置为[oral_2][laugh_0][break_6]。

软件君的整合包-更新记录

V1.0版本:2024-6-2

1、基于ChatTTS项目,支持保留音色,支持生成wav。

返回外链论坛:http://www.fok120.com/,查看更加多

责任编辑:网友投稿

回复

使用道具 举报

0

主题

1万

回帖

1

积分

新手上路

Rank: 1

积分
1
发表于 2024-8-28 13:07:04 | 显示全部楼层
哈哈、笑死我了、太搞笑了吧等。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|外链论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-10-3 15:58 , Processed in 0.067631 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.