#记录我的2024#
快速导读:德国非营利科研实验室LAION研发了下一代语音助手BUD-E,旨在供给沉浸式的对话体验。与当前的AI语音助手区别,BUD-E以更自然、更贴近人类的方式回复,减少延迟,改善对话流程。该系统在消费设备上运行,响应时间快,为300至500毫秒。LAION计划进一步加强BUD-E的功能,包含管理多说话人对话,并邀请开源研发人员和科研人员为其发展做出贡献。
以BUD-E推进对话型人工智能
LAION与图宾根ELLIS科研所、Collabora和图宾根人工智能中心合作,推出了BUD-E,一款旨在彻底改变咱们与人工智能系统互动方式的创新语音助手。与当前平常的语音助手相比,BUD-E旨在供给更自然、更沉浸式的对话体验。LAION承认现有的语音助手在理解和适应人类对话的微妙和情感方面存在困难,引起交流不尽人意。BUD-E旨在弥合这一差距,供给更响应、更丰富上下文的对话。
自然且快速:BUD-E的特点
BUD-E不仅供给更自然的对话体验,还拥有令人印象深刻的响应时间。BUD-E的延迟时间在300至500毫秒之间,能够快速而无缝地与用户进行互动。该系统在消费设备上运行,使广大用户能够容易运用。LAION做为BUD-E研发背面的组织,设想将来语音助手能够处理多说话人的对话,包含中断、确认和思考停顿,进一步加强其功能。
开源和社区合作
LAION将BUD-E打导致一个开源项目,准许研发人员和科研人员为其发展做出贡献。日前运用的BUD-E背面的模型包含Nvidia的FastConformer Streaming STT语音转文本模型、Microsoft的Phi-2语言模型以及StyleTTS2文本转语音模型。然而,LAION计划扩展这些模型,并利用像Meta的Llama 2这般持有300亿参数的更大模型,以实现更低的延迟。有兴趣参与BUD-E研发的人能够加入LAION的Discord社区或经过电子邮件联系。
|