73
AI资讯

谷歌将其语音模型 Chirp 3 添加到其 Vertex AI 平台


生成式人工智能的大部分焦点都集中在用于生成文本、图像等的基于文本的界面上。下一波浪潮似乎是语音,而且它正在迅速涌现。在最新进展中,谷歌今天宣布将从下周开始将 Chirp 3(语音转文本和高清文本转语音模型)添加到其 Vertex AI 开发平台中。


上周,谷歌悄然宣布Chirp 3 将推出 31 种语言的 8 种新语音。该平台的用例包括构建语音助手、创建有声读物以及开发支持代理和视频配音。这一消息是在谷歌伦敦 DeepMind 办公室的一次活动中宣布的。


与此同时,其他公司也在语音 AI 领域取得了长足进步。上周,Sesame 宣布推出一种模型,开发人员可以在其技术的基础上构建自己的定制应用和服务。Sesame 是病毒式传播、声音逼真的“Maya”和“Miles”AI 应用程序背后的初创公司。


值得注意的是,Chirp 3 将受到使用限制,以控制滥用行为。“我们正在与我们的安全团队一起解决其中一些问题,”Google Cloud 首席执行官 Thomas Kurian 在今天的新闻发布会上表示。


ElevenLabs 是筹集数亿美元资金以拓展 AI 语音服务业务的大型初创公司之一。


这一消息将使 Chirp 3与其正在测试的旗舰 LLM Gemini 的新版本、图像生成模型Imagen和昂贵的Veo 2视频生成工具进入同一个稳定版本。 


谷歌发布的 Chirp 3 是否能像其他一些创造“人类”声音的人工智能成果一样“逼真”仍有待确认(Sesame 的工作尤其突出)。但正如 DeepMind 首席执行官 Demis Hassabis 所强调的那样,这仍然是一场马拉松,而不是短跑。 


“在短期内……认为人工智能是未来几年解决所有问题的灵丹妙药的想法,我目前还不认为会成为现实。我认为我们距离 AGI 之类的事情发生还有好几年的时间,”他说。“它将在未来十年内改变一切……所以从中长期来看。这是时间中最有趣的时刻之一。”


谷歌早在 2021 年就推出了 Vertex AI,作为开发者在云端构建机器学习服务的平台。当然,这远在 OpenAI 的 GPT 服务推出之前,人们对人工智能(尤其是生成式人工智能)的兴趣就已激增。 


从那时起,该公司一直倾向于使用 Vertex AI,部分原因是它正在追赶微软和亚马逊等其他公司——它们也在为开发人员构建生成式 AI 工具。除了在 Gemini 之上构建生成式 AI 之外,开发人员还可以使用 Vertex AI 对数据进行分类、训练模型和设置生产模型。它是否会将其封闭式模型扩展到谷歌自己创建的模型之外,这将很有趣。


谷歌多年来一直在打造“Chirp”语音服务,最初是用这个名字作为与亚马逊 Alexa 服务竞争的代号。 

79379
文章来源于网络,如有侵权请联系本站删除
二手好课
更多>>
年卡|有意转让
素描漫画
¥1500
次卡|北京【转让中关村柒音音乐课程】
音乐课
¥2000
年卡|南京韵琴邦成人钢琴零基础课程转售
钢琴课
¥2200
次卡|深圳海橙星琴行钢琴课程转让
钢琴课
¥2400
次卡|北京转让青桔音乐的课程!
钢琴课
¥2700
次卡|哈尔滨雅马哈钢琴课程
钢琴课
¥2700
次卡|贵阳雅马哈成人一对流行钢琴课
钢琴课
¥3000
次卡|上海7折出钢琴私教一对一课程
钢琴课
¥3400
年卡|常州音乐课程—吉他、钢琴、架子鼓、小提琴
音乐课
¥3500
年卡|深圳童话音乐课程转让
钢琴课
¥3900