A maior parte do foco na IA generativa tem sido nas interfaces baseadas em texto usadas para gerar texto, imagens e muito mais. A próxima onda parece ser voz e está rolando rapidamente. No desenvolvimento mais recente, o Google anunciou hoje que estaria adicionando o Chirp 3-seus modelos de fala para texto e HD Text-to-falance-à sua plataforma de desenvolvimento de AI da Vértice a partir da próxima semana.
Semana passada, O Google anunciou silenciosamente Esse chirp 3 estaria lançando 8 novas vozes para 31 idiomas. Os casos de uso da plataforma incluem a criação de assistentes de voz, a criação de audiolivros, o desenvolvimento de agentes de suporte e as dublagens para vídeos. A notícia foi anunciada em um evento nos escritórios DeepMind do Google em Londres.
Seus esforços estão chegando ao mesmo tempo em que outros também estão avançando com a voz da AI. Na semana passada, o gergelim – a startup por trás dos aplicativos virais e muito realistas de “Maya” e “Miles” AI – anunciou o lançamento de seu modelo para os desenvolvedores construirem seus próprios aplicativos e serviços personalizados em cima de sua tecnologia.
Notavelmente, haverá restrições de uso em torno do Chirp 3 para tentar acompanhar o uso indevido. “Estamos apenas trabalhando com algumas dessas coisas com nossa equipe de segurança”, disse Thomas Kurian, CEO do Google Cloud, em um evento de notícias hoje.
Elevenlabs está entre as principais startups que aumentaram centenas de milhões em financiamento Para expandir seu trabalho nos serviços de voz da IA.
A notícia trará chirp 3 para o mesmo estável que Versões mais recentes de seu principal LLM, Gemini, que estão sendo testados, bem como seu modelo de geração de imagem Imagen e é caro Veo 2 Ferramenta de geração de vídeo.
Resta confirmar se o que o Google está lançando com o Chirp 3 será tão “realista” quanto alguns dos outros esforços da IA para criar vozes “humanas” (o trabalho da Vila se destaca em particular). Mas, como enfatizou Demis Hassabis, CEO da Deepmind, isso continua sendo uma maratona, não um sprint.
“No curto prazo … essa ideia que [AI is] Uma bala de prata para tudo nos próximos dois anos, ainda não vejo isso acontecendo. Acho que ainda estamos a alguns anos de algo como AGI acontecendo ”, disse ele. “Isso vai mudar as coisas … na próxima década, então o médio a longo prazo. É um daqueles momentos interessantes no tempo. ”
Google lançou o vértice ai Volto em 2021 Como uma plataforma para os desenvolvedores criarem serviços de aprendizado de máquina na nuvem. Isso foi, é claro, bem antes da explosão de interesse na IA e especificamente IA generativa, que veio com o lançamento dos serviços GPT da OpenAI.
Desde então, a empresa está se inclinando para o vértice ai em parte Reproduza o atraso para outras empresas Como a Microsoft e a Amazon – eles também estão construindo ferramentas generativas de IA para desenvolvedores. Além de criar IA generativa no topo de Gêmeos, os desenvolvedores podem usar a IA do vértice para classificar dados, treinar modelos e configurar modelos para produção. Será interessante se ele se move para expandir seu jardim murado para modelos além dos criados pelo próprio Google.
O Google está construindo serviços de voz “chirp” há anos, voltando a usar o nome como um nome de código por seus esforços iniciais para competir contra o serviço Alexa da Amazon.