Google wzbogaca platformę Vertex AI o zaawansowane modele głosowe Chirp 3

Google wprowadza modele mowy Chirp 3 do swojej platformy deweloperskiej Vertex AI, dołączając do wyścigu technologicznego o dominację w obszarze sztucznej inteligencji głosowej.
W przyszłym tygodniu Google wprowadzi Chirp 3, swoje nowe modele głosowe, do platformy Vertex AI. Obejmują one osiem nowych głosów w 31 językach. Platforma ma umożliwić tworzenie asystentów głosowych, audiobooków, wirtualnych agentów obsługi klienta oraz lektorów dla materiałów wideo. Wprowadzenie Chirp 3 następuje w momencie, gdy inne firmy, takie jak np. Sesame, również rozwijają swoje technologie AI związane z głosem (Maya, o której pisaliśmy tutaj). Chirp 3 dołączy do innych flagowych modeli Google, takich jak Gemini i Imagen.
Nie wiadomo jeszcze, czy głosy generowane przez Chirp 3 będą równie „realistyczne” jak konkurencyjne rozwiązania, szczególnie te oferowane przez Sesame. Jednak jak podkreślił Demis Hassabis, CEO DeepMind, rozwój AI to maraton, a nie sprint. Google wprowadziło Vertex AI jeszcze w 2021 roku jako platformę dla deweloperów do budowania usług uczenia maszynowego w chmurze, na długo przed eksplozją zainteresowania sztuczną inteligencją.

Oprócz modeli Chirp i Maya, istnieją jeszcze inne popularne modele głosowe:
- ElevenLabs: Znany z realistycznej syntezy mowy i klonowania głosu w 32 językach.
- Lovo.ai: Generuje głos w 100 językach, idealny do treści marketingowych i automatyzacji.
- Play.ht: Oferuje realistyczną mowę w ponad 100 językach, z intuicyjnym interfejsem użytkownika.
- Murf.ai: Doskonały do tworzenia voiceover-ów, z funkcjami modulacji i edycji audio-wideo.
- Narakeet: Obsługuje 100 języków i 700 podkładów głosowych, idealny do tworzenia treści wielojęzycznych.