DeepMind, лабораторията за изкуствен интелект на Google, представи V2A (Video-to-Audio), нова впечатляваща технология, която може автоматично да генерира реалистични звуци, включително музика, звукови ефекти и диалози за видеоклипове без звук.

Моделите за генериране на видео се развиват с невероятни темпове, но повечето от тях създават видеоклипове без звук. Именно това е и проблемът, който учените от DeepMind искат да решат.

V2A може да генерира аудио за всякакъв вид видео, от традиционни видеоматериали като исторически кадри или неми филми до такива, генерирани от изкуствен интелект. Технологията може да се използва в комбинация с видео генератори като Veo на DeepMind или тези от конкурентите като Sora, KLING, Dream Machine или Gen 3 за добавяне на драматична музика, реалистични звукови ефекти или диалози.

*Примерите са генерирани с Veo, моделът за генериране на видео на DeepMind, а аудиото от V2A.

Важно е да отбележим, че технологията все още не е публично достъпна. От DeepMind планират да съберат обратна връзка от „водещи артисти и филмови дейци, за да гарантират положителното й въздействие върху творческата общност“. Освен това моделът ще бъде подложен на строги тестове за безопасност, за да се предотвратят евентуални злоупотреби, посочват от компанията.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: