В Gemini появилась функция создания музыки с помощью искусственного интеллекта
Новая функция, работающая на базе модели Lyria 3, позволяет пользователям всего за несколько секунд создавать 30-секундные треки на основе текста, фото или видео.
Pinkod протестировал эту возможность на узбекском языке. В результате выяснилось, что искусственный интеллект способен создавать песни на этом языке практически без ошибок и без заметного акцента.

Google добавил в приложение Gemini функцию создания музыки на базе ИИ. Эта возможность работает на основе новейшей генеративной музыкальной модели от Google DeepMind — Lyria 3 — и на данный момент внедряется в бета-режиме.
Пользователи могут создавать 30-секундные треки, описывая идею или загружая фото/видео.
Например, промпт вида: «Песня в стиле поп с элементами социальной критики о человеке, чьи личные данные утекли в даркнет, и который на вопрос "где безопасность?" получил ироничный ответ "если нужно — купи и докажи"» — за короткое время превращается в полноценную композицию.
Треки можно послушать по следующим ссылка:
Gemini также может черпать широкое творческое вдохновение из загруженного контента и в зависимости от запроса создавать текст или инструментальную музыку.
Возможности Lyria 3 и режимы создания
Lyria 3 представляет три основных новшества по сравнению с предыдущими версиями:
- Автоматическое создание текста песни (lyrics) на основе промпта.
- Более широкий контроль над жанром, настроением, темпом и вокальным стилем.
- Более реалистичный и музыкально сложный результат.
Музыку можно создавать несколькими способами:
Text to track (Из текста в трек): Пользователь должен описать жанр, настроение, воспоминание или внутреннюю шутку. После этого Gemini создает уникальный трек.
Трек на основе фото или видео: Можно загрузить изображение или видео и попросить создать музыку и текст, соответствующие теме. Это могут быть кадры, снятые на улице, дома или в любом другом месте.
Каждый трек сопровождается специальной обложкой, созданной Nano Banana; его можно скачать или поделиться им напрямую через ссылку.
Учитывая, что на данный момент функция находится на стадии бета-тестирования, могут применяться определенные ограничения при создании музыки на политические, религиозные или другие чувствительные темы.
Также одним из заслуживающих внимания аспектов является то, что Gemini создает музыку на узбекском языке с естественным произношением и без заметного акцента.









