Сообщество - Видеомонтаж

Видеомонтаж

962 поста 5 648 подписчиков

Популярные теги в сообществе:

20

MMAudio: Генерация звука для видео с помощью ИИ

Всем привет! Исследователи из Университета Иллинойса и Sony AI представили интересный проект MMAudio - нейросеть для создания звукового сопровождения к видео. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист, и сегодня я хочу рассказать об этой технологии подробнее и поделиться нашей портативной версией. Главная особенность системы в том, что она может генерировать звуки не только по текстовому описанию, но и на основе изображения или видео.

Как это работает

MMAudio: Генерация звука для видео с помощью ИИ Искусственный интеллект, Нейронные сети, Инновации, Нейроозвучка, Технологии, Звук, Видеомонтаж, Звуковые нейросети, Озвучка, Обработка звука, Видео, Длиннопост

В основе MMAudio лежит идея мультимодального обучения - система одновременно анализирует видео, звук и текстовые описания. Для этого используются два параллельных потока обработки видео: CLIP для понимания общего контекста (8 кадров/сек) и Synchformer для точной синхронизации (24 кадра/сек).

Такой подход позволяет системе лучше понимать происходящее в видео и создавать более подходящее звуковое сопровождение. Например, увидев падающие капли дождя, MMAudio не просто генерирует шум дождя, а пытается воспроизвести характерный звук капель, попадающих на разные поверхности.

MMAudio: Генерация звука для видео с помощью ИИ Искусственный интеллект, Нейронные сети, Инновации, Нейроозвучка, Технологии, Звук, Видеомонтаж, Звуковые нейросети, Озвучка, Обработка звука, Видео, Длиннопост

Важно отметить, что система использует технологию Flow Matching вместо традиционной диффузии, что позволяет достичь впечатляющей скорости работы - генерация 8-секундного клипа занимает всего несколько секунд.

Системные требования

Для работы с MMAudio необходимо:

  • NVIDIA GPU с 8+ ГБ видеопамяти

  • Windows 10/11 64-bit

  • 16 ГБ оперативной памяти

  • 12 ГБ свободного места на диске

Возможности MMAudio

Система отлично справляется с базовым озвучиванием видео. В первую очередь это звуки повседневной жизни - шаги, движение предметов, звуки природы. Вот несколько примеров:

Динамические звуки: система точно улавливает моменты движения и синхронизирует звуки шагов, прыжков, перемещения объектов. Точность синхронизации достигает 25 миллисекунд.

Природные эффекты: реалистично воссоздаёт звуки дождя, ветра, текущей воды. Особенно впечатляет работа с дождём - система различает как он звучит на разных поверхностях.

Спортивные события: безошибочно определяет моменты ударов по мячу, прыжков, создает реалистичную акустическую атмосферу стадиона или спортзала.

Звуковые ландшафты: может создавать атмосферные звуки для различных локаций - леса, города, пляжа и т.д.

Текущие ограничения

К сожалению, не все задачи система решает одинаково хорошо:

Проблемы с речью: генерируемая человеческая речь пока неразборчива. Система может создать речеподобные звуки, но понять их невозможно.

Сложная музыка: музыкальное сопровождение ограничивается простыми эффектами. Полноценные композиции пока недоступны.

Временные рамки: система работает с клипами длительностью 8-10 секунд. Более длинные видео приходится обрабатывать по частям.

Необычные звуки: могут возникать проблемы со звуками, которых не было в обучающей выборке.

Кому это пригодится

Создателям контента:
MMAudio станет незаменимым помощником для ютуберов и стримеров. С её помощью можно быстро озвучить короткий ролик или добавить звуковые эффекты в прямом эфире. Аниматоры оценят возможность быстрого прототипирования звукового сопровождения.

Разработчикам игр:
Технология отлично подходит для создания тестовых звуковых эффектов и процедурной генерации звука. Это особенно полезно на этапе прототипирования, когда нужно быстро проверить разные звуковые концепции.

Видеомонтажерам:
MMAudio поможет в создании черновых версий звуковых дорожек. Система быстро сгенерирует базовое звуковое сопровождение, которое потом можно доработать вручную.

3D-аниматорам:
Идеально подходит для быстрого озвучивания превизуализаций и тестовых рендеров.

Как попробовать

Попробовать MMAudio можно несколькими способами:

Онлайн-демо

  • Hugging Face - быстрый способ оценить возможности

  • Google Colab - для экспериментов без установки

  • Replicate - для интеграции через API

Для разработчиков
Исходный код доступен на GitHub

Наша портативная версия

Мы с каналом Нейро-Софт подготовили модифицированную русифицированную портативную сборку MMAudio, в которой:

  • Русский интерфейс

  • Упрощенная установка в 1 клик которая сама все скачает и поставит

  • Возможность сохранять аудио отдельно от видео

  • Генерация аудио из изображения

  • Оптимизация для работы на доступных GPU

Всё необходимое уже включено в дистрибутив, просто распакуйте и запускайте. Никаких дополнительных настроек не требуется. Забирайте тут.

Мой опыт

Я активно использую MMAudio для озвучки видео, сгенерированных в различных img2video сервисах. Результаты действительно впечатляют - система отлично справляется с базовыми звуками и создает довольно реалистичную атмосферу. Особенно хорошо получается озвучка природных сцен и различных действий вроде ходьбы или спортивных движений.

Конечно, технология ещё развивается, и иногда встречаются забавные артефакты в генерации, но для быстрого создания базового звукового сопровождения - это отличный инструмент.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Ну и на канал с репаками тоже подпишетесь, чтобы не пропустить ничего полезного. Всех обнял. Удачных генераций!

Показать полностью 2 10
6

Нейронка сгенерит звук для видео

MMAudio — крутая ИИ-тулза, поможет с озвучкой видео: от звуков природы и окружения до музыки и спецэффектов 🔊

Всё просто:

1️⃣ Грузим видео

2️⃣ Пишем промпт

3️⃣ Жмём «Submit»

Готово!

Взгляните на результаты, получается довольно круто:

Мегаполезно для монтажёров, блогеров, разработчиков игр и креаторов, чтобы быстро получить нужный звук

Юзаем годноту здесь ⬅️

Источник - Нейро-Звук🔊

Показать полностью 5
11

С наступающим!

Накатывает....
Я тож накачу.

Как ИИ Adobe Premiere агитировал да украинского политика

Завтра на платформе выходит сериал, на котором я работаю с марта ассистентом режиссёра монтажа ✂️🎞

Звук и цветокоррекция уже сделаны, и остается только создание для серий субтитров.

Лет 6 назад для одного фильма я набирала их вручную. Но сейчас этот процесс, к счастью, автоматизирован 😎

Можно закинуть видео в премьер, нажать пару кнопочек и получить более-менее сносный вариант.

Распознавание не идеальное, но всё равно это намного проще и быстрее, чем создавать субтитры с нуля.

И вот сижу, проверяю третью серию, и в середине открывающей сцены вместо «Прости, мышонок» вижу «За Тимошенко»🇺🇦.

Как ИИ Adobe Premiere агитировал да украинского политика Монтаж, Субтитры, Премьер, Premiere, Искусственный интеллект

Было огромное искушение так и оставить, чтобы коллеги из Кинопоиска тоже поржали. Но побоялась, что не так поймут. Решила креатив ИИ всё-таки убрать, поделившись только с продюсером 😂

Как ИИ Adobe Premiere агитировал да украинского политика Монтаж, Субтитры, Премьер, Premiere, Искусственный интеллект

А у вас были забавные ситуации, связанные с искусственным интеллектом? Напишите в комментариях 😊

Показать полностью 2
5

Затерянный карбон 9. Монголия

5

13 видео в after effects

Сделал ещё одно видео на скорую руку, по заказу жены для своего класса потратил пару часов, не мог вспомнить кнопки) немножко укоротил музыку, все делал в афтер, пнг исходник делал в фотошоп, через плагин element или как его, в общем вот, что вышло:

Ссылок на уроки нет, так как всё делал сам))

15

Зацените, что нашел!

Короче, есть сервис забугорный, где можно найти отрезок из фильма по цитате. Условно, вбиваешь "i'll be back" и находишь всем известный отрезок. Для монтажа иногда прям нужная штука, но английские цитаты вставлять в русскоязычные видео можно только в том случае, если они реально уже мемные, как вот с терминатором.

Зацените, что нашел! YouTube, Youtube Shorts, RUTUBE, Видеомейкер, Видеомонтаж, Монтаж, Блогеры

И вот буквально только что наткнулся на русскоязычную версию сервиса поиска по цитатам. Не встречал его раньше, значит явно новый какой-то. Хочу чтобы проект жил и развивался, поэтому делюсь ссылкой. Можете считать, что это рекламный пост, такое и порекламировать не жалко.


Делюсь обеими ссылками:
Зарубежный сервис - https://www.playphrase.me/
Русский сервис - https://rumbi.ru/

Показать полностью
3

Монголия

Экспедиция в Монголию. Октябрь 2024. Часть первая - лирическая. https://rutube.ru/video/private/570064a0ebe22a052def8bfcac12...

Отличная работа, все прочитано!