Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Динамичный карточный батлер с PVE и PVP-боями онлайн! Собери коллекцию карточных героев, построй свою боевую колоду и вступай в бой с другими игроками.

Cards out!

Карточные, Ролевые, Стратегии

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • AlexKud AlexKud 26 постов
  • StariiZoldatt StariiZoldatt 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Синтез речи

С этим тегом используют

Искусственный интеллект Нейронные сети Озвучка YouTube Warcraft Вертикальное видео Русская озвучка Все
80 постов сначала свежее
1
TECAMblE
TECAMblE
1 год назад

Озвучание сериала нейросетью Silero⁠⁠

Приветствую всех. Думаю все знают, что прогресс не стоит на месте, время идёт, все меняется. Несколько лет назад мы не могли представить, что с помощью нейросетей можно будет создавать картинки по любому запросу в высоком разрешении, делать дипфейки в видео, вести диалог с неким чатом "gpt" и качественно изменять, а также синтезировать голос. О последнем я и хочу сегодня рассказать. Однажды, я наткнулся на сообщество в телеграме под названием "silero". В нем можно было синтезировать голос из текста, ничего особенного вроде, ведь подобных сервисов много, которые используются в том числе в контакте и на ютуб каналах, всем известные голоса как "бот Максим" и "бот Лена". Но было одно отличие у Силеро, которое меня заинтересовало, а именно то, что выбор голосов был обширен, из разных игр и вселенных, например - Warcraft. Приобретя пробную подписку, чтобы снять ограничения на символы, я сделал пробный видео-прикол для друга на тему Матрица, так как голоса из официального русского дубляжа Морфеуса (Владимир Вихров), Тринити (Елена Соловьёва) и Нэо (Всеволод Кузнецов) уже были в данном боте. Было интересно, но я понимал, что все равно слышно, что голос не живого человека, где-то проговоры плохие, где-то интонации не те. В общем, сделал, посмеялся и забыл. Чуть позже, у силеро вышло обновление - добавили новые голоса и сделали первую версию ревойса(переозвучка). Попробовал переозвучку, она получилась очень сырая, больше слышно мой голос, чем голос персонажа, будто наши голоса просто соединили и все. Результат не удивил и я забыл про этот ревойс. Ещё чуть позже, у силеро вышло ещё одно обновление, в котором добавили голоса из спанч боба и улучшили качество ревойса. Записав голосовое сообщение чисто по приколу на ревойс, результат меня удивил. Те слова, которые я говорил своим голосом, произнёс голос Спанч боба, практически с теми же интонациями, с которыми сказал и я. А ещё тем временем у силеро и новость вышла, что всем, кто скинет им материалы для добавления в их бот новых голосов, получит пожизненную бесплатную подписку. Тогда мне и пришла мысль, а сможет ли бот озвучить целый фильм? Тем более в наше время, когда в Российские кинотеатры почти ничего не доходит. Сам раньше занимался озвучкой, со звуком работать умею, почему нет? В общем, отправил админам силеро множество чистых голосов (в соответствии с требованиями) для их бота из различных вселенных (из каких - спойлерить не буду, но уверен, предстоящее обновление будет бомба) я решился на эксперимент, который представляю сейчас вам. Вся работа была проделана одним человеком - мной. Сведение, озвучка, перевод. Ну, как мной? Ещё и нейросетями. Перевод, аудио дорожка, озвучка, это все различные нейросети. Я лишь все это озвучил своим бездарным голосом и смонтировал. То есть, поскольку, как я ранее сказал, я занимался озвучкой, у меня был студийный микрофон, с помощью которого я и записал все фразы из представленной серии сериала Асока, а Силеро изменило мой голос на те голоса, которые я выбрал. Трудно ли это? Честно, да, трудно. Все-таки нейросеть ещё не идеальна. Не до конца считывает интонации, громкость, крик, шёпот, может где-то проявляться картавость, шепелявость, не проговоры. Но лично меня уже даже такой результат поражает. А что дальше? Озвучивать, монтировать, переводить, теперь будет не студия, а один человек? А может будет голос оригинального актёра звучать на всех языках мира при локализациях? Возможно нейросети будут сами снимать фильмы всего-лишь по нашему описанию? Актёры озвучания больше не понадобятся? Это интересное подспорье, к тому же, к сожалению, актёры дубляжа не защищены законодательно никак, ведь данная ситуация не попадает под интеллектуальное право.

В общем, пишите свои мысли на данный счёт. Всё это, это благо, прогрес? А может это наоборот, несет исключительно негативные последствия и нарушает чьи-либо права? Лично я буду и дальше придумывать различные видео\аудио-приколы или же делать правильный перевод к различным видео. (возможны спойлеры, при просмотре видео-презентации сериала "Асока").
Ссылка на само видео, озвученное нейросетью - https://dzen.ru/video/watch/64ea1bbbca11056e26e837cb

Показать полностью
[моё] Озвучка Русская озвучка Будущее Асока Тано Star Wars Нейронные сети Изменения Спойлер Текст Искусственный интеллект Синтез речи
4
11
snakers4
snakers4
1 год назад
Искусственный интеллект

Теперь наш синтез на 22 языках с кириллицей и быстрее в 3-4 раза⁠⁠

Теперь наш синтез на 22 языках с кириллицей и быстрее в 3-4 раза Искусственный интеллект, Синтез речи

В этот раз мы сделали следующее:

- Ускорили все v4 модели в 3-4 раза;

- Существенно повысили качество синтеза в 8 kHz;

- Обновили и пересобрали нашу модель для русского языка;

- Обновили модель для 9 языков народов Индии с 17 голосами;

- Добавили единую модель для 22 языков с кириллическим алфавитом с 31 голосом;

- Обновили модели для языков народов СНГ: узбекского и украинского (татарский и калмыцкий были "поглощены" единой моделью);

⬆️ Хабр https://habr.com/ru/articles/754772/

🌟 GitHub https://github.com/snakers4/silero-models#text-to-speech

🎧 Попробовать https://t.me/silero_voice_bot

Показать полностью
[моё] Искусственный интеллект Синтез речи
3
snakers4
snakers4
1 год назад
Лига Геймеров

Орки из Warcraft 3 поют гимн Орды хором (со звуком)⁠⁠

Персонажи Warcraft 3 (Тралл, Гром и Кэрн) поют гимн Орды. Голоса сгенерированы с помощью бота для синтеза (@silero_voice_bot), текст основан на гимне СССР (1943—1956).

[моё] Искусственный интеллект Warcraft Гимн Синтез речи Со звуком Видео
1
1366
snakers4
snakers4
2 года назад
Лига Юристов

Реально ли привлечь РЖД за нарушение лицензии модели синтеза из репозитория silero-models?⁠⁠

Реально ли привлечь РЖД за нарушение лицензии модели синтеза из репозитория silero-models? Искусственный интеллект, РЖД, Синтез речи, Железная дорога, Лицензия, Видео, Длиннопост, Без рейтинга, Нарушение прав

Увидел новость про виртуального помощника "Валеру", которого только что презентовала РЖД. Судя по голосу, взят наш голос aidar из репозитория silero-models … опубликованный под некоммерческой лицензией CC BY-NC-SA.

Сравните голос тут:

И тут (кота вставил, потому что Пикабу не умеет в аудио):

Очевидно, что когда мы выкладывали модель, мы прекрасно понимали, что у этого могут быть последствия. Нам конечно льстит, что РЖД сделала свой выбор в пользу нашей модели, но это не отменяет факта нарушения лицензии.

Обычно компании обращаются за кастомизацией или доработками. Или просто покупают лицензию на коммерческую версию ПО. Но в данной ситуации видимо сотрудникам РЖД (или подрядчикам) было просто наплевать на лицензию … или они ее просто не читали (все мы догадываемся как работают бизнес процессы в таких компаниях).

Очередной вопрос к комьюнити, стоит ли инвестировать средства в судебные тяжбы в этой конкретной ситуации, или оставить ситуацию на уровне публичного обсуждения и постараться привлечь к нему максимальное количество внимания? Может быть вы уже оказывались в подобной ситуации - пожалуйста поделитесь своим опытом.

В прошлый в похожей ситуации раз мнения разошлись (и банк сразу прибежал в комментарии мол ой, мы уже не используем, вы нас не так поняли): часть комьюнити топила за то, что тогдашняя лицензия GNU AGPL по сути не защищает такие релизы от коммерческого использования, часть, что банк неправ. Но по этой причине лицензию моделей поменяли на CC BY-NC-SA и вроде как сейчас сомнений уже не должно быть.

Поднимите, пожалуйста, в топ.

Показать полностью 1
[моё] Искусственный интеллект РЖД Синтез речи Железная дорога Лицензия Видео Длиннопост Без рейтинга Нарушение прав
89
16
snakers4
snakers4
2 года назад
Лига Геймеров

Орки. Зелёные. Злые. Твои⁠⁠

В прошлый раз писал пост про бота для озвучки голосами орков из Warcraft. Вроде зашло. Хотел рассказать, что нового появилось.

Добавилась переозвучка аудио и кружков. Фича экспериментальная. "Обычные" голоса работают лучше фановых игровых, всё еще впереди. Вот более-менее реалистичная презентация (понятно, что решает микрофон и похожесть голоса на целевой):

В боте можно контролировать темп и тон речи. При замедлении некоторые персонажи начинают звучать как бухие, например (панде это особенно хорошо подходит).

В боте теперь есть огромный выбор голосов из разных игр, от олдскульных до зумерских:

Орки. Зелёные. Злые. Твои Искусственный интеллект, Синтез речи, Warcraft, Озвучка, Нейронные сети, Видео, Длиннопост

Также наросло много "секретных" и фановых фич:

- Инлайн режим бота (/inline), чтобы использовать его в чатах (знаю, не работает с кружками, ограничение самой телеги);

- Озвучка гифок (/gif) - по сути наложение аудио на гифку - открывает простор для творчества;

- Упомянутая выше возможность менять темп и тон речи (/prosody);

- Возможность озвучки целых диалогов сразу (/speak) и смены голоса в командной строке (/speaker).

Знаю, что в последнее время тут не любят ссылки на телегу и очень агрессивно к этому относятся. Но бот изначально был в телеге.

Чтобы сделать свою озвучку нужно зайти в бота, выбрать персонажа и ввести текст. И все, озвучка готова!

Показать полностью 1 1
[моё] Искусственный интеллект Синтез речи Warcraft Озвучка Нейронные сети Видео Длиннопост
3
9
Alexander.Wolf
Alexander.Wolf
2 года назад
Лига Разработчиков Видеоигр
Серия Find Exit process

Синтез речи в Find Exit⁠⁠

Показываю синтез речи, рассказываю о проблемах распознования речи с которыми столкнулся при использовании Whisper от OpenAI и раскрываю немного деталей по игре.

[моё] Unity Инди Gamedev Разработка Синтез речи Распознавание Искусственный интеллект ChatGPT Видео YouTube
0
16
fakir22
fakir22
2 года назад
Искусственный интеллект

Аватар⁠⁠

Наткнулся на интересный сервис, котрый создает вот такие персонажи. Кто-то знает, где есть лучше?

[моё] Искусственный интеллект Синтез речи Нейронные сети Видео
6
671
Silverneverdie
Silverneverdie
2 года назад
Антимошенник

Ответ DasKoldir в «Телефонные мошенники»⁠⁠2

Отвечу постом, может действительно поймут люди.
Когда звонят с незнакомого номера, не взять трубку не могу, клиенты могут звонить и тут никак нельзя отмораживаться, молчать тоже не вариант, по этому всегда говорю томным голосом чувака из видео, где звонят коллекторы "ААлло". Никаких да или нет. Минимум текста. Если понимаю, что реклама, боты, мошенники (нужное подчеркнуть) то просто кладу трубку.
А теперь расскажу свою историю, которая произошла со мною пару лет назад.
Я взял кредит наличкой в газпромбанке. Никому об этом кредите не говорил, никто не знал, бабки просто в банкомате снял.
Через некоторое время мне звонят из службы безопасности газпромбанка и говорят, что на меня оформлен кредит. Я понимаю, что дичь, говорю я в метро, ничего не слышно, перезвоните. Кладу трубку и сам звоню в поддержку ГПб. В поддержке само собою мне говорят, что никто мне не звонил, никаких кредитов не оформляли новых и это мошенники. Ну тут я и решил с ними, с мошенниками, поиграть, как в тех веселых рассказах.
Короче полтора часа я с ним на проводе висел, выяснил все, что они обо мне знают, а знают они номер карты, полностью все паспортные данные и плюсом то, что у меня кредит уже есть в газпромбанке. Тут я сразу сделал вывод, кто слил мои данные, само собою сами работники банка.
Короче все было как в тех самых приколах со словами "фиксирую" и "главное управление центрального банка". Чуваки пытались чтобы я с карты перевел им деньги, поскольку во время звонка интернет отваливается, им пришлось мне перезванивать 11 раз после каждого типа правильного шага, что надо сделать в интернет банкинге. Когда я приехал домой, я просто сказал, ладно ребята я все понял, вы мошенники идите на хуй.
Думаете на этом все? А вот хуй. Эти пидоры позвонили в банк и заблокировали мне зарплатную карту, то есть достаточно только номер карты знать чтобы ее заблочить, а еще вызвали ментов типа у меня дома крики и поножовщина.
Заебался я карту восстанавливать ибо отделений ГПб в Зеленограде нет, а в Химки ехать надо отдельную субботу выделять.
Когда мне позвонил на следующий день дознаватель и сказал, что хочет посмотреть мой телефончик на предмет вчерашнего ложного вызова по поножовщине, я сразу послал нахуй и отправил в петушиный угол на бутылку отечественного правосудия присесть пару раз.
Короче много букв но блять настроение эти гандоны мне изрядно испортили.

Показать полностью
[моё] Телефонные мошенники Синтез речи Спам Мат Ответ на пост Текст
72
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии