Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр

Копай Дыру в России

Симуляторы, Приключения, Экшены

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • alekseyJHL alekseyJHL 6 постов
  • XpyMy XpyMy 1 пост
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Команда Пикабу Награды Контакты О проекте Зал славы
Промокоды Скидки Работа Курсы Блоги
Купоны Biggeek Купоны AliExpress Купоны М.Видео Купоны YandexTravel Купоны Lamoda
Мобильное приложение

Text-to-speech

С этим тегом используют

Warhammer 40k Искусственный интеллект Нейронные сети Все
34 поста сначала свежее
1
wladradchenko
1 год назад

Как оживить цифровое искусство? Создаём дипфейк и синтезируем речь с помощью Wunjo AI⁠⁠

Привет! Уже пятница, а значит ближайшие выходные и можно попробовать что-то новое.

В посте речь пойдет о дипфейках, а не о дикпиках. Я бы хотел рассказать о своем open-source проекте Wunjo AI с открытым исходным кодом, который позволит вам из фото или нейро-искусственно сгенерированных изображения создавать дипфейк видео и синтезировать речь из текста, без каких либо ограничений контента, длительности, водяных знаков, при том, что все это бесплатно и на русском.

  • Вы сможете синтезировать речь из текста на русском и английском, либо мультиязыком в формате диалогов. Доступно 4 голоса на данный момент. В планах добавить мульти перевод и режим репа в обновлениях.

  • Создавать дипфейк видео, заставляя лицо на человека, либо аниме персонажа на картинке говорить или анимируя губы человека на видео под ваше аудио. В будущем появится замена лица на видео по фото, изменение эмоций лица на видео (радость, грусть, апатия, режим картошки) и изменение видео по текстовому запросу! Как будет выглядить дипфейк в обновлениях, я выкладываю в Shorts.

  • Расширение приложения. Уже сейчас вы можете обучать модель на своем голосе, голоса соседа или актера, вам понадобится только датасет. Как обучить я снял видео. Либо подключить ChatGTP для создания диалогов, и генерации изображений через Dalle-2.

Официальный сайт приложения. Всем спасибо, всем пока, до новых встреч!

Показать полностью 1
[моё] Deepfake Видеомонтаж Python Open Source Text-to-speech Лицо Нейронные сети Искусственный интеллект Искусство ChatGPT Видео YouTube
1
Neurosonya
Neurosonya
1 год назад
Серия Полезность

Создание синтезированного голоса нейросетью. Обзор и сравнение сервисов для озвучки NaturalReader, Еlevenlabs и Resemble⁠⁠

Искусственный интеллект для озвучки текста позволяет создавать подкасты, озвучивать героев игр и фильмов, создавать дубляж и редактировать аудиофайлы. Если вы по какой-то причине не хотите сами озвучивать видео, эти сервисы очень выручат. С воссозданным голосом можно озвучить текст, выбрать язык, на котором он будет воспроизведён, подобрать эмоции для голоса и скорость воспроизведения отдельных слов и другие параметры. Также синтезированный нейросетью голос можно привязать к телефонии для ответов на звонки клиентов или другим облачным сервисам по API.

Сервисы, которые я рассмотрела могут спокойно озвучивать книги - можно настроить озвучку, неотличимую от человеческой. А Еlevenlabs и Resemble могут клонировать голос знаменитости или ваш голос, так что можно сделать озвучку вашим голосом без вашего участия, что очень удобно.  Но обо всем по порядку.

NaturalReader

NaturalReader

Из русской озвучки есть только Максим и Татьяна, скачать в  mp3 можно только по подписке Plus за 20 $ в месяц. Как настроить ударение, я так и не поняла

Крутой инструмент для тех, у кого англоязычный контент. Голоса Plus обеспечивают плавное и естественное звучание текста в речь, которое соответствует шаблонам и интонациям человеческого голоса. Тогда можно подобрать даже интонации от веселого тона повествования до тревожного, правда не в русской озвучке. Отлично подойдет для озвучки книг.

подходит больше для английской озвучки, для русского языка подписка Plus не целесообразна

Еlevenlabs

Еlevenlabs

Очень крутой инструмент! Но опять-таки нет русского языка. Скачивать голос можно бесплатно до 10 000 знаков в месяц.

Есть расширенные настройки - можно выбрать возраст голоса, акцент и степень интенсивности акцента.

Так же есть библиотека голосов, сгенерированных другими пользователями. Их можно использовать и скачивать. Попадаются и голоса знаменитостей вроде Тома Хидлстона.

Но и это еще не главное! За 5 $/мес можно создать 10 голосов - достаточно просто загрузить голос в аудиоформате (более 1 минуты) без посторонних шумов! И можно сгенерировать озвучку голосом знакомого или знаменитости  

Но и это еще не все! В июле открывается доступ в Voice Cloning - где можно создать идентичную ИИ-версию вашего голоса.

крутой профессиональный инструмент

доступная цена

хорошие бесплатные возможности

маркетплейс с голосами

нет русского языка

Одним из возможных применений ElevenLabs является создание синтезированных голосовых помощников для различных устройств и приложений. Например, вы можете использовать эту технологию для создания голосового помощника для своего мобильного приложения или устройства умного дома.

Также ElevenLabs может быть полезна в музыкальной индустрии, например, для создания синтезированных голосовых эффектов или имитации голосов знаменитых певцов или актеров.

В целом, ElevenLabs представляет собой мощный инструмент для создания реалистичных голосовых имитаций на основе коротких отрезков аудио.

Resemble

Resemble

Бесплатно дается 300 секунд.

Функция Clone my voice на бесплатном пробном периоде

С Resemble маркетологи, контент-менеджеры, специалисты по рекламе и SMM могут создавать аудиролики, озвученные нейросетью, но звучащие как люди.

Нейросеть поддерживает 62 языка в том числе и русский, но в платной версии. Для создания шаблона персонажа озвучки нужно загрузить образец голоса или прочитать отрывок текста, если хотите использовать свой голос. Нейросеть проанализирует образец и воссоздаст синтезированный голос, похожий на оригинальный.

управление эмоциями при создании записи

перевод голоса на 62 доступных языка

маркетплейс с голосами

есть русский язык в платной версии

в пробном периоде можно бесплатно клонировать свой голос

цена 0,006 $ за секунду

Предварительные итоги:

Я намеренно не включила в итоги NaturalReader - он дорогой и все функции есть в Resemble и Еlevenlabs. Их и сравним.

Сравнение Resemble и Еlevenlabs

У обоих сервисов есть маркетплейсы, где можно скачать уже готовые голоса и бесплатно их использовать. Оба профессиональные инструменты и умеют клонировать голоса. В клонировании голосов лучшим считается Еlevenlabs, но в Resemble можно клонировать свой голос бесплатно, а в Еlevenlabs функция Voice Cloning будет доступна в июле платно. В Resemble в платной версии есть русский язык. Кроме того, в Resemble можно бесплатно поменять интонацию в тексте. А в Еlevenlabs больше выбора акцентов голосов, зато в Resemble есть озвучка шепотом). Кроме того, в Resemble есть возможность локализации языка - можно выбрать голос на одном языке и этот же голос перевести на другой язык.

Итог:

Одним словом, в Resemble больше бесплатных возможностей для старта, а Еlevenlabs лучше клонирует голоса знаменитостей и более доступен по цене.

Если вам хватит функционала попроще, для озвучки вполне подойдет Cybervoice за 100 рублей в месяц, о нем здесь или сервис Speechki, как им бесплатно озвучить я рассказывала здесь

Хотите узнавать первыми о полезных сервисах на ии для работы, учебы и упрощения жизни? Подпишитесь на мой тг НейроProfit , там я рассказываю, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 🤗

Показать полностью
[моё] Искусственный интеллект Полезное Нейронные сети Озвучка Голос Сервис Технологии Tts Text-to-speech Обзор Сравнение Будущее Видео YouTube Длиннопост
0
Neurosonya
Neurosonya
1 год назад
Серия Полезность

Audioread: Текст в Аудио - Удобно и Доступно на Всех Устройствах⁠⁠

Любите слушать больше, чем читать? Audioread превращает любой текстовый документ в аудио. Сделайте из статей, PDF-файлов, электронных писем подкасты и слушайте их во время занятий спортом, поездок на работу или уборки.

Конвертировать можно на любом устройстве — через браузер, iPhone или Android. Бесплатная пробная версия 2 недели, так что удобство прослушивания вместо чтения

Полезное Искусственный интеллект Нейронные сети Аудиокниги Text-to-speech Видео Без звука
4
61
lidoff.s
lidoff.s
1 год назад

Ответ на пост «Преобразуем русскоязычный текст в речь при помощи Silero TTS»⁠⁠1

Ответ на пост «Преобразуем русскоязычный текст в речь при помощи Silero TTS» Нейронные сети, Text-to-speech, Ответ на пост

Google придумал когда надо наоборот.

открываем Google Docs - инструменты - голосовой ввод.

Справка по инструменту - https://support.google.com/docs/answer/4492226?hl=ru

[моё] Нейронные сети Text-to-speech Ответ на пост
6
527
neurogenerated
neurogenerated
1 год назад

Преобразуем русскоязычный текст в речь при помощи Silero TTS⁠⁠1

Преобразуем русскоязычный текст в речь при помощи Silero TTS Нейронные сети, Text-to-speech

В основном, все алгоритмы и модели преобразования текста в речь ( или TTS ) очень плохо работают с русским языком. По итогам моих поисков, лучше всего с этим справился Silero TTS, кроме того, для его работы не нужен GPU, скорость и без того достаточно шустрая на процессоре.

Ознакомиться с проектом можно на его странице GitHub, там же можно найти ссылки на Google Collab, если кто то хочет попробовать онлайн.

Я же решил сделать простенький WebUI на базе проекта silero_tts_standalone, способный переваривать большие txt файлы (в оригинале есть ограничение на 1000 символов), и сделал автоматическую процедуру установки и запуска. Также, как обычно, сделал и портативную версию.

Инструкцию по обычной установке можно найти тут.

Для запуска портативной версии вам надо скачать архив, распаковать его и запустить вложенный bat файл. После чего открыть в браузере адрес http://127.0.0.1:7860 (порт может быть другим, в консоли будет показан актуальный).

Сама же работа с программой очень простая:
Загружаем наш txt файл (надо назвать его используя латиницу, без пробелов и спецсимволов), выбираем голос и нажимаем Исполнить.

На выходе вы получите wav файл с озвученным текстом.

Скачать silerotts-webui можете тут:

Обычная версия
Портативная версия

Больше моих различных сборок полезных нейросетей можно найти в моём телеграм канале Neurogen.

Показать полностью
[моё] Нейронные сети Text-to-speech
62
30
MindSimulation
MindSimulation
2 года назад
Лига Разработчиков Видеоигр

Новые возможности для синтеза речи: мы запустили Телеграм бота и добавляем игровые голоса⁠⁠

Привет всем! Меня зовут Леонид, я являюсь СЕО Mind Simulation – лаборатории, ведущей исследования и разработки в направлении Общего Искусственного Интеллекта. Сегодня я хочу поделиться новостью о запуске бота Telegram с синтезом речи для нашей платформы SteosVoice.

Новые возможности для синтеза речи: мы запустили Телеграм бота и добавляем игровые голоса Искусственный интеллект, Видеоигра, Разработка, Синтез речи, Tts, Text-to-speech, Видео, YouTube, Длиннопост

Ранее я уже писал о том, как мы умеем переносить голоса между языками на примере G-man`а из Half-Life: Alyx и Святого Габена.

Бот доступен здесь и с его помощью вы теперь можете работать в привычной среде. Этот бот позволяет легко и просто создавать аудио файлы на английском и русском языках, используя мощную технологию синтеза речи нашей платформы. Но фишек больше, чем просто синтез:

  • 5000 символов бесплатно каждый день: бот будет являться первой точкой входа в наш сервис, которая позволит оценить качество синтезирования, поработать с разными голосами и пользоваться сервисом бесплатно, если у вас небольшие потребности;

  • удобный выбор голоса через Telegram Web App: голоса структурированы по категориям, есть сортировка, можно сразу прослушать пример звучания голоса;

  • мультиязычные голоса: не столько фишка бота, сколько фишка нашей технологии, о которой я рассказывал здесь (русские голоса говорят по-английски и наоборот);

  • создание гифок со звуком: вы можете отправлять боту гифки и накладывать на них ваши реплики (если гифка вертикальная или квадратная, то бот сделает из неё кружок, если горизонтальная – оставит как есть);

  • привязка бота к платформе по токену: если вы приобрели платный тариф на платформе, но вам удобно пользоваться ботом, то вы можете подключить его к своему аккаунту и бот будет расходовать основной баланс платформы (инструкция по привязке находится в самом боте);

  • настройка ударений через «+»: просто поставьте + перед ударной гласной и ударение поменяется;

  • голоса из игр: мы решили начать добавлять на платформу голоса любимых всеми персонажей видеоигр и будем наращивать темпы;

  • покупка дополнительных символов сразу в боте: если не хочется регистрироваться на платформе, но нужен больший объём;

  • новые фичи на подходе: бот будет первым получать экспериментальные обновления перед их внедрением в саму платформу.

Недавно мы запустили интересный колаб вместе с Gabe Follower в телеграме. Мы открыли его голос для пользователей. Креатив не заставил себя долго ждать 😊

Вот ролик, сценарий которого написал chatGPT, а озвучен он нашим синтезом:

Также оставлю ссылку на видео, полностью созданное с помощью нескольких нейронных сетей, которое было озвучено нашей версией Джина из Лиги Легенд: https://t.me/DeepFaker/4381

Бот работает неполные 2 недели, а мы уже выросли до 8000 пользователей у бота и 4000 подписчиков в нашем телеграм канале. Присоединяйтесь, будем рады, если наш сервис будет для вас полезен😊

Также мы запустили мини платформу, где вы можете нам помочь в подготовке данных для создания голосов.

Новые возможности для синтеза речи: мы запустили Телеграм бота и добавляем игровые голоса Искусственный интеллект, Видеоигра, Разработка, Синтез речи, Tts, Text-to-speech, Видео, YouTube, Длиннопост

Велком, вы поможете ускорить процесс! Новые игры так же будут добавляться.

P.S. Также в ближайших планах стоит запуск публичного API для интеграции с вашими проектами.

В общем (и целом) приглашаю вас потестить и обсудить в комментариях!

Показать полностью 1 1
Искусственный интеллект Видеоигра Разработка Синтез речи Tts Text-to-speech Видео YouTube Длиннопост
6
343
TyTochka
3 года назад
Искусственный интеллект

7 Лучших голосовых движков (Text-to-Speech)⁠⁠

1. Voicemaker.in - это сайт онлайн-конвертер текста в речь на основе ИИ. У них есть 500+ стандартных и естественно звучащих голосов ИИ на 50 языках мира. Вы можете использовать их голоса для своих видео, которые вы можете разместить на YouTube, Vimeo, Facebook, Instagram или личных сайтах.

2. readspeaker.com/text-to-speech-demo/ - Откройте для себя ассортимент голосов ReadSpeaker для преобразования текста в речь, признанный одним из самых точных и реалистичных на рынке.

3. apihost.ru/voice - Качественная онлайн озвучка текста мужским и женским голосом бесплатно. Можно преобразовать и скачать текст в аудио файл mp3. Перевод текста в звук на Русском, Украинском, Английском, Немецком, Итальянском, Французком, Испанском, Голландском, Турецком, Португальском, Китайском, Арабском языках.

4. texttospeechrobot.com - Лучший бесплатный веб-сервис для преобразования текста в речь. TTS Robot прочитает любой текст на различных языках в наиболее реалистичной и естественной манере.

5. naturalreaders.com/online/ - Преобразование текста в речь с естественным звучанием голосов. Поддерживает PDF, word, электронные книги, веб-страницы, Ещё имеет преобразование текста в аудио файлы.


6. texttospeech.ru - этот сайт может читать текст женским или мужским голосом. Можно озвучить ролики для Ютуба , рекламные материалы, автоотвечики и многое другое. Синтез речи позволяет говорить голосом практически неотличимым от человека. Большой выбор различных голосов.

7. https://zvukogram.com/speech/ -  Звукограм озвучивает ютуб-каналы, бизнес-презентации, голосовые сообщения, анекдоты и даже детские сказки.


Бонусом могу предложить https://app.uberduck.ai/  со множеством популярных голосов из мультфильмов до игр. Только есть один минус, писать надо на английском, а так сервис очень классный.


Ссылка на сервисы в телеграмме: https://t.me/NapishiSkaji

Показать полностью
[моё] Искусственный интеллект Text-to-speech Текст
49
403
snakers4
snakers4
3 года назад
Искусственный интеллект

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек⁠⁠

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек Синтез речи, Text-to-speech, Машинное обучение, Искусственный интеллект, Видео

Я хотел бы поделиться нашими новыми публичными моделями синтеза речи. Они стали радикально лучше, качественнее и обзавелись целым рядом фич:


Модели в 10 раз быстрее и в 2 раза меньше (и все голоса внутри одной модели)
Теперь там появился новый высококачественный диктор, а также модель умеет генерировать случайных дикторов (пример на видео ниже)
Мы научили их делать паузы, менять скорость и тон речи
Они могут генерировать аудио разного качества - от телефонии до диктора из студии (8, 24, 48 kHz)
Теперь нет детских болячек таких как зависание или пропуск слов

Попробовать модель как обычно можно в нашем репозитории и в колабе.


Насколько Пикабу позволяет, вот примеры звучания моделей:

Показать полностью 1 1
[моё] Синтез речи Text-to-speech Машинное обучение Искусственный интеллект Видео
128
Посты не найдены
О Нас
О Пикабу
Контакты
Реклама
Сообщить об ошибке
Сообщить о нарушении законодательства
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Команда Пикабу
Бан-лист
Конфиденциальность
Правила соцсети
О рекомендациях
Наши проекты
Блоги
Работа
Промокоды
Игры
Скидки
Курсы
Зал славы
Mobile
Мобильное приложение
Партнёры
Промокоды Biggeek
Промокоды Маркет Деливери
Промокоды Яндекс Путешествия
Промокоды М.Видео
Промокоды в Ленте Онлайн
Промокоды Тефаль
Промокоды Сбермаркет
Промокоды Спортмастер
Постила
Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии