Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Пикабу Игры +1000 бесплатных онлайн игр

Погружайтесь в загадочный мир подводных приключений с игрой

Тайна морей - Затерянные сокровища: Три в ряд

Три в ряд, Казуальные, Головоломки

Играть
🔥 Дрифт и гонки без правил!
Садись за руль, жги резину и уноси баллы в безумных поворотах!
🚗 Реалистичный дрифт
🏁 Захватывающие трассы
💨 Улучши свою тачку и побеждай!

Дрифт Без Лимита

Гонки, Симуляторы, Спорт

Играть
Динамичный карточный батлер с PVE и PVP-боями онлайн! Собери коллекцию карточных героев, построй свою боевую колоду и вступай в бой с другими игроками.

Cards out!

Карточные, Ролевые, Стратегии

Играть
Щелкните блоки, чтобы они улетели в 3D. Разблокируйте куб, чтобы овладеть головоломками

Разбери Кубик

Головоломки, 3D, Обучающая

Играть
Погрузитесь в логическую головоломку: откручивайте болты из планок на самых сложных уровнях! Вы не только расслабитесь в конце сложного дня, но еще и натренируете свой мозг, решая увлекательные задачки. Справитесь с ролью опытного мастера? Попробуйте свои силы в режиме онлайн бесплатно и без регистрации!

Головоломка. Болты и Гайки

Казуальные, Гиперказуальные, Головоломки

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • alekseyJHL alekseyJHL 6 постов
  • XpyMy XpyMy 1 пост
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Команда Пикабу Награды Контакты О проекте Зал славы
Промокоды Скидки Работа Курсы Блоги
Купоны Biggeek Купоны AliExpress Купоны М.Видео Купоны YandexTravel Купоны Lamoda
Мобильное приложение

Синтез речи

С этим тегом используют

Искусственный интеллект Нейронные сети Озвучка YouTube Warcraft Вертикальное видео Русская озвучка Все
80 постов сначала свежее
30
Independence.Day
Independence.Day
4 года назад
Искусственный интеллект

Электроды на лице и шее позволили нейросети озвучить беззвучную речь⁠⁠

Электроды на лице и шее позволили нейросети озвучить беззвучную речь Синтез речи, Bluetooth, Машинное обучение, Длиннопост

Американские исследователи создали прототип системы, которая считывает беззвучную речь при помощи электродов на лице и шее и превращает ее в слышимую речь с помощью нейросети. Потенциально это позволяет создать Bluetooth-гарнитуру, позволяющую разговаривать по телефону, не издавая звуков, или искусственный голосовой аппарат для людей с травмами гортани. Авторы представили разработку на конференцииEMNLP 2020 и получили награду за лучшую статью.

При чтении мы обычно не просто видим слова и понимаем их суть, но и проговариваем их про себя, не издавая при этом никаких звуков. Этот процесс называется субвокализацией. Особенность субвокализации заключается в том, что, хотя мы и не произносим слова вслух, мозг все равно заставляет мышцы голосового тракта двигаться, пускай и намного меньше, чем при обычной вокализованной речи. Инженеры довольно давно научились использовать эти сокращения мыщц и считывать их с помощью различных методов, в основном при помощи электромиографии, которая регистрирует электрическую активность мышц.

В основном нейромышечные интерфейсы для распознавания субковализации используют для превращения беззвучной речи в текст. Дэвид Гэдди (David Gaddy) и Дэн Кляйн (Dan Klein) из Калифорнийского университета в Беркли создали алгоритм для превращения беззвучной речи в слышимую. Ранее другие исследователи уже решали эту задачу: на человеке закрепляли электроды и он произносил текст, а параллельно с этим исследователи записывали звук и электрическую активность. Затем они обучали алгоритм на парах звук-электрическая активность, что позволяло восстановить первое из второго. Этот подход изначально закладывает в результаты неточность, потому что электрическая активность мышц голосового аппарата при слышимой и неслышимой речи похожа, но не идентична.

В новой работе Гэдди и Кляйн использовали более точный подход и решили обучать алгоритм на всех трех типах данных: запись слышимой речи и активность мышц во время слышимой и неслышимой речи. В основе их метода лежит преобразование исходных сигналов (звука и электромиографии) в представление в пространстве признаков. Создать преобразователь из пространства признаков в сигнал для данных, полученных при слышимой речи, относительно легко, потому что оба сигнала согласованы по времени и их можно использовать как пары для обучения. Для беззвучной речи это сделать не так легко, потому что парой для электромиографического сигнала будет беззвучная запись.

Разработчики решили эту проблему, создав алгоритм, который принимает все три сигнала (две электромиограммы и слышимую речь). На первом этапе он с помощью алгоритма динамической трансформации временной шкалы находит оптимальное соответствие между двумя сигналами: другими словами, он позволяет взять фрагмент из первой последовательности и найти его во второй. На втором этапе алгоритм, используя полученное соответствие, создает из аудиозаписи слышимой речи аудиозапись речи из электромиограммы неслышимой.

Этот алгоритм нужен не сам по себе, а в качестве учителя для нейросети, которая делает то же самое, получая на вход не три вида сигнала, а всего один (электромиограмму неслышимой речи). Исследователи использовали рекуррентную нейросеть с долгой краткосрочной памятью (LSTM). Затем данные из пространства признаков, полученные на выходе из нейросети, подаются на нейросеть WaveNet, декодирующую их в аудиозапись человеческого голоса.

Исследователи собрали собственный датасет для обучения алгоритма. Он состоит из 20 часов записи слышимой и беззвучной речи одного добровольца, представленной в виде трех типов данных (звук-две электромиограммы). Обучив нейросеть, авторы проверили понятность генерируемых записей речи. Обычно при проверке новых алгоритмов их результаты сравнивают с результатом лучшего на данный момент алгоритма для этой задачи (state of art). Поскольку ранее никто напрямую не переносил речь из электромиограммы беззвучной речи в звук, авторы решили сравнить полноценную нейросеть с ней же, но обученной на данных с электромиограммы слышимой речи.

Тесты проходили на закрытом словаре (человек зачитывал простые фразы типа даты) и на открытом (отрывки из книг). В качестве метрики авторы использовали стандартную пословную вероятность ошибки (WER): сумма измененных, отсутствующих и лишних слов, поделенная на общую длину текста. На закрытом словаре вероятность ошибки для полноценной нейросети составила 3,6, а для той, которую обучали только на слышимой речи, она составила 88,8. На открытом словаре разница была не такой большой: 74,8 к 95,1 при проверке человеком и 68 к 91,2 при проверке системой распознавания речи Mozilla DeepSpeech.

Исследователи опубликовали код алгоритмов и датасет на GitHub. Кроме того, на сайте конференции опубликован доклад одного из авторов, в котором, помимо прочего, можно услышать результаты работы нейросети (в конце ролика).

Современные алгоритмы умеют распознавать и другую неслышимую речь. Например, в прошлом году китайские и американские инженеры научили нейросеть читать речь по губам.

https://nplus1.ru/news/2020/11/26/silent-voice

Показать полностью 1
Синтез речи Bluetooth Машинное обучение Длиннопост
11
73
DELETED
4 года назад

Ответ на пост «Опрос: прослушивание постов»⁠⁠1

Ответ на пост «Опрос: прослушивание постов» Пикабу, Опрос, Синтез речи, Нововведение, Ответ на пост, Комиксы, Совещание, Мемы, Падение из окна
Показать полностью 1
Пикабу Опрос Синтез речи Нововведение Ответ на пост Комиксы Совещание Мемы Падение из окна
18
30
YellowNBeetle
YellowNBeetle
4 года назад
Новости Пикабу

Опрос: прослушивание постов⁠⁠1

Привет, пикабушники!

Снова на связи продуктовая команда Пикабу. Мы задумались, как сделать взаимодействие с контентом еще разнообразнее. Кому-то удобнее воспринимать информацию визуально, кому-то – на слух.

Пожалуйста, пройдите небольшой опрос, чтобы помочь нам понять предпочтения аудитории :)

Опрос: прослушивание постов Пикабу, Опрос, Синтез речи
Пикабу Опрос Синтез речи
122
314
iRukoJop
iRukoJop
5 лет назад

Как-то так⁠⁠

Как-то так Иран, США, Политика, Ракета, Перевод, Синтез речи

Перевод:
Трамп: Эй, Сири, сколько миль я пробежал сегодня?
Сири: Ок, отправить ракеты на Иран, сегодня.

Иран США Политика Ракета Перевод Синтез речи
17
9
Ya.Bumblebee
Ya.Bumblebee
5 лет назад

Мышка для подписчиков⁠⁠

Не так давно несколько человек попросили меня выложить видео с мышью и даже подписались, чтобы не пропустить.

В общем, для подписчиков, со странными вкусами.

[моё] Мышь Озвучка Синтез речи Без рейтинга Видео
6
AdobePhotoshop
AdobePhotoshop
5 лет назад

Лучший синтезатор речи⁠⁠

Звук Синтез речи Речь Программа Видео
6
6
usmanovamir
6 лет назад

Синтез речи при помощи Yandex SpeechKit⁠⁠

Всем привет!

Многие не знают что у яндекса есть свой синтезатор речи - SpeechKit. Он существует достаточно давно, но не имеет никакого графического интерфейса и вряд ли вы найдете примеры его работы. В связи с этим я решил сделать небольшой сайт - https://tts.iosdev.online/ на Yii для удобного взаимодействия с данным сервисом. На сайте есть примеры синтеза речи и инструкция по работе с ним.

В комментариях напишу свои OAuth токен и ID каталога, но работать они будет только до истечения пробного периода.

[моё] Синтез речи Text-to-speech Speechkit Текст
25
DimaSeven
DimaSeven
6 лет назад

Как вам такой голосовой движок Oksana ? Как настоящий голос⁠⁠

Озвучка Голосовой набор текста Синтез речи Видео
8
Посты не найдены
О Нас
О Пикабу
Контакты
Реклама
Сообщить об ошибке
Сообщить о нарушении законодательства
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Команда Пикабу
Бан-лист
Конфиденциальность
Правила соцсети
О рекомендациях
Наши проекты
Блоги
Работа
Промокоды
Игры
Скидки
Курсы
Зал славы
Mobile
Мобильное приложение
Партнёры
Промокоды Biggeek
Промокоды Маркет Деливери
Промокоды Яндекс Путешествия
Промокоды М.Видео
Промокоды в Ленте Онлайн
Промокоды Тефаль
Промокоды Сбермаркет
Промокоды Спортмастер
Постила
Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии