Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Пикабу Игры +1000 бесплатных онлайн игр

Классический арканоид для любителей ретро-игр. Защитите космический корабль с Печенькой (и не только) на борту, проходя уровни в арканоиде.

Арканоид Пикабу

Арканоид, Аркады, Веселая

Играть
Веселая аркада с Печенькой для новогоднего настроения. Объезжайте препятствия, а подарки, варежки, конфеты и прочие приятности не объезжайте: они помогут набрать очки и установить новый рекорд.

Сноуборд

Спорт, Аркады, На ловкость

Играть
Решай головоломку с котиками!

Котолэнд: блок пазл

Головоломки, Казуальные, 2D

Играть
 Что обсуждали люди в 2024 году? Самое время вспомнить — через виммельбух Пикабу «Спрятано в 2024»! Печенька облегчит поиск предметов.

Спрятано в 2024

Поиск предметов, Казуальные

Играть
Стреляйте в преследующих вас врагов!
Оторвитесь от погони, ваш верный АК47 в этом поможет!
Огромный выбор оружия
Миниган, Арбалет, Стационарная пушка, Пулемет
Уничтожайте мотоциклы, квадроциклы, гоночные автомобили, вертолеты
Реалистичное оружие и машины

Погоня на Дороге: Шутер Реалистичное Оружие

Экшены, Аркады, Шутер

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • AlexKud AlexKud 26 постов
  • StariiZoldatt StariiZoldatt 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Синтез речи

С этим тегом используют

Искусственный интеллект Нейронные сети Озвучка YouTube Warcraft Вертикальное видео Русская озвучка Все
80 постов сначала свежее
403
snakers4
snakers4
3 года назад
Искусственный интеллект

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек⁠⁠

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек Синтез речи, Text-to-speech, Машинное обучение, Искусственный интеллект, Видео

Я хотел бы поделиться нашими новыми публичными моделями синтеза речи. Они стали радикально лучше, качественнее и обзавелись целым рядом фич:


Модели в 10 раз быстрее и в 2 раза меньше (и все голоса внутри одной модели)
Теперь там появился новый высококачественный диктор, а также модель умеет генерировать случайных дикторов (пример на видео ниже)
Мы научили их делать паузы, менять скорость и тон речи
Они могут генерировать аудио разного качества - от телефонии до диктора из студии (8, 24, 48 kHz)
Теперь нет детских болячек таких как зависание или пропуск слов

Попробовать модель как обычно можно в нашем репозитории и в колабе.


Насколько Пикабу позволяет, вот примеры звучания моделей:

Показать полностью 1 1
[моё] Синтез речи Text-to-speech Машинное обучение Искусственный интеллект Видео
128
8090
SunOf
3 года назад
Типичный программист

Прогресс⁠⁠

Позвонил на горячую линию в одну крупную фирму. На мой звонок ответила девушка с красивыми, мелодичным голосом, задала несколько уточняющих вопросов, после чего проконсультировала меня по моей проблеме.

В конце беседы она попросила оценить её искусственный интеллект и тут я знатно охренел, я был полностью убеждён, что я разговариваю с живым человеком.

Прогресс, что ты делаешь, притормози, мне всего 33!

[моё] Нейронные сети Синтез речи Консультация Прогресс Шок Текст
431
8
snakers4
snakers4
3 года назад
Искусственный интеллект

Обращение Софии к протеиновым мешкам⁠⁠

Видео - сгенерировано с помощью нейросетей. Аудио - сгенерировано с помощью синтеза голоса baya_v2 (с повышенным качеством 22 kHz).

[моё] Робот Синтез речи Машинное обучение Видео
8
12
snakers4
snakers4
3 года назад
Лига Новых Технологий

Что с людьми ЭЧПОЧМАК делает⁠⁠

[моё] Эчпочмак Deepfake Синтез речи Татарский язык Стив Бушеми Видео
14
9
tgarutoday
tgarutoday
3 года назад
ИТ-проекты пикабушников

История о том, как Илон Маск бросил все дела ради работы новостным ведущим в России⁠⁠

А ещё выучил русский язык и переехал в РФ, чтобы работать на YouTube канале 42CHANNEL. А теперь расскажу, чего можно добиться с помощью доступных DeepFake технологий.

История о том, как Илон Маск бросил все дела ради работы новостным ведущим в России Трансляция, Новости, Илон Маск, YouTube, Стрим, Deepfake, Прямой эфир, Синтез речи, Круглосуточно, Видео, Длиннопост

Введение


Deepfake — конкатенация слов «глубинное обучение» и «подделка», методика синтеза изображения, основанная на искусственном интеллекте. Она используется для соединения и наложения существующих изображений и видео на исходные изображения или видеоролики. Как гласит Википедия.


Ещё одна полезная технология современного мира - стриминг видео контента.


И наконец, синтез речи - программная конвертация печатного текста в «неотличимый от человеческого» речевой сигнал.


Закинув все это в блендер и залив контентом в виде новостей, я получил:

42CHANNEL - YouTube канал, круглосуточно транслирующий самые актуальные мировые новости, с Илоном Маском в роли ведущего.

Переходите на трансляцию и смотрите, что из этого вышло своими глазами:

https://www.youtube.com/channel/UCKn3nIsbXSbOxvmiDfCYLmg/live


История


Если вкратце - замысел был беспощадно «украден» у Никиты Колмогорова, а реализация кровожадно сперта у десятка разработчиков по всему миру.


Так как все нужные мне технологии уже были разработаны, мне оставалось их соединить воедино. Сейчас опишу используемые инструменты, так что можете переходить к следующей части статьи.


Для создания дипфейк видео взял Wav2Lip, который довольно прост в использовании, но ввиду кривизны моих рук, пришлось изрядно попотеть, чтобы установить зависимости на моём ПК.

Демонстрация работы Wav2Lip.

Путем множественных тестов, для синтеза речи был выбран SOVA TTS. А итоговое видео создается через FFmpeg и через него же транслируется на YouTube.


Часть кода, отвечающая за генерацию видео, крутится на моём стационарном ПК с видеокартой 2060 Super. Подходящий сервер с GPU неоправданно дорогой для текущей стадии.

Кому это нужно?


Кому это нужно?


Хотелось бы верить, что вообще всем. Моя задача - создать и предложить, остально дело за зрителями. С другой стороны, кто откажется под кружечку чая смотреть, как Илон рассказывает о мировых проблемах.


Какие есть проблемы?


Самая главная проблема - кривое произношение, иногда сложно понять, что сказал ведущий, особенно на аббревиатурах.


Кроме того, на текущем этапе разнообразие происходящего на трансляции оставляет желать лучшего. В планах добавить больше динамики, разные ракурсы ведущего и видео вставки.


Заключение


На самом деле, моя главная цель - вдохновить крупные компани автоматизировать все процессы в мире, лишить людей работы, устроить кризис на рынке труда и подорвать экономику. Ведь, как мы все прекрасно понимаем, с этого момента ведущие больше не нужны. Как вариант, компания Яндекс может взять проект за основу и развить его до чего-то революционного и не имеющего аналогов в мире.


И ещё кое что. Если трансляция прервется по техническим причинам, ссылка на неё изменится, поэтому, чтобы не утратить стрим, вы можете либо подписаться на канал, либо сохранить постоянную ссылку, которую я указал выше.


С любовью, tgaru.

Показать полностью 1
[моё] Трансляция Новости Илон Маск YouTube Стрим Deepfake Прямой эфир Синтез речи Круглосуточно Видео Длиннопост
6
5
0YoJeG0
0YoJeG0
4 года назад

Создание аудиокниги с помощью синтезатора речи⁠⁠

Моя мама, как большинство советских людей, просто обожает читать (самая читающая нация в мире, все дела). К сожалению с возрастом стало подводить зрение, и вроде - аудиокниги и вопрос закрыт, но далеко не все, что ей нравится озвучено. А вкусы весьма и весьма специфичны, как то отечественные фентези авторы и т.д.

И того: частный дом в глуши, на руках старенький ноут с седьмой виндой на борту и отвратительный интернет через 3g модем (и тот с костылями и свистоперделками в качестве доп антенны на крыше дома). Соответственно онлайн синтезатор речи отваливается сразу. Нашел некую прогу с говорящим названием "Речка", и о чудо, прога переводит текст в MP3 файл, а потом его озвучивает. Прога просит денег, и тут появляется затык: отзывов на нее в сети нет, от слова совсем.
http://rechka.onlinewebshop.net/ Это их сайт, может кто покупал или слышал о покупках этой проги, отпишитесь пожалуйста. Не реклама ни в коем случае. Ну и если есть что аналогичное, буду очень рад. Спасибо за внимание и всем добра...даже сверлящему соседу сверху!

[моё] Синтез речи Аудиокниги Рассказ Книги Родители Плохое зрение Текст
34
10
lobster1029
4 года назад

Telegram бот без явного использования сервера⁠⁠

Всем привет!

Сегодня на примере двух простых ботов для телеграм я хочу показать возможность реализации функций без использования сервера.

Для этого можно воспользоваться так называемыми бессерверными вычислениями, например

https://cloud.google.com/functions или https://cloud.yandex.ru/services/functions.

Я буду использовать сервис от яндекса.


Стоит отметить что все эти сервисы платные, но цена рассчитывается от количества вызовов функции, времени выполнения и потребляемой оперативной памяти. В любом случае, при использовании этих функций в личных целях, стоимость будет намного ниже даже самого дешевого VPS, дешевле только бесплатный VPS.


Делать я буду бота который озвучивает сообщения  при помощи сервиса от того же яндекса: https://cloud.yandex.ru/services/speechkit и бота который делает цветные фотографии из Ч/Б при помощи сервиса от mail.ru https://mcs.mail.ru/vision/, несмотря на то что основная цель данного сервиса - распознавание образов, этот сервис имеет функцию улучшения изображений https://mcs.mail.ru/help/ru_RU/manage-vision/vision-image-ap....


В первую очередь нам необходимо создать аккаунт в Yandex Cloud (или Google Cloud, если вдруг кто-то захочет повторить процесс там), подробно данную процедуру я описывать не буду, там ничего сложного.

После создания аккаунта заходим в консоль: https://console.cloud.yandex.ru и в левом меню переходим в пункт Cloud Functions, создаем функцию и придумываем ей имя.

После этого нам предлагают выбрать язык

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

Как видите, выбор большой. Я же не буду искать лёгкий путей и выберу Bash.


После этого мы попадаем в редактор.

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

В настройках в нижней части мы будем добавлять переменные окружения для хранения там, например, API ключа от бота. Также желательно увеличить таймаут, так как процесс синтеза речи или обработки фотографий может быть не быстрым.

Важно: После каждого изменения необходимо в правой части экрана нажимать на кнопку "Создать версию". В документации https://cloud.yandex.ru/docs/functions/ может почитать детальную информацию по каждому языку и посмотреть примеры.

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

Так выглядит моё окно редактора с полностью готовой функцией.

Код функции:

#!/bin/bash
# Ответ со статусом 200, оставляем из примера
echo '{
"statusCode": 200,
"body": {}
}'
# Запросы в функцию попадают через stdin, чтобы его получить достаточно вызвать команду `cat`
# Сервис, помимо тела запроса, присылает много дополнительной информации, а сам запрос лежит по ключу body
REQUEST=$(cat | jq -r '.body') # В переменную REQUEST достаём весь запрос от telegram
MESSAGE=$(echo $REQUEST | jq -r '.message') # Достаем структуру message
CHAT_ID=$(echo $MESSAGE | jq -r '.chat.id') # Внутри находим id чата для того чтобы отправить туда сообщение
TEXT=$(echo $MESSAGE | jq -r '.text') # Берём текст сообщения который будем озвучивать
# Cоздаём токен яндекса
# Для этого обязательно в настройках внизу должен быть подключен сервисный аккаунт
IAM_TOKEN=$(yc iam create-token)
FILE="/tmp/$(date +%s).ogg" # Названия временного файла, в виде текущей даты в секундах
# Отправляем текст на синтез и результат записываем во временный файл
curl -s -X POST -H "Authorization: Bearer ${IAM_TOKEN}" \
--data-urlencode "text=${TEXT}" \
-d "voice=alena&lang=ru-RU&folderId=${FOLDER_ID}" \
"https://tts.api.cloud.yandex.net/speech/v1/tts:synthesize" > $FILE
# Полученный файл отправляем в telegram
curl -s https://api.telegram.org/bot${BOT_API_KEY}/sendVoice -F "voice=@${FILE}" -F "chat_id=${CHAT_ID}" > /dev/null
# Удаляем файл
rm $FILE > /dev/null

В переменных окружения указан API ключ от бота который выдаётся при его создании.

И указан FOLDER_ID необходимый для работы синтеза речи, подробнее тут: https://cloud.yandex.ru/docs/speechkit/quickstart


Теперь осталось перейти в обзор функции сделать её публичной и скопировать ссылку для вебхука. Ссылку для вебхука я устанавливал командой:

curl https://api.telegram.org/bot<API_KEY>/setWebhook -F "url=https://functions.yandexcloud.net/d..."

<API_KEY> - заменить на токен бота, а в url= соответсвенно ваша ссылка.

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

На этом всё, бот должен работать. Проверяем:

Для создание второго бота проделываем всю ту же процедуру, но на этот раз, для использования сервиса обработки фотографий, нам необходимо зарегестрироваться ещё и на сайте https://mcs.mail.ru, и получить там токен для использования его в API.

Готовая функция  выглядит так:

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

Не обращайте внимания на подсветку кода, из-за сложного синтаксиса в 11 строке всё ломается. В переменных окружения как и в прошлый раз указан API ключ бота и API ключ от mail.ru.


Код целиком:

#!/bin/bash
echo '{
"statusCode": 200,
"body": {}
}'
REQUEST=$(cat | jq -r '.body')
MESSAGE=$(echo $REQUEST | jq -r '.message')
CHAT_ID=$(echo $MESSAGE | jq -r '.chat.id')
PHOTO=$(echo $MESSAGE | jq -r '(.photo | .[-1]) // (select(.document) | .document | select(.mime_type | contains("image"))) // false')
if [[ "$PHOTO" == "false" ]]; then
exit
fi
FILE_ID=$(echo $PHOTO | jq -r '.file_id')
FILE_PATH=$(curl -s https://api.telegram.org/bot${BOT_API_KEY}/getFile -F "file_id=${FILE_ID}" | jq -r '.result.file_path')
FILE="/tmp/$(date +%s)"
curl -s https://api.telegram.org/file/bot${BOT_API_KEY}/${FILE_PATH} > $FILE
COLORIZED_FILE="/tmp/$(date +%s)-colorized.jpg"
curl -s "https://smarty.mail.ru/api/v1/photo/improve?oauth_provider=m...{MCS_OAUTH_TOKEN}" \
-F file_0=@${FILE} -F meta='{"images":[{"name":"file_0"}], "mode":["improve"]}' |\
jq -r '.body.improve[0] | .colorized_improved // .colorized' | base64 --decode > $COLORIZED_FILE
curl -s \
https://api.telegram.org/bot${BOT_API_KEY}/sendPhoto \
-F "photo=@${COLORIZED_FILE}" \
-F "chat_id=${CHAT_ID}" > /dev/null
rm $FILE > /dev/null
rm $COLORIZED_FILE > /dev/null

Результат работы: 
Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

Ещё пример колоризации:

Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост
Telegram бот без явного использования сервера Telegram, Бот, Программирование, Командная оболочка bash, Синтез речи, Колоризация, Видео, Длиннопост

Фотографии взяты из последних постов на пикабу по тегу черно-белое фото


P.S. Приведённый мной код хоть и работает, но представляет из себя определенную субстанция, так как в нём нет абсолютно никаких обработок ошибок и т.п. Единственное что есть - это проверка того что присланный файл это фотография, во втором боте.


P.S №2. Ссылки на ботов не оставляю так как использованные сервисы по синтезу речи и колоризации фотографий платные,  хоть и очень дешёвые. С тарифами можно ознакомится на соответствующих сайтах.  Кому любопытно попробовать синтез речи, на сайте https://cloud.yandex.ru/services/speechkit есть такая возможность.  А колоризация доступна на сайте: https://9may.mail.ru/restoration/ , но не уверен что используются одни и те же алогритмы.

Показать полностью 8 1
[моё] Telegram Бот Программирование Командная оболочка bash Синтез речи Колоризация Видео Длиннопост
3
5
MarioKing
4 года назад

Эркюль Пуаро начинает новую жизнь⁠⁠

Ваш любимый герой Эркюль Пуаро сбрил усы, и начинает новую жизнь! В общем, он теперь совершенно другой человек!


Рекламный трейлер фильма "Приказано Уничтожить" (Executive Decision, 1996), c чешского телеканала Prima (который я немного подтянул в разрешении и продублировал на английский).


Русские субтитры по кнопке CC в плеере.

[моё] Юмор Эркюль Пуаро Агата Кристи Дэвид Суше Видео Трейлер Самолет Боевики Боевики 90-х Захват самолета Стивен Сигал Детектив Синтез речи Видеомонтаж
4
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии