Делюсь новым сервисом бесплатного перевода из аудио и видео в текст
У меня часто бывают задачи, где нужно расшифровать аудио или видео. Это могут быть интервью, брифы, голосовые заметки — всё, что проще обрабатывать в тексте. Мы в агентстве перепробовали много сервисов, но у всех были ограничения: по времени, формату, количеству файлов или платному доступу.
В итоге наши разработчики собрали собственный инструмент — Soloma Speech. Изначально он создавался под внутренние задачи, но мы решили, что будет правильно поделиться им с другими специалистами.
Как работает
Soloma Speech — это Telegram-бот и веб-сервис: speech.soloma.agency. Можно загружать аудио и видео (форматы — mp3, wav, mp4, mov, flv и др.), размер — до 500 МБ, до 5 файлов одновременно. Сервис автоматически определяет количество голосов на записи, но это можно настроить вручную. Лимитов по минутам пока что нет.
Готовый текст приходит в Telegram — в двух форматах: .txt и .json. Никакие файлы мы не храним, всё сразу удаляется после отправки результата. Лучше сразу переименовать файл в латинице и без знаков препинания — так система сработает корректнее.
Для чего подходит
Soloma Speech используют копирайтеры, редакторы, HR, продюсеры — все, кто работает с голосом. Мы применяем его и для расшифровки собеседований, и для подготовки материалов из устных комментариев. Это экономит время, особенно на рутинных задачах.
Сейчас сервис на уровне MVP. В планах — добавить саммари, больше форматов и AI-инструменты для быстрой подготовки текстов.
Если вы работаете с голосовыми данными — можно попробовать. Ничего не нужно устанавливать, вход через Telegram. Обратная связь приветствуется — мы развиваем Soloma Speech в том числе по откликам пользователей.
Регистрироваться не нужно, все бесплатно.