Voisy — российский сервис транскрипции аудио на базе Whisper
Принимаем аудио-записи, распознаём речь с помощью faster-whisper, применяем контекст и постобработку, возвращаем чистый текст — без трансграничной передачи данных.
Что такое Voisy
Voisy — инфраструктурный сервис приёмки и транскрипции аудио-записей на базе Whisper (faster-whisper) с очередью задач, приоритизацией и интеллектуальной постобработкой.
Стабильная очередь задач
Продуманная очередь с приоритетами: критичные задачи клиентов с высоким SLA обрабатываются в первую очередь, без ручного вмешательства.
Контекст и доменная лексика
Поддержка промптов и контекста для модели: названия проектов, продуктов, юридические формулировки, термины сферы недвижимости, финансов и др.
Постобработка текста
Алгоритмы очистки артефактов, повторов, мусорных символов, доформатирование чисел, процентов и телефонных номеров для читаемых транскриптов.
Основные возможности сервиса
Сделали Voisy удобным для технических и продуктовых команд одновременно.
Приём аудио
HTTP API, загрузка файлов, интеграция с очередями и вебхуками. Поддержка популярных аудиоформатов.
Whisper (faster-whisper)
Оптимизированный inference на GPU. Выбор модели по качеству/скорости в зависимости от задач клиента.
Мульти-tenant
Разделение клиентов по tenant_id: свои ключи, лимиты, приоритеты, аналитика и логирование для каждого.
Мониторинг и метрики
Админ-панель с live-статусом: очередь задач, загрузка CPU/GPU/RAM, статистика в разрезе периодов и клиентов.
Гибкие SLA
Настраиваемые лимиты по скорости, времени обработки и количеству одновременных задач.
Обработка длинных записей
Стратегии нарезки, VAD, обработка по частям с последующей сборкой и постобработкой.
Логи и аудит
Детальная история задач, статусов и ошибок, возможность выгрузки логов для анализа.
Поддержка русской речи
Фокус на русском языке и запросах российского рынка: регионы, имена, бренды и доменная терминология.
Как работает Voisy
От загрузки файла до готового, очищенного текста — в несколько шагов.
Приём аудио
Ваш сервис отправляет аудио через API, вебхук или загрузку файла. Каждая задача получает идентификатор и tenant.
Очередь и приоритизация
Задачи попадают в очередь, где сортируются по приоритетам, SLA и лимитам клиента.
Whisper + контекст
faster-whisper обрабатывает запись с учётом заданного контекста и доменной лексики.
Постобработка и отдача
Результат очищается от артефактов, форматируется и возвращается через API или в ваше хранилище.
Технологическая основа Voisy
Под капотом — продакшн-стек для стабильной распознающей инфраструктуры.
- Модель Whisper в реализации faster-whisper для ускоренного inference на GPU.
- Оптимизации по памяти и скорости для обработки больших объёмов аудио.
- Гибкие настройки VAD, размера чанков и параметров декодирования.
- Отдельный слой постобработки: чистка, регулярные выражения, словари.
- Админ-панель для мониторинга очередей, нагрузки и активности клиентов.
Ключевые характеристики
- Развёртывание: собственные серверы в РФ
- API: HTTP/JSON, вебхуки, поддержка batch-обработки
- Форматы: популярные аудио-форматы (mp3, wav, m4a и др.)
- Масштабирование: возможность горизонтального роста под нагрузку
- Наблюдаемость: метрики, логи, аналитика по периодам
Безопасность и хранение данных
Voisy подходит для компаний, которым важно контролировать местоположение и движение данных.
Серверы в России
Обработка и хранение аудио и транскриптов происходят на серверах, расположенных в РФ. Данные не уходят трансгранично.
Шифрование каналов
Взаимодействие по HTTPS, возможность работы через VPN/приватные каналы.
Разделение клиентов
Изоляция по tenant’ам, разграничение доступа к логам и транскриптам.
Интеграция с вашими системами
Voisy задуман как сервис-«кирпичик» для ваших продуктов, а не как монолитное приложение.
HTTP API
Простые REST-методы для постановки задач, получения статусов и результатов.
Webhooks и очереди
Уведомление о готовности задач, интеграция с вашими брокерами сообщений и пайплайнами.
Под ваши процессы
Настройка форматов, схем имени файлов, правил постобработки и SLA под конкретного заказчика.
Кому будет полезен Voisy
Если у вас много аудио-коммуникаций — Voisy помогает превратить их в данные.
Разработчики SaaS-платформ
Добавьте транскрипцию звонков и голосовых сообщений в свой продукт.
Колл-центры и телефония
Автоматическая расшифровка разговоров для контроля качества и аналитики.
Девелоперы и продажи
Транскрипция звонков по недвижимости, встреч и консультаций для речевой аналитики.
Внутренние ИТ-команды
Локальный сервис в РФ, который можно встроить в текущую инфраструктуру.
Контакты
Напишите нам, если хотите обсудить подключение Voisy к вашим системам.
Email: hello@voisy.ru
Кратко опишите задачу, объёмы аудио и требования к скорости/безопасности.