Voisy — российский сервис транскрипции аудио на базе Whisper

Принимаем аудио-записи, распознаём речь с помощью faster-whisper, применяем контекст и постобработку, возвращаем чистый текст — без трансграничной передачи данных.

Серверы в РФ Подходит для компаний с повышенными требованиями к данным: банки, девелоперы, колл-центры, SaaS-платформы.
Онлайн-мониторинг
Очередь задач
~200
приоритизируется по SLA / tenant’у
Успешных транскрипций
99%+
после постобработки
Обработка
real-time xN
GPU + faster-whisper
Контекст для модели
Очередь с приоритетами
API + Webhook + файлы

Что такое Voisy

Voisy — инфраструктурный сервис приёмки и транскрипции аудио-записей на базе Whisper (faster-whisper) с очередью задач, приоритизацией и интеллектуальной постобработкой.

Стабильная очередь задач

Продуманная очередь с приоритетами: критичные задачи клиентов с высоким SLA обрабатываются в первую очередь, без ручного вмешательства.

Контекст и доменная лексика

Поддержка промптов и контекста для модели: названия проектов, продуктов, юридические формулировки, термины сферы недвижимости, финансов и др.

Постобработка текста

Алгоритмы очистки артефактов, повторов, мусорных символов, доформатирование чисел, процентов и телефонных номеров для читаемых транскриптов.

Основные возможности сервиса

Сделали Voisy удобным для технических и продуктовых команд одновременно.

Приём аудио

HTTP API, загрузка файлов, интеграция с очередями и вебхуками. Поддержка популярных аудиоформатов.

Whisper (faster-whisper)

Оптимизированный inference на GPU. Выбор модели по качеству/скорости в зависимости от задач клиента.

Мульти-tenant

Разделение клиентов по tenant_id: свои ключи, лимиты, приоритеты, аналитика и логирование для каждого.

Мониторинг и метрики

Админ-панель с live-статусом: очередь задач, загрузка CPU/GPU/RAM, статистика в разрезе периодов и клиентов.

Гибкие SLA

Настраиваемые лимиты по скорости, времени обработки и количеству одновременных задач.

Обработка длинных записей

Стратегии нарезки, VAD, обработка по частям с последующей сборкой и постобработкой.

Логи и аудит

Детальная история задач, статусов и ошибок, возможность выгрузки логов для анализа.

Поддержка русской речи

Фокус на русском языке и запросах российского рынка: регионы, имена, бренды и доменная терминология.

Как работает Voisy

От загрузки файла до готового, очищенного текста — в несколько шагов.

1

Приём аудио

Ваш сервис отправляет аудио через API, вебхук или загрузку файла. Каждая задача получает идентификатор и tenant.

2

Очередь и приоритизация

Задачи попадают в очередь, где сортируются по приоритетам, SLA и лимитам клиента.

3

Whisper + контекст

faster-whisper обрабатывает запись с учётом заданного контекста и доменной лексики.

4

Постобработка и отдача

Результат очищается от артефактов, форматируется и возвращается через API или в ваше хранилище.

Технологическая основа Voisy

Под капотом — продакшн-стек для стабильной распознающей инфраструктуры.

  • Модель Whisper в реализации faster-whisper для ускоренного inference на GPU.
  • Оптимизации по памяти и скорости для обработки больших объёмов аудио.
  • Гибкие настройки VAD, размера чанков и параметров декодирования.
  • Отдельный слой постобработки: чистка, регулярные выражения, словари.
  • Админ-панель для мониторинга очередей, нагрузки и активности клиентов.

Ключевые характеристики

  • Развёртывание: собственные серверы в РФ
  • API: HTTP/JSON, вебхуки, поддержка batch-обработки
  • Форматы: популярные аудио-форматы (mp3, wav, m4a и др.)
  • Масштабирование: возможность горизонтального роста под нагрузку
  • Наблюдаемость: метрики, логи, аналитика по периодам

Безопасность и хранение данных

Voisy подходит для компаний, которым важно контролировать местоположение и движение данных.

Серверы в России

Обработка и хранение аудио и транскриптов происходят на серверах, расположенных в РФ. Данные не уходят трансгранично.

Шифрование каналов

Взаимодействие по HTTPS, возможность работы через VPN/приватные каналы.

Разделение клиентов

Изоляция по tenant’ам, разграничение доступа к логам и транскриптам.

Интеграция с вашими системами

Voisy задуман как сервис-«кирпичик» для ваших продуктов, а не как монолитное приложение.

HTTP API

Простые REST-методы для постановки задач, получения статусов и результатов.

Webhooks и очереди

Уведомление о готовности задач, интеграция с вашими брокерами сообщений и пайплайнами.

Под ваши процессы

Настройка форматов, схем имени файлов, правил постобработки и SLA под конкретного заказчика.

Кому будет полезен Voisy

Если у вас много аудио-коммуникаций — Voisy помогает превратить их в данные.

Разработчики SaaS-платформ

Добавьте транскрипцию звонков и голосовых сообщений в свой продукт.

Колл-центры и телефония

Автоматическая расшифровка разговоров для контроля качества и аналитики.

Девелоперы и продажи

Транскрипция звонков по недвижимости, встреч и консультаций для речевой аналитики.

Внутренние ИТ-команды

Локальный сервис в РФ, который можно встроить в текущую инфраструктуру.

Контакты

Напишите нам, если хотите обсудить подключение Voisy к вашим системам.

Email: hello@voisy.ru

Кратко опишите задачу, объёмы аудио и требования к скорости/безопасности.