Handy — это кроссплатформенное офлайн‑приложение для преобразования речи в текст (speech‑to‑text), построенное на Tauri (Rust + React/TypeScript), которое вставляет распознанный текст прямо в любое активное текстовое поле и работает полностью локально, без отправки аудио в облако. [1]
## Основная идея и назначение
Handy позиционируется как бесплатный, открытый и расширяемый инструмент для диктовки, где упор сделан не на «лучшее качество», а на «наиболее удобную базу для форков и доработок». [1] Проект ориентирован на приватность (все вычисления на машине пользователя), простоту («одна утилита — одна задача») и доступность как вспомогательного средства для ввода текста голосом. [1]
## Как работает Handy
- Пользователь нажимает на настраиваемое глобальное сочетание клавиш, начинает говорить и отпускает клавишу по окончании фразы. [1]
- Приложение локально обрабатывает аудиопоток: шум и паузы отфильтровываются VAD (Silero), затем сегменты передаются в модель распознавания речи. [1]
- Полученный текст автоматически вставляется (paste) в текущее активное приложение/поле ввода. [1]
## Модели и локальная обработка
- Whisper (через `whisper-rs`): поддерживаются варианты Small/Medium/Turbo/Large, с использованием GPU‑ускорения, если оно доступно. [1]
- Parakeet V3 (через `transcription-rs`): CPU‑оптимизированная модель с авто‑детекцией языка, ориентирована на работу даже на не самых мощных машинах. [1]
- Для VAD используется Silero, а для ресемплинга — `rubato`. [1]
## Архитектура и стек
- Фронтенд: React + TypeScript + Tailwind CSS для интерфейса настроек. [1]
- Бэкенд: Rust, отвечающий за интеграцию с ОС, аудиозахват (через `cpal`), глобальные хоткеи (`rdev`) и запуск ML‑инференса. [1]
- Всё упаковано в Tauri‑приложение, что облегчает кроссплатформенную сборку и интеграцию с десктопом. [1]
## Платформы и требования
- Поддерживаются: macOS (Intel и Apple Silicon), Windows x64, Linux x64 (рекомендованы Ubuntu 22.04/24.04). [1]
- Для Whisper желательно наличие GPU (Intel/AMD/NVIDIA на Windows и Linux, M‑серия или Intel‑Mac на macOS), для Parakeet достаточно современного CPU уровня Intel Skylake или аналогичного AMD, где заявлена производительность около 5× real‑time на среднем железе. [1]
## Режим отладки и разработка
- Встроен debug‑режим: Cmd+Shift+D на macOS и Ctrl+Shift+D на Windows/Linux. [1]
- Для локальной разработки предлагается стандартный цикл: форк репозитория, ветка с фичей, сборка по инструкциям в BUILD.md, тестирование и PR. [1]
## Лицензия, сайт и ссылки
- Лицензия: MIT (см. файл LICENSE в репозитории). [1]
- Официальный сайт проекта с демо и документацией: https://handy.computer. [1]
- Репозиторий: https://github.com/cjpais/Handy. [1]
Цитаты:
[1] cjpais/Handy: A free, open source, and extensible speech ... - GitHub https://github.com/cjpais/Handy