Все сервисы
После точки/вопроса/восклицания следующее слово автоматически с большой буквы.
Что это
Whisper Hotkey - системный шорткат: зажимаешь Win+Z, говоришь, отпускаешь - и расшифровка вставляется в текущее окно (чат, документ, поиск). Работает в любом приложении.
Локально через faster-whisper - в облако ничего не уходит. Дешевле и приватнее чем Wispr Flow или MacWhisper.
Кому полезно: всем кто много пишет. Я наговариваю первые черновики писем, постов, описаний задач - дальше правлю текст руками.
Что внутри
- Глобальный хоткей в любом окне Windows
- faster-whisper локально - GPU при наличии, CPU как фолбэк
- Авто-вставка в активное окно через буфер обмена
- Многоязычность - русский, английский, китайский
- Ярлык в автозагрузке + ярлык на рабочий стол
- Конфиг хоткея через config.json
Что понадобится
- Windows 10 / 11
- Python 3.10 или новее (3.10-3.12 рекомендуется). Скачать: python.org. При установке обязательно поставь галочку «Add Python to PATH».
- ~2 ГБ свободного места на диске (модель ~1.5 ГБ + зависимости)
- Интернет при первом запуске (для скачивания модели)
- Опционально: видеокарта NVIDIA с CUDA для ускорения (работает и без неё)
Установка
Полный гайд внутри архива в README.md. Кратко:
Установка - простой путь
- Распакуй архив куда угодно (например,
C:\Program Files\WhisperSTTилиD:\Apps\WhisperSTT). - Дважды кликни
install.bat. - Дождись окончания установки (5-10 минут - тянутся библиотеки).
- На рабочем столе появится ярлык «Whisper STT» - запусти его.
- При первом запуске откроется окошко «Загрузка модели Whisper» - подожди, пока скачается (~1.5 ГБ, разово).
- Когда в трее (правый нижний угол) появится иконка микрофона - всё готово.
Приложение автоматически добавится в автозагрузку Windows. После следующей перезагрузки запустится само.
Как пользоваться
- Зажми Ctrl + Alt (одновременно левый Ctrl и левый Alt).
- В верхней части экрана появится тёмная панель со статусом «Слушаю...».
- Говори, пока держишь клавиши. По мере распознавания текст будет появляться на панели.
- Отпусти клавиши - через секунду статус сменится на «Скопировано!».
- Нажми Ctrl + V в любом приложении - вставится распознанный текст.
Голосовые команды (русский)
В процессе диктовки можно произнести:
| Скажешь | Получишь |
|---|---|
| «запятая» | , |
| «точка» | . |
| «вопросительный знак» | ? |
| «восклицательный знак» | ! |
| «двоеточие» | : |
| «новая строка» | перенос строки |
| «новый абзац» | двойной перенос |
| «открыть скобку» / «закрыть скобку» | ( ) |
| «открыть кавычки» / «закрыть кавычки» | « » |
Настройки
ПКМ по иконке микрофона в трее → Настройки. Можно поменять:
- Горячую клавишу (по умолчанию Ctrl + Alt)
- Модель Whisper (от самой быстрой
tinyдо самой точнойlarge-v3) - Язык распознавания
- Устройство (auto / GPU / CPU)
- Тип вычислений (auto / float16 / int8 - влияет на скорость и память)
- Позицию и цвет всплывающей панели
- Правила автозамены
Конфиги хранятся в %USERPROFILE%\.whisper-stt\:
settings.json- все настройкиautocorrect.json- правила автозаменыmodels\- кэш скачанных моделейwhisper-stt.log- лог приложения
Если ругается SmartScreen
Это нормально для скачанных .bat/.vbs файлов. Жми «Подробнее» → «Выполнить в любом случае». Или ПКМ по архиву перед распаковкой → Свойства → галочка «Разблокировать».