перетащите .wav/.mp3 сюда — прогоню окнами 4 с и покажу таймлайн
Всё считается локально в браузере (onnxruntime-web, WASM) — звук никуда не передаётся.
Модель принимает сырую волну 4 с / 16 кГц; mel-фронтенд зашит в ONNX-граф.
Если модель не загружается с ошибкой про STFT — ваш onnxruntime-web старый, обновите версию в этой странице.
Микрофон требует HTTPS или localhost.