Script monitor
python scripts\benchmark_monitor.py
- Cattura profilo hardware (CPU, RAM, device ASR)
- Attende nuovi job (o
--watch per job esistenti)
- Aggiorna tabella live ogni N secondi
- Al termine salva JSON + Markdown in
data/output/
Metriche per job
| Metrica |
Significato |
| Audio |
Durata registrazione (ffprobe) |
| Elab. |
finished_at - started_at |
| Tot. |
finished_at - queued_at (include coda) |
| RTF |
Elab. ÷ Audio (>1 = più lento del realtime) |
| Vel. |
Audio ÷ Elab. (es. 2x = doppia velocità realtime) |
| Chars |
Caratteri trascritti |
RTF — Real Time Factor
- RTF 0.5 → elabori 1 ora di audio in 30 minuti
- RTF 1.0 → tempo reale
- RTF 2.0 → il doppio del tempo reale
| Fattore |
Effetto |
| CPU vs GPU |
GPU molto più veloce per NeMo |
| Primo job |
Include caricamento modello in RAM (~1–2 min) |
| Job successivi |
Modello già in memoria (fino a unload per riassunto) |
| Riassunto mT5 |
Scarica ASR, carica mT5 — overhead RAM/tempo |
| Lunghezza audio |
Chunking sopra 30 min |
| File breve primo |
RTF alto (overhead fisso dominante) |
Esempio risultati (i5-1235U, CPU, mT5)
| File |
Audio |
Elab. |
RTF |
| breve 10s |
0:10 |
~1:07 |
~6.6* |
| lungo 5min |
5:00 |
~2:21 |
0.47 |
| molto-lungo 10min |
10:26 |
~3:35 |
0.34 |
*Il breve include caricamento modello + mT5 al primo job.
Report salvati
data/output/benchmark_20260628_111738.json
data/output/benchmark_20260628_111738.md
Suggerimenti
- Per benchmark pulito:
clean_output.py prima del run
- Avvia monitor prima di accodare i file
- Confronta estrattivo vs mT5 in run separati