Benchmark and performance¶

Monitor script¶

python scripts\benchmark_monitor.py

Metric	Meaning
Audio	Recording duration (ffprobe)
Proc.	`finished_at - started_at`
Total	`finished_at - queued_at` (includes queue wait)
RTF	Proc. ÷ Audio (>1 = slower than realtime)
Speed	Audio ÷ Proc. (e.g. 2x = double realtime)
Chars	Transcribed characters

Factor	Effect
CPU vs GPU	GPU much faster for NeMo
First job	Includes model load into RAM (~1–2 min)
Later jobs	Model already in memory (until unload for summary)
mT5 summary	Unloads ASR, loads mT5 — RAM/time overhead
Audio length	Chunking above 30 min
Short file first	High RTF (fixed overhead dominates)

File	Audio	Proc.	RTF
short 10s	0:10	~1:07	~6.6*
long 5min	5:00	~2:21	0.47
very-long 10min	10:26	~3:35	0.34

*The short file includes model load + mT5 on the first job.

data/output/benchmark_20260628_111738.json
data/output/benchmark_20260628_111738.md