Riassunto testo¶
Dopo la trascrizione, Sbobinator può generare un riassunto LLM del testo in trascrizione.txt.
Provider¶
| ID | Motore | Setup |
|---|---|---|
deepseek |
DeepSeek API | API key in Impostazioni riassunto |
openai |
OpenAI | API key |
gemini |
Google Gemini | API key |
claude |
Anthropic Claude | API key |
kimi |
Moonshot Kimi | API key |
local |
Qwen2.5 GGUF (CPU) | python scripts/download_summary_llm.py + RAM ≥ 16 GB |
Configurazione: http://localhost:8501/settings/summary
Le API key sono salvate in data/.secrets/summary_keys.json (o variabili SBOBINATOR_*_API_KEY — vedi .env.example).
Lunghezza¶
| Valore | Comportamento |
|---|---|
auto |
Proporzionata al testo |
short |
Breve |
normal |
Bilanciato |
detailed |
Più lungo |
Pipeline¶
- Trascrizione NeMo completata
unload_model()— libera RAM ASRsummarize()— provider scelto, map-reduce se testo lungo- Salva
riassunto.txt
Se il riassunto fallisce: job completed, summary_error con motivo, trascrizione e SRT restano validi.
Testi lunghi¶
Oltre il contesto del provider → strategia map-reduce (chunk parziali + unione).
CLI¶
sbobina transcribe file.wav -s --summary-provider deepseek
sbobina transcribe file.wav -s --summary-provider local --summary-length detailed
UI¶
- Sidebar → Motori e API key (prima configurazione)
- Spunta Genera riassunto
- Scegli motore e lunghezza
- Accoda file
Dipendenze Python¶
Include: openai, anthropic, google-genai, truststore, llama-cpp-python, psutil, huggingface_hub.
Su Windows, truststore è necessario per le API cloud (fix SSL Python 3.13).
Deprecato¶
LexRank / IT5 (extractive / abstractive) — rimossi. Vedi bug-fix/FIX-RIASSUNTO-LLM.md.