FAQ
Časté otázky k benchmarku
Slovníček pojmů
Full 10— Plná sada 10 ukázkových use case.
FAST— Rychlostní profil – cíl je dostat co nejrychleji použitelný výstup.
THINK— Profil, kde má model větší prostor pro přemýšlení.
Warm start— Model už je v paměti a nemusí se znovu načítat.
Cold start— Model se spouští od nuly.
OK— Běh dopadl dobře a výstup je použitelný.
Invalid— Výstup nesplnil pravidla – typicky rozbitý JSON.
Skip— Úloha přeskočena záměrně (např. textový model neumí obrázky).
Token— Malý kus textu, ze kterého model skládá vstup i odpověď.
TTFT— Time To First Token – jak dlouho čekáš na první část odpovědi.
tok/s— Kolik tokenů model zvládne zpracovat nebo vygenerovat za sekundu.
Coverage %— Kolik relevantních úloh model dokončil použitelně.
Salvage— Záchranný pokus s upraveným nastavením.
DGX Spark— Kompaktní NVIDIA zařízení pro lokální AI.
Ollama— Nástroj pro lokální spouštění modelů přes API.
Structured output— Výstup v přesně daném formátu pro systémy a automatizaci.
JSON— Jednoduchý strukturovaný formát dat.
Multimodální model— Model, který umí víc druhů vstupů (text + obrázek).
RFP— Request for Proposal – výběrové řízení pro dodavatele.
Kvantizace— Zmenšení modelu pro rychlejší běh na menší paměti.