Kdy se DGX Spark firmě vrátí? Nejen na tokenech, ale hlavně na soukromí a opakovaných workflow
DGX Spark není nejlevnější způsob, jak jednorázově položit otázku AI. Je to lokální AI uzel pro firmy, které opakovaně zpracovávají interní dokumenty, smlouvy, RFP, poznámky z porad, HR data a workflow, která by v cloudu byla drahá nebo citlivá.
Proti levným mini modelům
Pokud srovnáváte jen s nejlevnějšími cloudovými mini modely, čistá tokenová ROI bude dlouhá.
DGX se tu kupuje hlavně kvůli soukromí, kontrole a lokálním workflow.
Proti silnějším agentním modelům
Když část rutinní práce přesunete z dražších cloudových modelů na lokální workery, návratnost se zkracuje na měsíce.
Typicky jde o subagenty, extrakce, sumarizace a citlivé dokumenty.
Největší ekonomika je v hybridu
Cloud řeší jen to, kde je opravdu potřeba jeho kvalita. Lokálně běží citlivé a opakované subtasky.
To je kombinace, kde dává DGX Spark obchodně největší smysl.
Rychlá ROI kalkulačka
Model počítá s poměrem 2 input tokeny : 1 output token.
Výsledek pro zvolený scénář
GPT-5.4 mini
Cloud měsíčně
9 912 Kč
Lokální elektřina
180 Kč
Čistá měsíční úspora vs. cloud
9 732 Kč
Toto je hrubý rozdíl mezi cloudovým tokenovým účtem a lokální provozní elektřinou.
Odhad návratnosti hardware
12,3 měs.
Pokud by se tento objem práce držel stabilně, hardware by se zhruba vrátil za uvedenou dobu.
Roční čistá úspora: 116 790 Kč
Základní předpoklady výpočtu
Tahle kalkulace není účetní pravda pro každou firmu. Je to orientační obchodní model, který ukazuje citlivost na objem práce, cenu elektřiny a to, s jak drahým cloudem se DGX Spark reálně srovnává.
Cena DGX Spark
119 990 Kč
Vč. DPH, orientační veřejný zdroj.
Kurz USD/CZK
20.65
Použito pro orientační přepočet cloud cen.
Spotřeba
170 W
Konzervativní pracovní předpoklad pro kalkulaci.
Elektřina
6 Kč/kWh
Lze upravit podle firemní ceny.
Provozní režim
8 h/den, 22 dní
Základní kancelářský režim.
ROI baseline
80M tok./měsíc
Přibližně Gemma 4 26B, 4 tasky, 70% efektivita.
Lokální kapacita podle benchmarku
Nejpraktičtější baseline pro ROI je zvýrazněna.
| Model | tok/s | Paralelně | Škálování | M tokenů / měs. |
|---|---|---|---|---|
| Gemma 4 E4B | 41,4 | 1 | 1,00 | 26,2 |
| Gemma 4 E4B | 41,4 | 4 | 0,70 | 73,4 |
| Gemma 4 E4B | 41,4 | 5 | 0,65 | 85,3 |
| Gemma 4 26B | 43,8 | 1 | 1,00 | 27,8 |
| Gemma 4 26B | 43,8 | 4 | 0,70 | 77,7 |
| Gemma 4 26B | 43,8 | 5 | 0,65 | 90,2 |
| Nemotron 3 Nano 30B | 52,2 | 1 | 1,00 | 33,1 |
| Nemotron 3 Nano 30B | 52,2 | 4 | 0,70 | 92,6 |
| Nemotron 3 Nano 30B | 52,2 | 5 | 0,65 | 107,5 |
| Qwen 3.5 122B | 15,8 | 1 | 1,00 | 10,0 |
| Qwen 3.5 122B | 15,8 | 4 | 0,70 | 28,0 |
| Qwen 3.5 122B | 15,8 | 5 | 0,65 | 32,5 |
| Gemma 4 31B | 8,1 | 1 | 1,00 | 5,1 |
| Gemma 4 31B | 8,1 | 4 | 0,70 | 14,4 |
| Gemma 4 31B | 8,1 | 5 | 0,65 | 16,7 |
| Nemotron 3 Super 120B | 13,4 | 1 | 1,00 | 8,5 |
| Nemotron 3 Super 120B | 13,4 | 4 | 0,70 | 23,8 |
| Nemotron 3 Super 120B | 13,4 | 5 | 0,65 | 27,6 |
Srovnání proti cloudovým modelům
Výchozí tabulka počítá s 80M output-equivalent tokeny za měsíc.
| Cloud model | Kč / 1M ekv. | Cloud / měs. | ROI při 80M | Objem pro 12 měs. |
|---|---|---|---|---|
GPT-4o mini Levný cloud baseline. Tady se DGX kupuje hlavně kvůli soukromí a kontrole. | 19 Kč | 1 487 Kč | 91,8 měs. | 547,7M |
Gemini 3 Flash Rychlý multimodální cloud. Lokální worker už dává ekonomicky smysl. | 83 Kč | 6 608 Kč | 18,7 měs. | 123,2M |
Gemini 3.1 Flash Lite Levnější vysoký objem. ROI je delší, ale ne nulová. | 41 Kč | 3 304 Kč | 38,4 měs. | 246,5M |
GPT-5.4 mini Silnější subagent/cloud baseline. Tady se lokální worker vrací poměrně rychle. | 124 Kč | 9 912 Kč | 12,3 měs. | 82,2M |
Claude Sonnet 4.6 Drahý agentní cloud. Hybrid tady vypadá finančně velmi silně. | 434 Kč | 34 692 Kč | 3,5 měs. | 23,5M |
Claude Opus 4.7 Prémiový orchestrátor. Tady má DGX obrovský smysl jako worker pool. | 723 Kč | 57 820 Kč | 2,1 měs. | 14,1M |
Jak tuhle tabulku číst správně
Levný cloud
Pokud vám stačí nejlevnější mini model, DGX se vrací hlavně na privacy, compliance a nezávislosti.
Dražší agenti
Čím dražší cloud by jinak musel obsluhovat rutinní práci, tím rychleji začne DGX Spark dávat čistě ekonomický smysl.
Hybrid je hlavní pointa
Nejsilnější provozní model není cloud nebo lokál. Je to mix: cloud na judgement, DGX na citlivé a opakované workloady.
Ekonomika DGX Spark nevychází z izolovaného benchmarku. Vychází z architektury.
Když DGX Spark používáte jako lokální worker pool pro citlivé a opakované úlohy a cloud si necháte jen na to, kde je skutečně potřeba jeho kvalita, dává celé řešení nejlepší obchodní smysl.