Co kdyby spočítání 200 krabic na paletě trvalo 3 sekundy místo 10 minut? To je příslib rozpoznávání obrazu s AI aplikovaného na inventuru. Namíříte kameru, vyfotíte a model natrénovaný na milionech objektů vrátí počet s vizuálním překryvem, který ukazuje přesně, co detekoval.
Zní to futuristicky, ale technologie už funguje ve skladech, obchodech a na stavbách. Rozdíl mezi výkonem ručního počítání a počítání s pomocí AI je větší, než většina provozních týmů čeká.
Trh se sledováním zásob pomocí počítačového vidění roste tempem přibližně 18% ročně (CAGR) a předpokládá se, že do roku 2033 dosáhne 14-16 miliard dolarů, tažený poptávkou z e-commerce a pokroky v hlubokém učení.
Skutečná cena ručního počítání
Ruční počítání je ve skladech standardem po celá desetiletí a jeho slabiny jsou dobře zdokumentované. Lidský počítač pracující normální rychlostí dosahuje přibližně 91% přesnosti, což znamená zhruba jednu chybu na 10 položek. Přidejte zadávání dat do tabulky a chybovost stoupne o dalších 1-3 procent.
Kromě chyb je bolestivý i časový náklad. Kompletní inventura skladu může trvat 16-20 hodin a obvykle vyžaduje zastavení provozu na celý den. I částečné cyklické počítání zabere 5-10 hodin týdně pracovního času, což stojí přibližně 500-1 000 dolarů měsíčně na lokaci jen na práci. Pro malou nebo střední firmu jsou to reálné peníze za úkol, ze kterého má každý hrůzu.
Pokud se stále spoléháte na kompletní roční inventury, náš průvodce cyklickým počítáním vysvětluje, jak přejít na méně bolestivou kadenci. Ale i cyklické počítání má svůj strop, když se každá jednotka počítá ručně.
Jak rozpoznávání obrazu počítá zásoby
Na vysoké úrovni je proces přímočarý. Kamera, ať už smartphone, pevná regálová kamera, nebo dron, zachytí snímek položek. Model hlubokého učení analyzuje fotografii, detekuje každý jednotlivý objekt a vrátí celkový počet spolu s vizuálním překryvem, který označuje každou nalezenou položku.
Většina současných systémů používá architektury detekce objektů jako YOLO (You Only Look Once), které dokáží identifikovat a lokalizovat objekty v jediném průchodu obrazem. Studie z roku 2026 publikovaná v Multimedia Tools and Applications od Springeru ukázala, že doladěný model YOLOv11 dosáhl 97% přesnosti počítání v podmínkách skladu, včetně náročných scénářů jako snímky z CCTV s nízkým rozlišením a těžko rozlišitelné bílé role tkaniny.
Výhodou není jen rychlost, ale ověřitelnost. Počítání založené na fotografiích vytváří důkazy: můžete vidět, co model detekoval, ověřit jeho práci a porovnávat výsledky v čase. Ruční počítání dá číslo na podložce. Náš článek o tom, jak strojové učení proměnilo skenování čárových kódů, popisoval podobný posun: přechod od procesů závislých na hardwaru k softwarové inteligenci, která se zlepšuje s každou aktualizací.

Kde to týmy dnes používají
AI skenovací platforma Vimaan zachycuje data o zásobách za méně než 20 sekund na lokaci a zákazníci hlásí cyklické inventury 40krát rychlejší než manuální metody, s úsporami 150 000-200 000 dolarů ročně díky snížení pracnosti a zamezení chybným zásilkám (Vimaan).
Southern Glazer's Wine and Spirits nasadila přes 40 dronů Corvus One v devíti distribučních centrech. Drony absolvovaly 5 000 letů, identifikovaly více než 35 000 ověřených nesrovnalostí a uvolnily 60-70 pracovních hodin týdně na centrum. Provoz přešel z čtvrtletních inventur na dvoutýdenní cykly (Dronelife, březen 2026).
Focal Systems nasazuje kamery na hranách regálů v řetězcích potravin a maloobchodu, skenuje 200 milionů produktů denně s přesností přes 95% a denně detekuje téměř milion událostí vyprodání zásob. Walmart Kanada rozšířil systém na celostátní úroveň po úspěšných pilotech (Focal Systems).
Výrobci trubek používají AI k počítání konců trubek na nákladních autech a ve svazcích, čímž nahrazují pomalé ruční sčítání. Stavby sledují dřevo, výztuž a stohované materiály pomocí modelů detekce objektů natrénovaných na specifických tvarech (Intelgic; MDPI Buildings, 2024).

Co funguje a co ne
Počítání s AI exceluje v konkrétních podmínkách: jeden typ objektu, rozumné osvětlení a položky viditelné z úhlu kamery. Paleta identických krabic, regál s lahvemi, stojan s trubkami nebo řada kartonů jsou ideální cíle.
Ale technologie má jasné limity. Okluze, kdy jsou položky skryté za jinými nebo pod nimi, je největší výzvou. Studie z roku 2025 z University of Adelaide zjistila, že současné modely mají problémy, když jsou objekty částečně zakryté, protože síť kóduje zakrývající povrch místo cíle. Prakticky to znamená: pokud je 30% krabic na paletě blokováno ze zorného pole, počet bude podhodnocen.
Další výzvy v reálném provozu zahrnují smíšené hromady s více typy objektů, hustě zaplněné scény s velkým překrýváním a měnící se úhly nebo osvětlení, které narušují předpoklady modelu. Když týmy nemohou ověřit, proč byl daný výsledek vygenerován, vracejí se k ručním kontrolám a nástroj přidává tření místo toho, aby ho odstraňoval.
Upřímný závěr: počítání s AI je silný nástroj pro namátkové kontroly a rostoucí náhrada rutinních inventur v kontrolovaných podmínkách. Není to univerzální náhrada pro každý scénář počítání, alespoň zatím ne.
Bezplatný způsob, jak to vyzkoušet
Chcete-li vidět, jak počítání z obrazu funguje, než se zavážete k platformě, ZapCount je bezplatný webový nástroj, který počítá objekty z jediné fotografie. Nahrajte obrázek a AI detekuje a spočítá nejviditelnější objekty ve scéně, vrátí celkový počet s vizuálním překryvem označujícím každou detekovanou položku. Žádné nastavení, žádný účet, výsledky za sekundy.
Nejlépe funguje s jedním typem objektu najednou (krabice, lahve, trubky, palety) a zvládne přibližně 900 objektů na snímek. Skryté nebo silně zakryté položky mohou být vynechány, což odpovídá omezením každého systému založeného na vidění. Ale pro rychlou kontrolu ve skladu nebo sčítání na stavbě je to praktický způsob, jak otestovat, zda počítání z obrazu pasuje do vašeho pracovního postupu.
Začněte jednou fotografií
Nemusíte předělávat celý proces počítání, abyste to vyzkoušeli. Vyfoťte dnes jednu paletu, jeden regál nebo jednu hromadu. Pošlete ji přes nástroj pro počítání s AI a porovnejte výsledek s ručním počtem. Ten jediný test vám řekne víc o tom, kam tato technologie zapadá do vašeho provozu, než jakákoli tržní prognóza.
Technologie není dokonalá, ale pro správné případy promění 10minutový úkol ve 3sekundový s fotodůkazem. To stojí za jednu zkoušku.