ماذا لو استغرق عد 200 صندوق على طبلية 3 ثوان بدلا من 10 دقائق؟ هذا هو الوعد وراء التعرف على الصور بالذكاء الاصطناعي المطبق على المخزون. توجه الكاميرا، تلتقط صورة، ويعيد نموذج مدرب على ملايين العناصر عدا مع تراكب بصري يوضح بالضبط ما اكتشفه.
يبدو الأمر مستقبليا، لكن التقنية تعمل فعلا في المستودعات ومتاجر التجزئة وساحات البناء. الفجوة بين أداء العد اليدوي والعد بمساعدة الذكاء الاصطناعي أوسع مما تتوقعه معظم فرق العمليات.
سوق تتبع المخزون بالرؤية الحاسوبية ينمو بمعدل سنوي مركب يقارب 18% ويتوقع أن يصل إلى 14 حتى 16 مليار دولار بحلول 2033، مدفوعا بالطلب على التجارة الإلكترونية والتقدم في التعلم العميق.
التكلفة الحقيقية للعد اليدوي
العد اليدوي كان الأسلوب الافتراضي في المستودعات لعقود، ونقاط ضعفه موثقة جيدا. عامل العد بسرعة عادية يحقق دقة تقارب 91%، أي نحو خطأ واحد لكل 10 عناصر. وعند إضافة إدخال البيانات في جدول بيانات، ترتفع نسبة الخطأ بمقدار 1 إلى 3 بالمئة أخرى.
فوق الأخطاء، تكلفة الوقت مؤلمة. الجرد الكامل للمستودع قد يستغرق 16 إلى 20 ساعة ويتطلب عادة إيقاف العمليات ليوم كامل. حتى دورات العد الجزئي تستهلك 5 إلى 10 ساعات أسبوعيا من وقت الموظفين، بتكلفة تقارب 500 إلى 1,000 دولار شهريا لكل موقع في الأجور وحدها. بالنسبة لمنشأة صغيرة أو متوسطة، هذا مال حقيقي ينفق على مهمة يخشاها الجميع.
إذا كنت لا تزال تعتمد على الجرد السنوي الشامل، فإن دليل العد الدوري يشرح كيفية الانتقال إلى وتيرة أقل إيلاما. لكن حتى العد الدوري له سقف عندما تعد كل وحدة يدويا.
كيف يعد التعرف على الصور المخزون
على المستوى العام، العملية بسيطة. كاميرا - سواء هاتف ذكي أو كاميرا رف ثابتة أو طائرة مسيرة - تلتقط صورة للعناصر. نموذج تعلم عميق يحلل الصورة، يكشف كل عنصر على حدة، ويعيد العدد الإجمالي مع تراكب بصري يعلم كل عنصر تم رصده.
معظم الأنظمة الحديثة تستخدم بنيات كشف الأجسام مثل YOLO (تنظر مرة واحدة فقط)، والتي تستطيع تحديد الأجسام وتوقيعها في تمريرة واحدة على الصورة. دراسة عام 2026 نشرت في Multimedia Tools and Applications من Springer أظهرت أن نموذج YOLOv11 المضبوط حقق دقة عد 97% في ظروف المستودعات، بما في ذلك سيناريوهات صعبة مثل لقطات CCTV منخفضة الدقة ولفائف قماش بيضاء يصعب تمييزها.
الميزة ليست السرعة فحسب، بل قابلية التحقق. العد المبني على الصور ينتج دليلا: يمكنك رؤية ما اكتشفه النموذج، مراجعة عمله، ومقارنة النتائج بمرور الوقت. العد اليدوي ينتج رقما على ورقة. مقالنا عن كيف غير التعلم الآلي مسح الباركود غطى تحولا مشابها: الانتقال من عمليات تعتمد على الأجهزة إلى ذكاء برمجي يتحسن مع كل تحديث.

أين تستخدمه الفرق اليوم
منصة المسح بالذكاء الاصطناعي من Vimaan تلتقط بيانات المخزون في أقل من 20 ثانية لكل موقع، ويفيد العملاء بعمليات عد دورية أسرع 40 مرة من الطرق اليدوية، مع توفير يتراوح بين 150,000 و200,000 دولار سنويا في العمالة المخفضة والشحنات الخاطئة المتجنبة (Vimaan).
نشرت Southern Glazer's Wine and Spirits أكثر من 40 طائرة Corvus One في تسعة مراكز توزيع. أنجزت الطائرات 5,000 رحلة وحددت أكثر من 35,000 تباين موثق وحررت 60 إلى 70 ساعة عمل أسبوعيا لكل موقع. انتقلت العملية من جرد ربع سنوي إلى دورات نصف شهرية (Dronelife, مارس 2026).
تنشر Focal Systems كاميرات على حافة الرف في سلاسل البقالة والتجزئة، تمسح 200 مليون منتج يوميا بدقة تتجاوز 95% وتكتشف قرابة مليون حدث نفاد مخزون يوميا. وسعت Walmart Canada النظام ليشمل متاجرها على مستوى البلاد بعد تجارب ناجحة (Focal Systems).
يستخدم مصنعو الأنابيب الذكاء الاصطناعي لعد أطراف الأنابيب على الشاحنات وفي الحزم، بديلا عن العد اليدوي البطيء. تتابع مواقع البناء الأخشاب وحديد التسليح والمواد المكدسة بنماذج كشف أجسام مدربة على أشكال محددة (Intelgic; MDPI Buildings, 2024).

ما الذي يعمل وما الذي لا يعمل
يتفوق العد بالذكاء الاصطناعي في ظروف محددة: نوع واحد من الأجسام، إضاءة معقولة، وعناصر مرئية من زاوية الكاميرا. طبلية صناديق متطابقة، رف زجاجات، حامل أنابيب، أو صف كراتين تمثل أهدافا مثالية.
لكن للتقنية حدودا واضحة. الحجب، حين تكون العناصر مخفية خلف أو تحت عناصر أخرى، هو التحدي الأكبر. دراسة عام 2025 من جامعة أديلايد وجدت أن النماذج الحالية تواجه صعوبة عندما تكون الأجسام مخفية جزئيا لأن الشبكة تشفر السطح الحاجب بدلا من الهدف. عمليا: إذا كان 30% من صناديق الطبلية محجوبا عن الرؤية، سيكون العد أقل من الواقع.
تشمل التحديات الميدانية الأخرى أكوام مختلطة بأنواع متعددة من الأجسام، ومشاهد كثيفة يتداخل فيها العناصر بشدة، وزوايا أو إضاءة متغيرة تكسر افتراضات النموذج. عندما لا تستطيع الفرق التحقق من سبب ظهور رقم معين، تعود إلى الفحص اليدوي وتضيف الأداة احتكاكا بدلا من إزالته.
الخلاصة الصادقة: العد بالذكاء الاصطناعي أداة فحص فوري قوية وبديل متنام للعد الروتيني في ظروف محكومة. لكنه ليس بديلا شاملا لكل سيناريوهات العد، على الأقل ليس بعد.
طريقة مجانية لتجربته
إذا كنت تريد رؤية كيف يعمل العد بالصور قبل الالتزام بمنصة ما، فإن ZapCount أداة مجانية على الويب تعد الأجسام من صورة واحدة. ارفع صورة والذكاء الاصطناعي يكتشف ويعد أبرز العناصر في المشهد، ويعيد العدد الإجمالي مع تراكب بصري يعلم كل عنصر تم اكتشافه. بدون إعداد، بدون حساب، نتائج في ثوان.
يعمل بأفضل شكل مع نوع واحد من الأجسام في المرة الواحدة (صناديق، زجاجات، أنابيب، طبليات) ويتعامل مع ما يقارب 900 جسم لكل صورة. العناصر المخفية أو المحجوبة بشدة قد تفوت، وهو ما يتوافق مع قيود أي نظام قائم على الرؤية. لكن لفحص سريع في المستودع أو عد في موقع بناء، إنها طريقة عملية لاختبار ما إذا كان العد بالصور يناسب سير عملك.
ابدأ بصورة واحدة
لا تحتاج إلى إعادة هيكلة عملية العد لتجربة هذا. التقط صورة لطبلية واحدة أو رف أو كومة اليوم. مررها عبر أداة عد بالذكاء الاصطناعي وقارن النتيجة بعد يدوي. هذا الاختبار الوحيد سيخبرك عن مكان هذه التقنية في عملياتك أكثر من أي توقع سوقي.
التقنية ليست مثالية، لكن لحالات الاستخدام المناسبة، تحول مهمة 10 دقائق إلى مهمة 3 ثوان مع إيصال مصور. هذا يستحق تجربة واحدة.