بازگشت به همه مقالات

شمارش موجودی با هوش مصنوعی: چگونه بازشناسی تصویر بررسی موجودی را سرعت می‌بخشد

شمارش 200 جعبه با دست چند دقیقه طول می‌کشد و تقریبا یک مورد از هر ده را از قلم می‌اندازد. یک دوربین و یک مدل آموزش‌دیده می‌توانند این کار را در چند ثانیه انجام دهند، با یک عکس به عنوان مدرک.

در این مقاله

چه می‌شد اگر شمارش 200 جعبه روی یک پالت به جای 10 دقیقه فقط 3 ثانیه طول می‌کشید؟ این وعده پشت بازشناسی تصویر مبتنی بر هوش مصنوعی برای موجودی است. شما دوربین را نشانه می‌گیرید، یک عکس می‌گیرید و مدلی که روی میلیون‌ها شیء آموزش دیده، تعداد را همراه با یک پوشش بصری برمی‌گرداند که دقیقا نشان می‌دهد چه چیزی شناسایی شده است.

شاید آینده‌نگرانه به نظر برسد، اما این فناوری در حال حاضر در انبارها، فروشگاه‌های خرده‌فروشی و کارگاه‌های ساختمانی کار می‌کند. فاصله بین عملکرد شمارش دستی و شمارش به کمک هوش مصنوعی بیشتر از آن چیزی است که اکثر تیم‌های عملیاتی انتظار دارند.

سیگنال بازار

بازار ردیابی موجودی با بینایی ماشین با نرخ رشد سالانه تقریبا 18 درصد در حال رشد است و پیش‌بینی می‌شود تا سال 2033 به 14 تا 16 میلیارد دلار برسد، به لطف تقاضای تجارت الکترونیک و پیشرفت‌های یادگیری عمیق.

هزینه واقعی شمارش دستی

شمارش دستی دهه‌هاست که روش پیش‌فرض انبارداری بوده و نقاط ضعفش به خوبی مستند شده است. یک شمارشگر انسانی با سرعت عادی تقریبا 91 درصد دقت دارد، یعنی حدود یک اشتباه شمارش در هر 10 قلم. وقتی ورود داده به صفحه‌گسترده هم اضافه شود، نرخ خطا 1 تا 3 درصد دیگر بالا می‌رود.

فراتر از خطاها، هزینه زمانی هم سنگین است. یک شمارش کامل انبار می‌تواند 16 تا 20 ساعت طول بکشد و معمولا نیاز به تعطیلی عملیات برای یک روز کامل دارد. حتی شمارش‌های دوره‌ای جزئی هفته‌ای 5 تا 10 ساعت از وقت کارکنان را می‌گیرد و ماهانه حدود 500 تا 1000 دلار به ازای هر مکان فقط هزینه نیروی کار دارد. برای یک کسب‌وکار کوچک یا متوسط، این پول واقعی است که صرف کاری می‌شود که همه از آن فراری هستند.

اگر هنوز به شمارش‌های سالانه کامل تکیه می‌کنید، راهنمای شمارش دوره‌ای ما توضیح می‌دهد که چگونه به یک چرخه کم‌دردسرتر تغییر دهید. اما حتی شمارش‌های دوره‌ای هم سقفی دارند وقتی هر واحد با دست شمارش می‌شود.

بازشناسی تصویر چگونه موجودی را می‌شمارد

در سطح کلی، فرآیند ساده است. یک دوربین - چه تلفن هوشمند، چه دوربین ثابت قفسه، چه پهپاد - تصویری از اقلام می‌گیرد. یک مدل یادگیری عمیق عکس را تحلیل می‌کند، هر شیء مجزا را شناسایی می‌کند و تعداد کل را همراه با یک پوشش بصری که هر قلم شناسایی‌شده را علامت‌گذاری کرده برمی‌گرداند.

اکثر سیستم‌های مدرن از معماری‌های تشخیص اشیاء مانند YOLO (فقط یک بار نگاه کن) استفاده می‌کنند که می‌توانند اشیاء را در یک پاس واحد از تصویر شناسایی و مکان‌یابی کنند. یک مطالعه 2026 منتشرشده در Springer Multimedia Tools and Applications نشان داد که یک مدل YOLOv11 تنظیم‌شده در شرایط انبار به 97 درصد دقت شمارش دست یافته، از جمله در سناریوهای چالش‌برانگیزی مانند تصاویر CCTV با وضوح پایین و رول‌های پارچه سفید که تشخیصشان دشوار است.

مزیت فقط سرعت نیست. قابلیت تایید است. شمارش مبتنی بر عکس مدرک تولید می‌کند: می‌توانید ببینید مدل چه چیزی را شناسایی کرده، کارش را بررسی کنید و نتایج را در طول زمان مقایسه کنید. شمارش دستی فقط یک عدد روی کاغذ تولید می‌کند. مقاله ما درباره چگونه یادگیری ماشین اسکن بارکد را متحول کرد تغییر مشابهی را پوشش داد: حرکت از فرآیندهای وابسته به سخت‌افزار به هوش نرم‌افزاری که با هر به‌روزرسانی بهبود می‌یابد.

صفحه تلفن هوشمند که پوشش تشخیص هوش مصنوعی را با نشانگرهای رنگی روی هر جعبه در یک استک پالت انبار نشان می‌دهد.
مدل‌های هوش مصنوعی تعداد به همراه یک پوشش بصری برمی‌گردانند تا بتوانید دقیقا تایید کنید چه چیزی شناسایی شده است.

تیم‌ها امروز کجا از آن استفاده می‌کنند

شمارش‌های دوره‌ای انبار

پلتفرم اسکن هوش مصنوعی Vimaan داده‌های موجودی را در کمتر از 20 ثانیه به ازای هر موقعیت ثبت می‌کند و مشتریان گزارش می‌دهند شمارش‌های دوره‌ای 40 برابر سریع‌تر از روش‌های دستی انجام می‌شود و سالانه 150,000 تا 200,000 دلار در کاهش نیروی کار و جلوگیری از ارسال اشتباه صرفه‌جویی می‌شود (Vimaan).

پهپادهای خودمختار

شرکت Southern Glazer's Wine and Spirits بیش از 40 پهپاد Corvus One را در نه مرکز توزیع مستقر کرد. پهپادها 5,000 پرواز انجام دادند، بیش از 35,000 مغایرت تاییدشده شناسایی کردند و هفته‌ای 60 تا 70 ساعت نیروی کار به ازای هر سایت آزاد شد. عملیات از شمارش‌های فصلی به چرخه‌های دوهفته‌ای تغییر کرد (Dronelife، مارس 2026).

ممیزی قفسه خرده‌فروشی

شرکت Focal Systems دوربین‌های لبه قفسه را در زنجیره‌های خواربارفروشی و خرده‌فروشی مستقر کرده که روزانه 200 میلیون محصول را با دقت بیش از 95 درصد اسکن می‌کنند و روزانه نزدیک به یک میلیون رویداد کمبود موجودی شناسایی می‌کنند. Walmart Canada پس از آزمایش‌های موفق، سیستم را به فروشگاه‌های سراسر کشور گسترش داد (Focal Systems).

ساختمان و صنعت

تولیدکنندگان لوله از هوش مصنوعی برای شمارش سر لوله‌ها روی کامیون‌ها و در بسته‌ها استفاده می‌کنند و جایگزین شمارش‌های دستی کند شده‌اند. کارگاه‌های ساختمانی الوار، میلگرد و مصالح انباشته را با مدل‌های تشخیص اشیاء آموزش‌دیده بر اشکال خاص ردیابی می‌کنند (Intelgic؛ MDPI Buildings، 2024).

پهپاد خودمختار در حال پرواز در راهروی انبار بلند، اسکن پالت‌ها روی قفسه‌های بلند با دوربین روی بدنه.
پهپادهای خودمختار ساعتی صدها موقعیت پالت را بدون وقفه در عملیات انبار اسکن می‌کنند.

چه چیزی کار می‌کند و چه چیزی نه

شمارش با هوش مصنوعی در شرایط خاصی عالی عمل می‌کند: یک نوع شیء واحد، نور مناسب و اقلامی که از زاویه دوربین قابل مشاهده باشند. یک پالت جعبه‌های یکسان، یک قفسه بطری، یک قفسه لوله یا یک ردیف کارتن اهداف ایده‌آل هستند.

اما فناوری محدودیت‌های روشنی دارد. انسداد - جایی که اقلام پشت یا زیر اقلام دیگر پنهان شده‌اند - بزرگ‌ترین چالش است. یک مطالعه 2025 از دانشگاه آدلاید نشان داد که مدل‌های فعلی زمانی که اشیاء تا حدی پنهان هستند دچار مشکل می‌شوند، زیرا شبکه سطح مسدودکننده را رمزگذاری می‌کند نه هدف را. به زبان عملی: اگر 30 درصد جعبه‌های یک پالت از دید پنهان باشند، شمارش کمتر از واقع گزارش خواهد شد.

چالش‌های دنیای واقعی دیگر شامل انباشته‌های مختلط با چند نوع شیء، صحنه‌های متراکم که اقلام به شدت همپوشانی دارند و زوایا یا نور متغیری است که فرضیات مدل را نقض می‌کنند. وقتی تیم‌ها نمی‌توانند تایید کنند چرا یک عدد تولید شده، به بررسی دستی بازمی‌گردند و ابزار به جای حذف اصطکاک، اصطکاک اضافه می‌کند.

نتیجه صادقانه: شمارش با هوش مصنوعی ابزار قدرتمندی برای بررسی‌های سریع و جایگزین رو به رشدی برای شمارش‌های روتین در شرایط کنترل‌شده است. هنوز جایگزین جهانی برای هر سناریوی شمارش نیست، حداقل فعلا نه.

یک راه رایگان برای آزمایش

اگر می‌خواهید ببینید شمارش مبتنی بر تصویر چگونه کار می‌کند قبل از تعهد به یک پلتفرم، ZapCount یک ابزار رایگان و مبتنی بر وب است که اشیاء را از یک عکس می‌شمارد. تصویری آپلود کنید و هوش مصنوعی برجسته‌ترین اشیاء صحنه را شناسایی و می‌شمارد و تعداد کل را با پوشش بصری روی هر قلم شناسایی‌شده برمی‌گرداند. بدون نصب، بدون حساب کاربری، نتیجه در چند ثانیه.

بهترین عملکرد را با یک نوع شیء در هر بار دارد (جعبه‌ها، بطری‌ها، لوله‌ها، پالت‌ها) و تا حدود 900 شیء در هر تصویر را پوشش می‌دهد. اقلام پنهان یا به شدت مسدودشده ممکن است از قلم بیفتند، که با محدودیت‌های هر سیستم مبتنی بر بینایی سازگار است. اما برای یک بررسی سریع انبار یا شمارش مصالح کارگاه ساختمانی، راهی عملی برای آزمایش این است که آیا شمارش تصویری با جریان کار شما سازگار است یا نه.

با یک عکس شروع کنید

لازم نیست فرآیند شمارش خود را دگرگون کنید تا این را آزمایش کنید. امروز از یک پالت، یک قفسه یا یک استک عکس بگیرید. آن را از طریق یک ابزار شمارش هوش مصنوعی اجرا کنید و نتیجه را با شمارش دستی مقایسه کنید. همان یک آزمایش بیشتر از هر پیش‌بینی بازار درباره جایگاه این فناوری در عملیات شما خواهد گفت.

فناوری کامل نیست، اما برای موارد استفاده مناسب، یک کار 10 دقیقه‌ای را به کاری 3 ثانیه‌ای با رسید عکسی تبدیل می‌کند. این ارزش یک آزمایش را دارد.

مقالات مرتبط

راهنماهای جدید برای تیم‌های موجودی و اپراتورها.

نحوه چاپ انبوه برچسب بارکد: راهنمای گام به گام

محصولات جدید می‌رسند، قفسه‌ها به برچسب نیاز دارند و کسی وقت ندارد آن‌ها را یکی یکی طراحی کند. این راهنما گردش کار کامل چاپ صدها یا هزاران برچسب بارکد از یک صفحه‌گسترده را به شما نشان می‌دهد.

امنیت بارکد دوبعدی GS1: مشتری شما اکنون اسکنر است

ریسک بزرگ GS1 2D فقط اتفاقی که در انبار می‌افتد نیست. مسئله این است که وقتی مشتری بسته را با دوربین عادی تلفنش اسکن می‌کند و در صفحه‌ای اشتباه فرود می‌آید چه اتفاقی می‌افتد.