چه میشد اگر شمارش 200 جعبه روی یک پالت به جای 10 دقیقه فقط 3 ثانیه طول میکشید؟ این وعده پشت بازشناسی تصویر مبتنی بر هوش مصنوعی برای موجودی است. شما دوربین را نشانه میگیرید، یک عکس میگیرید و مدلی که روی میلیونها شیء آموزش دیده، تعداد را همراه با یک پوشش بصری برمیگرداند که دقیقا نشان میدهد چه چیزی شناسایی شده است.
شاید آیندهنگرانه به نظر برسد، اما این فناوری در حال حاضر در انبارها، فروشگاههای خردهفروشی و کارگاههای ساختمانی کار میکند. فاصله بین عملکرد شمارش دستی و شمارش به کمک هوش مصنوعی بیشتر از آن چیزی است که اکثر تیمهای عملیاتی انتظار دارند.
بازار ردیابی موجودی با بینایی ماشین با نرخ رشد سالانه تقریبا 18 درصد در حال رشد است و پیشبینی میشود تا سال 2033 به 14 تا 16 میلیارد دلار برسد، به لطف تقاضای تجارت الکترونیک و پیشرفتهای یادگیری عمیق.
هزینه واقعی شمارش دستی
شمارش دستی دهههاست که روش پیشفرض انبارداری بوده و نقاط ضعفش به خوبی مستند شده است. یک شمارشگر انسانی با سرعت عادی تقریبا 91 درصد دقت دارد، یعنی حدود یک اشتباه شمارش در هر 10 قلم. وقتی ورود داده به صفحهگسترده هم اضافه شود، نرخ خطا 1 تا 3 درصد دیگر بالا میرود.
فراتر از خطاها، هزینه زمانی هم سنگین است. یک شمارش کامل انبار میتواند 16 تا 20 ساعت طول بکشد و معمولا نیاز به تعطیلی عملیات برای یک روز کامل دارد. حتی شمارشهای دورهای جزئی هفتهای 5 تا 10 ساعت از وقت کارکنان را میگیرد و ماهانه حدود 500 تا 1000 دلار به ازای هر مکان فقط هزینه نیروی کار دارد. برای یک کسبوکار کوچک یا متوسط، این پول واقعی است که صرف کاری میشود که همه از آن فراری هستند.
اگر هنوز به شمارشهای سالانه کامل تکیه میکنید، راهنمای شمارش دورهای ما توضیح میدهد که چگونه به یک چرخه کمدردسرتر تغییر دهید. اما حتی شمارشهای دورهای هم سقفی دارند وقتی هر واحد با دست شمارش میشود.
بازشناسی تصویر چگونه موجودی را میشمارد
در سطح کلی، فرآیند ساده است. یک دوربین - چه تلفن هوشمند، چه دوربین ثابت قفسه، چه پهپاد - تصویری از اقلام میگیرد. یک مدل یادگیری عمیق عکس را تحلیل میکند، هر شیء مجزا را شناسایی میکند و تعداد کل را همراه با یک پوشش بصری که هر قلم شناساییشده را علامتگذاری کرده برمیگرداند.
اکثر سیستمهای مدرن از معماریهای تشخیص اشیاء مانند YOLO (فقط یک بار نگاه کن) استفاده میکنند که میتوانند اشیاء را در یک پاس واحد از تصویر شناسایی و مکانیابی کنند. یک مطالعه 2026 منتشرشده در Springer Multimedia Tools and Applications نشان داد که یک مدل YOLOv11 تنظیمشده در شرایط انبار به 97 درصد دقت شمارش دست یافته، از جمله در سناریوهای چالشبرانگیزی مانند تصاویر CCTV با وضوح پایین و رولهای پارچه سفید که تشخیصشان دشوار است.
مزیت فقط سرعت نیست. قابلیت تایید است. شمارش مبتنی بر عکس مدرک تولید میکند: میتوانید ببینید مدل چه چیزی را شناسایی کرده، کارش را بررسی کنید و نتایج را در طول زمان مقایسه کنید. شمارش دستی فقط یک عدد روی کاغذ تولید میکند. مقاله ما درباره چگونه یادگیری ماشین اسکن بارکد را متحول کرد تغییر مشابهی را پوشش داد: حرکت از فرآیندهای وابسته به سختافزار به هوش نرمافزاری که با هر بهروزرسانی بهبود مییابد.

تیمها امروز کجا از آن استفاده میکنند
پلتفرم اسکن هوش مصنوعی Vimaan دادههای موجودی را در کمتر از 20 ثانیه به ازای هر موقعیت ثبت میکند و مشتریان گزارش میدهند شمارشهای دورهای 40 برابر سریعتر از روشهای دستی انجام میشود و سالانه 150,000 تا 200,000 دلار در کاهش نیروی کار و جلوگیری از ارسال اشتباه صرفهجویی میشود (Vimaan).
شرکت Southern Glazer's Wine and Spirits بیش از 40 پهپاد Corvus One را در نه مرکز توزیع مستقر کرد. پهپادها 5,000 پرواز انجام دادند، بیش از 35,000 مغایرت تاییدشده شناسایی کردند و هفتهای 60 تا 70 ساعت نیروی کار به ازای هر سایت آزاد شد. عملیات از شمارشهای فصلی به چرخههای دوهفتهای تغییر کرد (Dronelife، مارس 2026).
شرکت Focal Systems دوربینهای لبه قفسه را در زنجیرههای خواربارفروشی و خردهفروشی مستقر کرده که روزانه 200 میلیون محصول را با دقت بیش از 95 درصد اسکن میکنند و روزانه نزدیک به یک میلیون رویداد کمبود موجودی شناسایی میکنند. Walmart Canada پس از آزمایشهای موفق، سیستم را به فروشگاههای سراسر کشور گسترش داد (Focal Systems).
تولیدکنندگان لوله از هوش مصنوعی برای شمارش سر لولهها روی کامیونها و در بستهها استفاده میکنند و جایگزین شمارشهای دستی کند شدهاند. کارگاههای ساختمانی الوار، میلگرد و مصالح انباشته را با مدلهای تشخیص اشیاء آموزشدیده بر اشکال خاص ردیابی میکنند (Intelgic؛ MDPI Buildings، 2024).

چه چیزی کار میکند و چه چیزی نه
شمارش با هوش مصنوعی در شرایط خاصی عالی عمل میکند: یک نوع شیء واحد، نور مناسب و اقلامی که از زاویه دوربین قابل مشاهده باشند. یک پالت جعبههای یکسان، یک قفسه بطری، یک قفسه لوله یا یک ردیف کارتن اهداف ایدهآل هستند.
اما فناوری محدودیتهای روشنی دارد. انسداد - جایی که اقلام پشت یا زیر اقلام دیگر پنهان شدهاند - بزرگترین چالش است. یک مطالعه 2025 از دانشگاه آدلاید نشان داد که مدلهای فعلی زمانی که اشیاء تا حدی پنهان هستند دچار مشکل میشوند، زیرا شبکه سطح مسدودکننده را رمزگذاری میکند نه هدف را. به زبان عملی: اگر 30 درصد جعبههای یک پالت از دید پنهان باشند، شمارش کمتر از واقع گزارش خواهد شد.
چالشهای دنیای واقعی دیگر شامل انباشتههای مختلط با چند نوع شیء، صحنههای متراکم که اقلام به شدت همپوشانی دارند و زوایا یا نور متغیری است که فرضیات مدل را نقض میکنند. وقتی تیمها نمیتوانند تایید کنند چرا یک عدد تولید شده، به بررسی دستی بازمیگردند و ابزار به جای حذف اصطکاک، اصطکاک اضافه میکند.
نتیجه صادقانه: شمارش با هوش مصنوعی ابزار قدرتمندی برای بررسیهای سریع و جایگزین رو به رشدی برای شمارشهای روتین در شرایط کنترلشده است. هنوز جایگزین جهانی برای هر سناریوی شمارش نیست، حداقل فعلا نه.
یک راه رایگان برای آزمایش
اگر میخواهید ببینید شمارش مبتنی بر تصویر چگونه کار میکند قبل از تعهد به یک پلتفرم، ZapCount یک ابزار رایگان و مبتنی بر وب است که اشیاء را از یک عکس میشمارد. تصویری آپلود کنید و هوش مصنوعی برجستهترین اشیاء صحنه را شناسایی و میشمارد و تعداد کل را با پوشش بصری روی هر قلم شناساییشده برمیگرداند. بدون نصب، بدون حساب کاربری، نتیجه در چند ثانیه.
بهترین عملکرد را با یک نوع شیء در هر بار دارد (جعبهها، بطریها، لولهها، پالتها) و تا حدود 900 شیء در هر تصویر را پوشش میدهد. اقلام پنهان یا به شدت مسدودشده ممکن است از قلم بیفتند، که با محدودیتهای هر سیستم مبتنی بر بینایی سازگار است. اما برای یک بررسی سریع انبار یا شمارش مصالح کارگاه ساختمانی، راهی عملی برای آزمایش این است که آیا شمارش تصویری با جریان کار شما سازگار است یا نه.
با یک عکس شروع کنید
لازم نیست فرآیند شمارش خود را دگرگون کنید تا این را آزمایش کنید. امروز از یک پالت، یک قفسه یا یک استک عکس بگیرید. آن را از طریق یک ابزار شمارش هوش مصنوعی اجرا کنید و نتیجه را با شمارش دستی مقایسه کنید. همان یک آزمایش بیشتر از هر پیشبینی بازار درباره جایگاه این فناوری در عملیات شما خواهد گفت.
فناوری کامل نیست، اما برای موارد استفاده مناسب، یک کار 10 دقیقهای را به کاری 3 ثانیهای با رسید عکسی تبدیل میکند. این ارزش یک آزمایش را دارد.