Nếu đếm 200 thùng trên một pallet chỉ mất 3 giây thay vì 10 phút thì sao? Đó là lời hứa của nhận dạng hình ảnh bằng AI áp dụng vào kiểm kê. Bạn chỉ cần hướng camera, chụp một bức ảnh, và một mô hình đã được huấn luyện trên hàng triệu vật thể sẽ trả về số lượng kèm lớp phủ trực quan hiển thị chính xác những gì nó phát hiện được.
Nghe có vẻ viễn tưởng, nhưng công nghệ này đã vận hành trong các nhà kho, cửa hàng bán lẻ và công trường xây dựng. Khoảng cách giữa hiệu suất đếm tay và đếm hỗ trợ bởi AI rộng hơn nhiều so với kỳ vọng của hầu hết các đội vận hành.
Thị trường theo dõi hàng tồn kho bằng thị giác máy tính đang tăng trưởng khoảng 18% CAGR và dự kiến đạt 14 đến 16 tỷ USD vào năm 2033, được thúc đẩy bởi nhu cầu thương mại điện tử và tiến bộ trong học sâu.
Chi phí thực sự của việc đếm bằng tay
Đếm tay đã là phương pháp mặc định trong kho hàng suốt nhiều thập kỷ, và những điểm yếu của nó đã được ghi nhận rõ ràng. Một người đếm làm việc ở tốc độ bình thường đạt khoảng 91% độ chính xác, nghĩa là cứ 10 mặt hàng thì sai khoảng một. Thêm bước nhập liệu vào bảng tính, tỷ lệ lỗi tăng thêm 1 đến 3 phần trăm.
Ngoài sai sót, chi phí thời gian cũng rất lớn. Một lần kiểm kê toàn bộ kho có thể mất 16 đến 20 giờ và thường phải dừng hoạt động cả ngày. Ngay cả kiểm đếm theo chu kỳ cũng tiêu tốn 5 đến 10 giờ mỗi tuần cho nhân sự, tương đương khoảng 500 đến 1.000 USD mỗi tháng mỗi địa điểm chỉ riêng tiền công. Với doanh nghiệp vừa và nhỏ, đó là số tiền thực dành cho một công việc ai cũng ngại.
Nếu bạn vẫn dựa vào kiểm kê toàn bộ hàng năm, hướng dẫn kiểm đếm theo chu kỳ của chúng tôi trình bày cách chuyển sang nhịp độ ít đau đớn hơn. Nhưng ngay cả kiểm đếm theo chu kỳ cũng có giới hạn khi mỗi đơn vị đều được đếm bằng tay.
Cách nhận dạng hình ảnh đếm hàng tồn kho
Nhìn tổng thể, quy trình khá đơn giản. Một camera - dù là điện thoại thông minh, camera cố định trên kệ, hay drone - chụp ảnh các mặt hàng. Một mô hình học sâu phân tích bức ảnh, phát hiện từng vật thể riêng lẻ, và trả về tổng số kèm lớp phủ trực quan đánh dấu mỗi mặt hàng tìm được.
Hầu hết các hệ thống hiện đại sử dụng kiến trúc phát hiện vật thể như YOLO (You Only Look Once), có thể nhận diện và định vị vật thể chỉ trong một lần quét qua ảnh. Một nghiên cứu năm 2026 công bố trên Multimedia Tools and Applications của Springer cho thấy mô hình YOLOv11 tinh chỉnh đạt 97% độ chính xác khi đếm trong điều kiện kho, bao gồm các tình huống khó như ảnh CCTV độ phân giải thấp và cuộn vải trắng khó phân biệt.
Lợi thế không chỉ là tốc độ mà còn là khả năng xác minh. Một lần đếm dựa trên ảnh tạo ra bằng chứng: bạn có thể thấy mô hình đã phát hiện gì, kiểm tra kết quả và so sánh theo thời gian. Đếm tay chỉ tạo ra một con số trên bảng kẹp. Bài viết của chúng tôi về cách học máy đã thay đổi quét mã vạch đề cập một sự chuyển đổi tương tự: từ quy trình phụ thuộc phần cứng sang trí tuệ phần mềm cải thiện với mỗi bản cập nhật.

Các đội đang sử dụng ở đâu hiện nay
Nền tảng quét AI của Vimaan thu thập dữ liệu tồn kho trong chưa đầy 20 giây mỗi vị trí, khách hàng cho biết kiểm đếm theo chu kỳ nhanh hơn 40 lần so với phương pháp thủ công, tiết kiệm 150.000 đến 200.000 USD mỗi năm nhờ giảm nhân công và tránh giao sai hàng (Vimaan).
Southern Glazer's Wine and Spirits triển khai hơn 40 drone Corvus One tại chín trung tâm phân phối. Các drone hoàn thành 5.000 chuyến bay, xác định hơn 35.000 sai lệch đã xác minh, và giải phóng 60 đến 70 giờ lao động mỗi tuần mỗi cơ sở. Quy trình chuyển từ kiểm kê hàng quý sang chu kỳ hai tuần (Dronelife, tháng 3 năm 2026).
Focal Systems triển khai camera ở mép kệ trong các chuỗi tạp hóa và bán lẻ, quét 200 triệu sản phẩm mỗi ngày với độ chính xác trên 95% và phát hiện gần một triệu sự kiện hết hàng mỗi ngày. Walmart Canada đã mở rộng hệ thống ra toàn quốc sau các đợt thử nghiệm thành công (Focal Systems).
Các nhà sản xuất ống sử dụng AI để đếm đầu ống trên xe tải và trong bó, thay thế đếm tay chậm chạp. Các công trường theo dõi gỗ, thép thanh và vật liệu xếp chồng bằng mô hình phát hiện vật thể được huấn luyện trên các hình dạng cụ thể (Intelgic; MDPI Buildings, 2024).

Điều gì hiệu quả và điều gì chưa
Đếm bằng AI phát huy tốt nhất trong điều kiện cụ thể: một loại vật thể duy nhất, ánh sáng hợp lý, và các mặt hàng có thể nhìn thấy từ góc camera. Một pallet chứa các thùng giống nhau, một kệ chai, một giá ống, hoặc một hàng thùng carton là những mục tiêu lý tưởng.
Nhưng công nghệ này có giới hạn rõ ràng. Che khuất - khi các mặt hàng bị ẩn sau hoặc bên dưới vật khác - là thách thức lớn nhất. Một nghiên cứu năm 2025 từ Đại học Adelaide phát hiện rằng các mô hình hiện tại gặp khó khi vật thể bị che khuất một phần vì mạng mã hóa bề mặt che khuất thay vì vật thể mục tiêu. Nói cách thực tế: nếu 30% thùng trên pallet bị che khuất tầm nhìn, kết quả đếm sẽ thiếu.
Các thách thức thực tế khác bao gồm đống hỗn hợp với nhiều loại vật thể, cảnh dày đặc nơi các mặt hàng chồng chéo nhiều, và góc chụp hoặc ánh sáng thay đổi phá vỡ các giả định của mô hình. Khi đội ngũ không thể xác minh tại sao một con số được tạo ra, họ quay lại kiểm tra thủ công, và công cụ thêm rào cản thay vì loại bỏ nó.
Kết luận thực tế: đếm bằng AI là công cụ kiểm tra điểm mạnh mẽ và ngày càng thay thế kiểm đếm thường xuyên trong điều kiện kiểm soát. Nó chưa phải giải pháp thay thế toàn diện cho mọi tình huống đếm, ít nhất là hiện tại.
Cách dùng thử miễn phí
Nếu bạn muốn xem đếm dựa trên hình ảnh hoạt động thế nào trước khi cam kết với một nền tảng, ZapCount là công cụ miễn phí trên web giúp đếm vật thể từ một bức ảnh. Tải ảnh lên và AI sẽ phát hiện, đếm các vật thể nổi bật nhất trong cảnh, trả về tổng số kèm lớp phủ trực quan đánh dấu từng mặt hàng được phát hiện. Không cần cài đặt, không cần tài khoản, kết quả trong vài giây.
Công cụ hoạt động tốt nhất với một loại vật thể cùng lúc (thùng, chai, ống, pallet) và xử lý được khoảng 900 vật thể mỗi ảnh. Các mặt hàng ẩn hoặc bị che khuất nhiều có thể bị bỏ sót, điều này phù hợp với giới hạn của mọi hệ thống dựa trên thị giác. Nhưng để kiểm tra nhanh trong kho hoặc kiểm đếm tại công trường, đây là cách thực tế để thử xem đếm bằng hình ảnh có phù hợp với quy trình của bạn không.
Bắt đầu với một bức ảnh
Bạn không cần thay đổi toàn bộ quy trình đếm để thử nghiệm. Hãy chụp một bức ảnh của một pallet, một kệ, hoặc một chồng hàng ngay hôm nay. Chạy qua một công cụ đếm AI và so sánh kết quả với đếm tay. Chỉ một lần thử đó sẽ cho bạn biết nhiều hơn về vị trí của công nghệ này trong quy trình vận hành so với bất kỳ dự báo thị trường nào.
Công nghệ chưa hoàn hảo, nhưng với những trường hợp phù hợp, nó biến công việc 10 phút thành 3 giây kèm biên nhận bằng ảnh. Điều đó đáng để thử một lần.