Компьютерное зрение в ритейле — уже не хайп, а реальные инвестиции, которые окупаются и приносят пользу: сокращают время аудита торговых точек и повышают процент соблюдения планограмм. Но в то же время, такие проекты еще не стали массовым явлением. 

В статье разберем, зачем компаниям компьютерное зрение, как работает компьютерное зрение в мерчандайзинге, как происходит его внедрение и можно ли реализовать проект за несколько недель.

Зачем компании внедряют компьютерное зрение

Why Companies are Adopting Computer Vision

Конечный клиент FMCG-компаний — это человек, который после работы забегает за продуктами или тратит свободное время на покупки. Так или иначе, покупатель хочет быстрее найти все товары и заняться своими делами. Поэтому товар всегда должен быть выставлен на полке в магазине и его должно быть легко найти. 

И здесь возникают боли большинства FMCG-компаний: товар отсутствует на полках, выкладка не соответствует планограмме, нет POS-материалов, ценники перепутаны. Все эти моменты необходимо контролировать. 

Чаще всего компании делают это вручную. Приходит мерчандайзер и проводит аудит торговой точки: сверяет выкладку с планограммой, поправляет расположение SKU, POS-материалы, ценники. Фотографирует и отправляет снимок супервайзеру. После проверяет остатки на складах, заполняет отчет по торговой точке и направляется в следующую. Таких точек в день несколько. В этом процессе несколько моментов, которые снижают его эффективность:

  • ручная сверка выкладки с планограммой,
  • ручная сверка POS-материалов и ценников,
  • ручная обработка супервайзером сотен фотографий.

В результате возникают несколько проблем: ошибки “человеческого фактора” и сотни  необработанных фотографий от мерчандайзеров, так как супервайзеры физически не успевают все оценить. Соответственно, руководство получает неполные и устаревшие аналитические данные, на основе которых принимает управленческие решения. Это может привести к снижению продаж и потере прибыли. 

Чтобы избежать всех этих проблем и увидеть реальную ситуацию на полках магазинов, компании внедряют автоматизацию процессов мерчандайзинга. И компьютерное зрение — одно из решений, которое помогает оптимизировать и свести к минимуму ручные операции в этом процессе.

Как происходит внедрение компьютерного зрения и можно ли сократить сроки

How is Computer Vision Introduced

Да, сроки сократить можно. Внедрить решение на основе компьютерного зрения быстро вполне реально. В зависимости от сложности на это уйдет от двух до трех-четырех недель. Но для начала разберем, как происходит внедрение компьютерного зрения.

Любое внедрения решений на основе компьютерного зрения происходит в несколько этапов:

  1. Подготовка данных
  2. Выбор архитектуры и обучение модели
  3. Оценка и дообучение модели
  4. Внедрение в промышленную эксплуатацию
Stages of Computer Vision Project

Этапы проекта по внедрению компьютерного зрения  

Подготовка данных. Для обучения нейросеть запускается на подготовленном датасете.  При подготовке данных важно провести их аугментацию. Это значит, что необходимо добавить искажения (нечеткие фотографии, с бликами и пр.), чтобы увеличить разнообразие данных и, впоследствии, точность распознавания. Все данные разбиваются на три набора: тренировочный, валидационный и тестовый. 

Выбор архитектуры и тренировка модели. Необходимо выбрать архитектуру модели, которая будет использоваться для обучения. Модели могут быть разных типов, например, сверточные нейронные сети (Convolutional Neural Networks, CNN), рекуррентные нейронные сети (Recurrent Neural Networks, RNN), трансформеры (Vision Transformer, ViT) и тд.  

После запускаем нейросеть на тренировочных данных. Обучается модель в несколько итераций. В процессе каждой итерации модель находит закономерности и особенности, которые помогают ей распознавать объекты, такие как, SKU, ценники, POSM, а также классифицировать товары, например, вода конкретной марки, объема и вкуса. В конце каждой итерации нейросеть проверяется на валидационном наборе данных. Таким образом модель постепенно улучшает свои параметры. 

Далее нейросеть запускаем на неразмеченных фотографиях. Процесс использования обученной модели для получения предсказаний на новых данных это инференс (inference). Этот процесс может быть выполнен в режиме реального времени, когда модель генерирует предсказания на основе входных данных в течение короткого промежутка времени. Если нейросеть разметила фотографию неправильно, разметка корректируется и фотографии снова загружаются в нейросеть. 

Оценка и дообучение модели. После обучения модели ее необходимо оценить на тестовом наборе, чтобы определить, насколько хорошо она работает на новых данных, которые ранее “не видела”. Если модель показывает неудовлетворительные результаты, она корректируется, и процесс обучения повторяется.

Анализ ошибок помогает понять, какие объекты модель плохо распознает, а также какие признаки наиболее важны, чтобы правильно классифицировать эти объекты. Это дает возможность улучшить модель и сделать ее более эффективной на реальных фотографиях от мерчандайзеров.

Внедрение в промышленную эксплуатацию. Когда модель успешно размечает фотографии стабильно с точностью 95% и выше, она готова к промышленному внедрению. На этом этапе приложение с моделью интегрируется в бизнес-процессы FMCG-компании. Goods Checker может работать как отдельное приложение или интегрироваться в существующие ИТ-приложения с помощью API. 

 

How to Reduce Project Time in the introduction of computer vision

Как сократить сроки проекта

“Узкое горлышко” в процессе внедрения решений на базе компьютерного зрения — это этап подготовка данных. Разметка всего датасета выполняется чаще всего вручную, поэтому процесс долгий и трудоемкий. 

Чтобы ускорить этот этап мы не делаем разметку вручную.  Для создания датасета используем рендеры каждого SKU и создаем искусственный набор фотографий. На нем обучаем нейросеть распознавать товары. Еще в 2019 на сайте arXiv.org эксперты по искусственному интеллекту из Google Cloud AI предложили использовать этот метод для разметки изображений. 

Как только выходим на нужный уровень точности распознавания, переходим к следующему этапу. Запускаем нейросеть уже на реальных фото, при необходимости дообучаем модель и оцениваем ее эффективность. 

Подход с генерацией искусственных данных помогает значительно сократить сроки внедрения, в то время как подход с ручной разметкой изображений занимает от нескольких месяцев до года. Мы внедряем за 2-3 недели, в зависимости от количества SKU, их формы и разнообразия. 

Например, для мерчандайзингового агентства мы выполнили пилотный проект всего за две недели. Для пилота выбрали 6 городов, 45 торговых сетей и 694 торговые точки. Goods Checker использовали 4 супервайзера и 8 мерчандайзеров. Уже по итогам двух недель точность распознавания составила 95% и выше. 

Goods Checker помог ускорить составление отчетности на 70%. Теперь мерчандайзеры тратят на отчеты всего меньше 20 минут вместо одного часа. Более того, аудит торговой точки ускорился на 10-50%, в зависимости от размера магазина. 

Использование компьютерного зрения в FMCG — инвестиции, которые окупятся. 

Внедрить компьютерное зрение сейчас намного проще

Introduction of computer vision with Goods Checker

Все привыкли, что внедрение сложных технологий – это долго и дорого. Так как нужно покупать оборудования и много дорабатывать приложения. Сегодня все иначе. С каждым годом процесс разработки и внедрения оптимизируется и упрощается, технологии становятся более доступными. 

Например, компании предлагают свои решения по модели SaaS, выполняют пилотные проекты, которые реализуются быстро.  Такой подход позволяет протестировать продукт на практике и понять, подходит ли он для вашей компании и соответствует ли вашим задачам.

Свяжитесь с нами




    Я подтверждаю согласие получать информацию об услугах компании на email.