Ритейл — сфера, где всегда готовы тестировать инновации. Инновационные решения в ритейле помогают автоматизировать и ускорить, повысить их качество. Но вместе с тем, инновации часто обрастают мифами.
Михаил Савицкий, Tech Team Lead решения Goods Checker, поделился своими наблюдениями о том, с какими вопросами про компьютерное зрение он чаще всего сталкивается при общении с клиентами.
Table of Сontents
Популярные заблуждения о компьютерном зрении
Миф 1. Для компьютерного зрения нужен дорогой смартфон с хорошей камерой.
Есть мнение, что компьютерное зрение хорошо работает только в том случае, если используется суперкачественная камера, например, как в у флагманских смартфонов.
В противном случае нейросети не смогут распознать изображение правильно.
Но это не так. Последние несколько лет среднестатистический смартфон, которым пользуются большинство людей, имеет камеру, достаточно качественную, чтобы компьютерное зрение смогло определить товары на снимках.
Миф 2. Человек распознает лучше, чем компьютерное зрение. Это не совсем верно. Компьютерное зрение всегда распознает то, что человек может рассмотреть. Бывает, что мерчандайзеры присылают фотографии, где части товаров бликует при освещении или стоит в темном углу. Такие позиции супервайвер определить не сможет. Нейросеть же распознает товары, анализируя те пиксели, которые есть на снимке.
Миф 3. Для распознавания нового товара нейросетям необходимо много фотографий. Нейросети обучаются на сотнях и тысячах снимках. Это верно. Но это не обязательно должны быть “живые” фотографии, сделанные с физически существующего товара. Для обучения нейросетей часто используется рендер 3D-модели товара. На сегодняшний день достаточно одного рендеры, чтобы модель научилась распознавать товар. Процесс выглядит следующим образом.
Специалист получает рендер товара. Далее он изучает фотографии полок в магазине, где товар выставляется. Это нужно, чтобы доработать рендер и получить максимально приближенное к реальности изображение товара. Например, если товар подсвечивается диодной лентой, необходимо подсветить товар и на рендере. После таких доработок получается набор изображений (датасет), необходимый для обучения нейросети. Когда модель обучена, ее проверяют уже на фотографиях физического товара.
Проблема длинных полок
Компьютерное зрение помогает также решить проблему фотографирования полок в длинных узких проходах магазина. Мерчандайзеру сложно охватить одним снимком товары на таком стеллаже. Обычно длинные полки фотографируют под углом, и дальние товары сложно или даже невозможно рассмотреть.
Нейросети помогают справиться с этой задачей. Мерчандайзер делает снимки отдельных частей длинного стеллажа, а алгоритмы компьютерного зрения объединяют несколько снимков в один. Мерчандайзер и супервайзер получают один снимок длинной полки и более качественное распознавание товара.
Компьютерное зрение — помощник FMCG-компании
Компьютерное зрение распознает товары быстрее и точнее человека. Сверка планограммы и реальной выкладки на большом стеллаже занимает 20-30 секунд, максимум минута (в зависимости от скорости интернета). У мерчандайзера же на это обычно уходит минимум несколько минут. Дополнительно, к концу дня накапливается усталость, теряется внимательность и возникают ошибки.
Нейросети же работают четко и быстро, никогда не устают. Супервайзеры и маркетологи получают информацию практически в реальном времени. Это значит, что они могут быстро реагировать на какие-то внештатные ситуации, подтверждать или изменять маркетинговую стратегию благодаря актуальным и достоверным данным.