Требования к данным для планирования спроса методами искусственного интеллекта в ритейле и дистрибьюции

Давайте обсудим набор данных и их качество для прогнозирования спроса c BAI Прогноз. BAI Прогноз - это продукт BAI GEM для прогнозирования спроса методами AI.
BAI Прогноз планирует спрос, анализирует промоакции, упрощает производственное планирование и оптимизирует управление запасами, ценообразованием и ассортиментом.

Требования к данным для планирования спроса методами искусственного интеллекта в ритейле и дистрибьюции


Набор данных

Для начала работы с BAI Прогноз можно просто собрать исторические данные по продажам. Например,

Локация
ID товара
Дата продажи
Количество проданных единиц товара

Этого достаточно, чтобы создать первый прогноз спроса. Однако вы можете обнаружить, что в данных есть какая-то периодичность, или сложные закономерности и тренды. Да и в целом прогноз спроса получается точнее, чем “руками”, но все равно недостаточно точный.

В таком случае мы уточним прогноз спроса, добавив в него следующие данные:

Складские остатки
Цена товаров
Промо активности

Не обязательно добавлять все и сразу, точность прогноза можно повышать постепенно, работая с тем, что есть сейчас.

Требования к данным

BAI Прогноз работает с тем, что предложено. Однако давайте обсудим некоторые моменты, которые повышают точность прогнозирования спроса.

Глубина исторических данных

Грубо говоря, если необходимо спрогнозировать спрос на три месяца, то необходимы данные минимум за 2 предшествующих года и плюс три месяца. А если в продажах есть сезональность, то за 3, 4 года или даже 5 лет.

Дисперсия данных

Пример высокой дисперсии данных - когда от дня ко дню данные меняются очень сильно. Например, в 10 раз. Колебания могут повториться через 3 дня, а затем через 5 дней. При этом колебания продаж нельзя объяснить сезонностью, например.

Зачастую такие колебания связаны с внесением данных в систему учета организации - данные загружаются не всегда и не равномерно, а по мере надобности и партиями.

Либо крупный дистрибьютор закупает крупные партии и не делится информацией о подневных продажах.

В любом случае если дисперсия данных сильная - необходимо разобраться в ее причинах. А далее мы можем либо удалить часть данных как нерелевантные, либо внести правки в метод прогнозирования.

Отсутствие продаж - нули в данных

Для идеального прогнозирования у нас не должно быть пропусков в продажах.

Это связано с тем, что 0 - это конкретное число. Его сложно спрогнозировать. Наличие нулей в исторических данных снижает точность прогноза, и при этом сложно точно выделить, отчего точность упала. То ли модель искусственного интеллекта допускает ошибку, то ли слишком много дней, когда не продается вообще ничего.

Поэтому если в данных много 0, то обычно прогнозируют на уровне, где нет 0. Например, с уровня точки можно подняться до уровня города - локации.

Либо делать агрегацию данных не на каждый день, а на неделю.

В любом случае необходимо определить, насколько это критичный вопрос и каким-то образом обработать пропуски продаж в данных.

Соотношение сигнал/шум и выбросы

Данные должны позволить нам спрогнозировать спрос. Однако иногда в данных много шума и получить точный прогноз не удается. В таком случае необходимо провести предварительную работу и определить, каким образом можно снизить шум, либо усилить полезный сигнал в данных.

Также для составления точного прогноза спроса желательно, чтобы в данных было минимум выбросов, которые возникли из ниоткуда и их ничем нельзя объяснить. В противном случае такие выбросы необходимо обрабатывать вручную.

В заключение

Сбор и подготовка данных это отдельное направление в науке о данных. Если у Заказчика нет собственного специалиста по данным, то оптимальная модель сотрудничества с BAI Gem при прогнозирования спроса - это сочетание продукта BAI Прогноз и консалтинга. Специалист по данным BAI Gem поможет подготовить данные для отправки в BAI прогноз и в дальнейшем гарантирует оптимальную точность при прогнозировании спроса.

ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ПО ЦЕЛЕСООБРАЗНОСТИ ВНЕДРЕНИЯ ML МЕТОДОВ В ВАШЕЙ ОРГАНИЗАЦИИ