Проверка концепции и MVP. С каких этапов стартуют ML проекты

Давайте разберемся, почему перед поставкой готового продукта мы берем деньги за предварительные этапы. Почему нет 100% гарантии, что заплатив за первый этап можно сразу приступить к внедрению.
С помощью машинного обучения мы автоматизируем решение профессиональных задач. Примерами могут быть задачи оптимизации логистической цепочки, оценки спроса, обнаружения мошенничества.

Подобные решения основаны на математических моделях. Модели учитывают конкретные условия и процессы у заказчика. Поэтому входные данные всегда отличаются. Нельзя взять работающую модель производителя подгузников и поместить в нее данные производителя детских игрушек. Необходимо понять, какие данные ключевые для решения новой задачи и изменить и переобучить модель.

Если мы сталкивались с подобной задачей ранее, мы решим ее быстрее. Опыт разработки системы управления товарным запасом позволяет создать MVP за полгода вместо полутора, например. Но нет универсального “коробочного” решения.

Проверка концепции

Все проекты машинного обучения начинаются с проверки концепции, PoC (от англ. proof of concept). При создании продукта PoC - это число предзаказов, маркетинговые тестирования, социологические опросы. То есть проверка, будет ли продукт интересен рынку.

В ML на стадии PoC команда проверяет, можно ли вообще машинными методами решить задачу, на какие показатели KPI можно выйти. Здесь еще нет ни продукта, ни каких-то интерфейсов. Условно, есть какой-то программный код на сервере или ноутбуке. В код отправляют данные, запускают, смотрят результаты. Далее следуют консультации с бизнесом - адекватны ли результаты ожиданиям от применения методов машинного обучения.

Проверка концепции занимает от месяца до трех.

Редко, но доказать концепцию не удается. Это может быть связано с чистотой и объемом данных, их смещенностью по отношению к реальным процессам. Это тоже результат, потому что позволяет внести корректировки в процессы организации перед повторной попыткой внедрения машинного обучения.

Состав минимальной команды для проверки концепции

На стадии проверки концепции минимально в команду входят:

старший дата-сайентист
дата-сайентист
дата - инженер - частично
аналитик - частично

Помимо основной команды с нашей стороны к работе периодически подключается аккаунт-менеджер. На стороне заказчика должен быть владелец продукта. Он погружает нас в специфику деятельности и консультирует. Иногда заказчики не предоставляют владельца продукта для работы над проектом. Мы не одобряем, но подключаем к работе владельца продукта с нашей стороны.

Минимально жизнеспособный продукт

Минимально жизнеспособный продукт, MVP (от англ. minimum viable product) - это уже не доказательство возможностей машинного обучения. MVP - это работоспособный продукт. Основная задача MVP - помочь понять бизнес-пользователям и команде, как доработать решение перед его интеграцией с корпоративными системами заказчика.

Состав команды для MVP

На стадии MVP не обязательно постоянное участие старшего дата-сайентиста в проекте. Однако необходимо привлечь несколько мидл дата-сайентистов. Мидл дата-сайентисты вносят в модель все данные заказчика, адаптируют ее, добавляют функции для отслеживания метрик. Дата инженер работает с данными и привлекается бэкенд разработчик. На данном этапе некоторые заказчики предпочитают работать в xls файлах, кто-то предпочитает создать дэшборды. Для создания дэшбордов привлекается BI - разработчик.

Грубо минимальная команда состоит из:

старший дата-сайентист - частично
два дата-сайентиста
дата - инженер
аналитик - частично
бэкенд разработчик - частично
BI - разработчик - частично

Вместо вывода

Готовое решение в ML - это когда из системы заказчика данные автоматически попадают в модель. Модель обрабатывает данные и выдает результат, который возвращается в качестве прогноза или рекомендации в бизнес и производство. Это рабочее место сотрудника - пользовательский интерфейс с возможностью оценки качества модели, прогнозами и формированием отчетности.

Однако перед поставкой готового решения мы должны пройти предварительные стадии. Проверка концепции и минимально жизнеспособный продукт - это единственный способ гарантировать поставку ценного для заказчика решения с минимальными затратами.