Димитри Маекс - Ключевые цифры. Как заработать больше, используя данные, которые у вас уже есть
Внимательно посмотрите, как часто они летали в течение двенадцати месяцев перед последним мартом. А теперь попытайтесь заполнить приведенную ниже таблицу.
Какова, на ваш взгляд, вероятность того, что доход компании от путешествий Мэри, Сьюзен и Тома снизится в следующем году соответственно на 80, 50 и 20 %?
Многие люди, которым мы задавали этот вопрос, довольно быстро с ним справлялись.
Ответы их были довольно похожими и все они указывали примерно на то же, что и мой собственный ответ, приведенный ниже.
В течение двенадцати месяцев перед мартом Мэри стабильно летала по восемь или двенадцать раз в месяц. В марте она летала всего три раза. Это довольно необычно для нее – видимо, в этом месяце произошло нечто особенное. Возможно, она взяла отпуск, начала работать дома или просто заболела. С учетом прежних тенденций ее поведения шансы на то, что в течение следующих двенадцати месяцев она будет тратить на полеты на 80 % меньше прежнего, довольно невелики. Куда больше шансы, что доходы от работы с ней снизятся на 20 %, поскольку далее мы заметим в ее поведении два или три месяца низкой активности.
Между предыдущим мартом и ноябрем поведение Сьюзен было похоже на поведение Мэри. Однако с ноября она начала значительно реже пользоваться услугами нашей авиакомпании.
Судя по всему, речь идет о каких-то системных изменениях. Именно поэтому я считаю, что у нее имеется куда бо́льшая вероятность снижения количества полетов в ближайшие двенадцать месяцев, чем у Мэри.
А поведение Тома кажется совсем иным – оно не носит системного характера. Он стал летать всего два раза в месяц, а в последующие месяцы практически совсем прекратил полеты. Вот почему я совершенно не уверен, что будет происходить с доходами от полетов Тома в следующие двенадцать месяцев.
Уверен, вы поставили Мэри, Сьюзен и Тому примерно такие же оценки, ведь мы все склонны интуитивно анализировать поведение людей примерно сходным образом. Мы посмотрели, насколько часто наши участники летали в среднем, насколько сильно могут колебаться данные от месяца к месяцу, насколько сильно просел показатель количества полетов в марте и приняло ли это характер тенденции.
Я могу создать статистический алгоритм, способный анализировать эту информацию так же, как мы это делаем в своем подсознании. Для этого мне нужно преобразовать наши интуитивно важные факторы в математические переменные. Вот как это могло бы работать.
В крайней правой колонке содержатся переменные нашей модели, буквально предсказывающей вероятность снижения доходов. Статистическая модель выявляет клиентов, доход от которых сократился на 20, 50 и 80 % за прошлый год, затем изучает значение предсказывающих переменных (чуть подробнее об этом ниже) за двенадцать месяцев до начала снижения доходов. Это позволит «научить» модель рассчитывать вероятность того, что расходы какого-то клиента могут снизиться на определенный процент. Безусловно, это довольно существенная информация. Если вы знаете, что один (или несколько) из ваших наиболее важных клиентов (приносящих вам доходы и прибыль) собирается уйти от вас, вы можете предпринять шаги по предотвращению этого. Как минимум вы выясните у них причины ухода и, возможно, предложите им стимулы (скидки, улучшение условий обслуживания и что-то еще), заставляющие их остаться.
Итак, мы с вами рассмотрели данные и практически интуитивно поняли, кто перестанет быть нашим клиентом. Однако в подобных ситуациях лучше воспользоваться статистическими моделями, что будет более эффективно, чем ваша интуиция. Модели могут не только принимать решение, подобное нашим, и делать это гораздо быстрее, но и повторять тот же алгоритм размышлений в отношении тысяч, а то и миллионов других мэри, сьюзен и томов. В дополнение к этому модель способна изучать сотни различных предсказывающих переменных. Переменные в таблице можно сопоставить со всеми остальными нашими знаниями о клиенте: возрасте, поле, национальности, почтовом индексе, использовании призовых баллов программы лояльности (для оплаты билетов, покупки товаров или какой-то комбинации обоих вариантов) – причем практически одновременно. Поэтому статистическое моделирование стало таким мощным инструментом.
Давайте еще раз посмотрим на Сьюзен. Если мы чуть сильнее углубимся в свои знания о ней, то поймем, что она не так давно сменила работу – об этом свидетельствовали изменения в ее профиле участника программы лояльности. Также мы знали, что она переехала на другую квартиру и использовала все накопленные призовые мили, чтобы купить большой телевизор у одного из партнеров авиакомпании. Мы не знаем причин произошедшего, но можем заметить, что и другие клиентки в возрасте Сьюзен (из ее профиля следует, что ей только что исполнилось тридцать шесть лет) совершали подобные вещи и переставали летать на самолетах компании с прежней частотой (это могло быть связано с такими простыми причинами, как снижение частоты путешествий или желание завести семью). Как бы то ни было, но согласно нашему алгоритму будет правильным предположить, что авиакомпания начнет получать меньше доходов от клиенток с таким профилем.
Эта история помогла мне сбросить покров таинственности с процесса статистического моделирования поведения людей. Я понял, что если мне удастся создать детальный список, описывающий клиентов, – не только их имен, но и другой информации (возраст, пол, профессия, уровень дохода, сумма их затрат), – то я смогу сделать вполне обоснованные предположения, сколько продуктов у компании они купят в сравнении с лучшими ее клиентами.
Чтобы лучше представлять ситуацию с будущими продажами, вам имеет смысл пригласить на работу статистика и поручить ему разработку моделей, сходных с той, которую я сделал для авиакомпании. Но в будущем – в течение трех или четырех лет – я ожидаю появления таких программ, которые позволят вам делать все это самостоятельно. Не исключено, что Google даже выпустит бесплатную версию.
Полная детальная модель
В предыдущем сюжете, рассматривая пример авиакомпании, мы опирались лишь на один из трех компонентов, составляющих пожизненную ценность, – изменение дохода в будущем (увеличение или снижение). Порой, когда вытаскиваешь какие-то ключевые данные из имеющейся клиентской базы, требуется создание модели, включающей в себя еще две переменные – ценность индивидуального клиента и продолжительность связи с компанией. Я расскажу, как это делается, на примере нашей работы с крупной розничной сетью. Предположим, эта сеть (назовем ее Retailco) наняла нас для оценки качества своей клиентской базы. Мы начали с классификации каждого домохозяйства по показателю пожизненной ценности, чтобы дать Retailco возможность индивидуального обращения к каждому из них. (Клиенты с самым высоким показателем потенциальной пожизненной ценности по вполне понятным причинам должны были получать от компании больше внимания.)
В то время, когда мы начали работать с Retailco, у нее было около полутора тысяч магазинов. И покупатели, как вы можете понять, снабжали компанию невероятно большими объемами данных. В базе данных содержалась информация почти о двадцати миллионах домохозяйств. Компания знала, что именно приобретало каждое из них, как часто и где. Размер базы данных мог показаться пугающим, но тем, кто любит копаться в цифрах, было где развернуться!
Прежде Retailco уже нанимала на работу опытных маркетологов и поручала им выжимать максимум из своей клиентской базы. Специалистам удалось внедрить некоторые из самых крупных и сложных программ лояльности в розничной отрасли. Теперь Retailco хотела разобраться с показателями пожизненной ценности клиентов, чтобы полностью сосредоточить внимание на лучших для торговой сети покупателях (как настоящих, так и потенциальных) и со временем еще сильнее увеличить их ценность. Модель позволяла нам понять простую, но важную вещь: с ее помощью мы могли знать, сколько денег потратит каждое отдельно взятое домохозяйство на отношения с Retailco в течение следующих трех лет – именно таков срок «всей жизни» в динамичном мире розничной торговли!
Цель была простой, но для ее реализации потребовался сложный и запутанный математический аппарат. Для начала мы выяснили, что означает пожизненная ценность для Retailco на концептуальном уровне, а результат представили в виде диаграммы (см. ниже). Хочу предупредить, что чуть далее приводится самая сложная статистическая модель в этой книге. Если вам удастся понять смысл следующих двух абзацев, то вы не только можете считать себя большим молодцом, но и вправе гордиться, что понимаете суть принципа цепей Маркова.
Как вы можете заметить, мы поместили клиентов в четыре различные группы в зависимости от уровня их расходов. «Отсутствие» означало домохозяйства, не совершавшие в любом из магазинов сети покупок в течение двенадцати месяцев.