Джош Кауфман - Самообразование на 100 процентов
Старайтесь принимать во внимание не только цифры, но и контекст: без него вы рискуете пропустить какое-нибудь важное изменение в данных. Даже зная «общий показатель качества» или то, что доход увеличился или уменьшился, вы не сможете понять, важно это или нет и почему так произошло (случайность это или следствие какого-то изменения в системе или среде).
Возьмите себе за правило всегда рассматривать каждое измерение в контексте с другими измерениями.
Выборка
Если вы не верите в теорию выборки, в следующий раз, когда пойдете к врачу, попросите его взять всю вашу кровь.
Джан Фупгони, основатель и председатель компании Comscore, Inc.Что делать, если ваша система слишком большая и сложная, чтобы собирать данные по каждому процессу?
Иногда не стоит измерять все потоки. Если вы управляете масштабируемой системой, зачастую невозможно проверить все элементы и найти все ошибки. Как быстро определить возможные проблемы, если система обрабатывает огромное количество данных и заключает миллионы сделок?
Выборка — это определенная случайным образом часть некоего целого, способная рассказать о поведении всей системы. Если вы когда-нибудь сдавали кровь на анализ, вы прекрасно представляете, что такое выборка. Врач или медсестра берет небольшое количество крови и отправляет ее в лабораторию. Если тест покажет, что в этом образце наблюдаются какие-то аномалии, вероятнее всего, они присутствуют и во всей остальной крови в вашем организме.
Выборка помогает определить системные ошибки, не тратя время и деньги на анализ всей системы. Если вы производите мобильные телефоны, нет необходимости проверять каждое устройство, сходящее с конвейера: проверка каждого двадцатого позволит в короткие сроки оценить положение дел и в случае необходимости подкорректировать систему. В зависимости от того, насколько быстро и точно нужно выявить ошибки, вы можете уменьшить или увеличить частоту выборки.
Одна из форм выборки — проверка без предупреждения. Многие магазины периодически нанимают «таинственных покупателей», которые проверяют, насколько хорошо персонал выполняет свою работу. Они интересуются ассортиментом, задают кучу вопросов, хотят вернуть купленный товар и вообще действуют на нервы. А поскольку работники магазина не знают, какие клиенты настоящие, а какие подставные, такой метод оказывается намного эффективнее постоянного пристального контроля за каждым отдельным служащим.
Однако если образец был взят не случайным образом или не является «представителем» общего, совокупности, результаты выборки могут быть неверными. Ясно, что при оценке среднего дохода семьи мы получим разные результаты, если возьмем жителей Манхэттена и Западной Виргинии. Чем больше у вас образцов, выбранных случайным образом, тем вернее будут ваши результаты.
Доверительный интервал
Все делают общие выводы из одного примера. По крайней мере, я поступаю именно так.
Стивен Браст, писатель-фантастПредставьте, что вы купили волшебную монету, которая чаще всего падает орлом вверх. Как узнать, что это не подделка? Конечно, нужно проверить ее в действии.
Давайте представим, что, подбросив ее пять раз, вы получили два орла и три решки. Так что, нужно ее вернуть?
Доверительный интервал представляет собой вероятность того, что определенный анализ окажется правильным. Прежде чем очернять репутацию продавца, стоит удостовериться в точности ваших результатов.
Чем больше образцов вы возьмете, тем выше доверительный интервал данного измерения. Объем выборки увеличивается каждый раз, когда вы подбрасываете монету. Чем он больше, тем точнее ваши измерения и, соответственно, тем больше к ним доверия.
Подбросив монету всего пять раз, вы не можете быть полностью уверены в том, что это подделка: объем выборки слишком мал. Если же вы подбросите ее тысячу раз и она в 70 % случаев упадет решкой вверх, значит монета действительно неправильная, но все равно она не подделка мошенника (скорее всего, вам досталась монета, которая в большинстве случаев падает не орлом вверх, а решкой).
Я не буду детально описывать, как именно рассчитывается доверительный интервал, но сделать это довольно легко, особенно если вы умеете пользоваться электронными таблицами или базами данных. Начинающим я рекомендую почитать книгу Principles of Statistics («Принципы статистики»).
Помните о том, что результатам измерений, основанных на малых объемах выборки, не стоит доверять. Каждый раз, когда вы сталкиваетесь с выборкой, основанной на незнакомых вам данных, обязательно проверяйте ее объем и способ отбора образцов. Чем больше образцов вы соберете, тем больше доверия будут вызывать результаты анализа.
Соотношение
Тот, кто отказывается делать расчеты, обречен говорить чепуху.
Джон Маккарти, программист и когнитивист, автор термина «искусственный интеллект»Соотношение — это метод сравнения двух показателей или результатов измерения друг с другом. Определив соотношение «выходного» параметра к «входному», вы сможете измерить все виды отношений между различными элементами вашей системы.
Предположим, из 30 посетителей вашего магазина 10 ушли с покупкой. То есть соотношение будет 10/30, или 1/3, то есть 33 %.
А теперь предположим, что вы провели для продавцов тренинг, по результатам которого повысилась их эффективность: 15 покупок на 30 клиентов, зашедших в магазин.
Тогда соотношение будет 15/30, или 1/2, то есть 50 %.
Подумайте об измерении возврата на инвестиции: вы просто делите сумму доходов на сумму расходов и вычитаете 1. Результат, выраженный в процентах, и будет величиной возврата.
Например, вы потратили 2 миллиона и заработали 4. Окупаемость составит 100 %: 4 миллиона (заработанные) / 2 миллиона (потраченные) = 2.
2-1 = 1 = 100 %.
Ниже указаны некоторые полезные отношения.
— Доходность активов: какой доход вы получили на один доллар, вложенный в оборудование?
— Доходность капитала: какой доход вы получили на один инвестированный доллар?
— Доходность рекламы: какой доход вы получили на один доллар, вложенный в рекламу?
— Доход на сотрудника: какой доход вы получили на одного нанятого вами сотрудника?
— Закрытие сделок: какая доля обслуженных вами клиентов совершила у вас покупку?
— Отношение возвратов/жалоб: сколько возвратов или жалоб было сделано на каждую продажу?
Постоянно проверяя эти соотношения, намного легче заметить изменение в системе и то, к чему оно ведет. Если показатель закрытия сделок или окупаемость инвестиций растет — это хороший знак. Если же величина этих показателей падает, стоит выяснить причины.
Проявите фантазию: изучайте свой бизнес и определяйте соотношения, которые раскрывают наиболее важные элементы вашей системы.
Среднее арифметическое, медиана, мода и размах
Вам больно не от того, что вы чего-то не знаете, а от того, что вы что-то знаете.
Уилл. Роджерс, американский ковбой и комикВ среднем капитал читателей Wall Street Journal составляет 1,7 миллиона долларов. Аудитория газеты, похоже, очень богатые люди, не правда ли?
Да, это так, но не настолько, как вы думаете. Дело в том, что Wall Street Journal читают такие люди, как Билл Гейтс и Уоррен Баффет, а их состояние измеряется миллиардами. Одним своим существованием они делают среднее арифметическое намного выше, чем оно есть на самом деле.
Среднее арифметическое рассчитывается путем деления суммы всех данных на их количество. Рассчитывать среднее арифметическое несложно, но тут может вмешаться синдром Гейтса — Баффета: наличие выходящих за рамки объектов увеличивает или уменьшает его настолько, что оно перестает быть репрезентативным. Однако если исключить такие объекты, среднее арифметическое становится более точным.
Чтобы определить медиану, необходимо выстроить значения в порядке убывания и найти данные, расположенные посередине ряда. Медиана связана с особым показателем, называемым процентиль, и является 50-м процентилем. По определению, 50 % значений в ряду будут находиться ниже медианы. Рассчитав медиану и сравнив ее со средним значением, вы сможете проверить, не повлияли ли выходящие за рамки объекты на результат.