Федор Вирин - Интернет-маркетинг. Полный сборник практических инструментов
Несмотря на то что методика идентификации пользователей по cookie имеет ряд погрешностей и идентифицирует не людей, но браузеры пользователей, она намного более точна, чем методика определения по IP-адресу, и активно используется сегодня.
3. ПО СЕССИОННЫМ ИДЕНТИФИКАТОРАМ. При помощи несложного программного модуля можно присвоить пользователю уникальный идентификатор, который будет передаваться в адресной строке при перемещении пользователя от страницы к странице. Это выглядит как добавление к адресной строке конструкции вида?sessid=65468765213249875419876, где набор цифр – это и есть уникальный идентификатор (он может состоять из букв или быть смешанным в зависимости от используемых для этого программ). В отличие от метода идентификации по cookie, сессионный идентификатор нельзя отключить, его нельзя запретить на proxy-сервере. Конечно, можно стереть идентификатор из адреса, но это почти исключительное событие: большинство пользователей не имеют для этого достаточных знаний. В то же время сессионные идентификаторы не сохраняются после разрыва сессии, хотя сама по себе сессия может иметь иногда неограниченную длину – до тех пор, пока не будет закрыт браузер.
Этот метод идентификации, очевидно, может быть использован только в рамках одной сессии, однако в течение сессии он точнее всех других. Основное применение сессионных идентификаторов – это сохранение параметров при переходе между страницами. Например, пользовательские запросы или настройки гораздо проще сохранить на сервере в базе данных и сопоставлять с идентификатором, чем передавать в строке, где они могут банально не поместиться.
Сессионные идентификаторы имеют два важных отрицательных качества: во-первых, они затрудняют индексацию поисковыми машинами, вплоть до полного запрета. Дело в том, что поисковый робот не различает идентификаторы и вынужден считать каждую страницу множество раз, что замусоривает базу данных поисковой машины. Во-вторых, на страницу с таким идентификатором часто невозможно поставить закладку или отправить кому-либо в виде ссылки. В силу этого сфера применения сессионных идентификаторов ограничена именно решением технической задачи передачи настроек пользователя между страницами сайта и, в основном, применяется для внутренних интерфейсов систем, где не требуется ставить закладку и которые не должны индексироваться поисковыми машинами. Например, для внутренних интерфейсов банков.
4. АВТОРИЗАЦИЯ ПОЛЬЗОВАТЕЛЯ. Единственный совершенно надежный метод идентификации пользователя – это его авторизация (ввод логина и пароля). К сожалению, далеко не всегда можно применять авторизацию, так как пользователи не любят регистрироваться и оставлять о себе какие-то личные данные. Заставить их делать это без потерь аудитории можно лишь в редких случаях. Кроме того, даже в случае, если пользователь зарегистрировался, нередко возникает ситуация, когда он теряет логин и пароль и поэтому регистрируется заново.
Например, около трети покупателей интернет-магазина «Озон» (крупнейшего сегодня в России по числу покупателей) забывают свои регистрационные данные и при следующей покупке заново регистрируются. Даже введение пластиковых карточек с данными пользователя, которые бесплатно выдавались при первой покупке, хоть и улучшило ситуацию, но не решило ее полностью. Для магазина «Озон» это критическая проблема, потому что три четверти продаж совершается постоянными покупателями, и работа с постоянными покупателями – важнейшая составляющая маркетинга компании.
Наконец, пользователь может просто-напросто передать пароль (мы все это нередко делаем) своим друзьям или знакомым, чтобы они могли совершать какие-то действия от его имени.
Таким образом, метод идентификации по регистрационным данным – наиболее точный метод определения людей (не браузеров, а именно людей). Однако он имеет узкую сферу применения в силу нежелания пользователей оставлять о себе информацию в Интернете.
Для анализа в интернет-маркетинге используется чаще всего метод идентификации по cookies. Остальные методы применяют только в тех случаях, когда cookies недоступны. Если на сайте осуществляется авторизация пользователей, например для интернет-сервисов или для интернет-магазинов, то можно использовать авторизационные данные для анализа продаж.
Производные данные
Я уже упомянул выше, что, зная IP-адреса, можно определить географическое расположение пользователя, а зная referrer – запрос, по которому пользователь нашел ссылку на наш сайт в поисковой системе. Это так называемые производные данные – они получены за счет интерпретации собираемых данных. К основным производным данным относятся: СЕССИЯ – весь процесс посещения пользователем сайта от первой просмотренной им страницы и до выхода из сайта. По определению IAB[2] сессия – это вся последовательность просмотра одним пользователем страниц сайта, при условии, что запрос каждой следующей страницы не отделяет от предыдущей более 30 мин. В случае, если интервал между запросами страниц одним пользователем превышает 30 мин., то сессия закрывается и открывается новая. Здесь есть свое разумное объяснение. Существует достаточно большое количество сайтов, на которые мы заходим несколько раз в день: почтовые серверы, поисковые системы, сайты новостей и другие, – и каждый раз это будут различные сессии. Именно поэтому IAB приняло за норму, что если человек не проявляет никакой активности на сайте в течение 30 мин, то его сессия считается законченной, а при следующем хите открывается новая сессия. Другими словами, если пользователь после перехода на очередную страницу сайта выключил браузер, то сервер, на котором расположен браузер, никак не узнает об этом, и тогда через 30 мин сессия будет закрыта;
• ПУТЬ ПО САЙТУ – последовательная цепь страниц, просмотренных пользователем на сайте за одну сессию в том порядке, в котором они посещались. Важно, что если в промежутке между просмотром пары страниц на сайте пользователь смотрел страницы на другом сайте, то у сервера об этом нет никакой информации и он считает путь непрерывным всегда, когда сессия не прерывалась;
• ВРЕМЯ НА САЙТЕ – время, проведенное пользователем на сайте в течение одной сессии. Время на сайте может быть измерено как промежуток времени от момента запроса первой страницы до момента запроса последней страницы сессии. Важно, что время, проведенное пользователем на странице, обычно не может быть измерено, если пользователь не перешел на следующую страницу, поскольку браузер после получения страницы не общается с сервером;
• ГЛУБИНА ПРОСМОТРА САЙТА – число страниц на сайте, просмотренных пользователем в течение одной сессии. Если человек в течение сессии несколько раз просматривал одну и ту же страницу, то она может быть посчитана несколько раз или один в зависимости от настроек анализирующей программы. Аналогичная ситуация и с путями по сайту: если пользователь в промежутке между просмотрами двух страниц на сайте смотрел страницы на другом сайте, то у сервера нет никакой информации об этом, и система анализа будет считать глубину просмотра сайта до тех пор, пока сессия будет оставаться непрерывной;
• ВОЗВРАТ НА САЙТ – повторное посещение сайта пользователем. Иначе говоря – вторая и любая последующая сессия на сайте. Возвраты на сайт могут быть определены только при использовании системы идентификации посетителей по cookie-файлам или через авторизацию. Некоторые системы статистики считают возвраты по IP – это неверно даже для мелких сайтов;
• ПОСТОЯННАЯ АУДИТОРИЯ – пользователи, которые заходят на сайт регулярно. Регулярность захода на сайт может быть определена произвольно – раз в неделю, раз в день, раз в месяц– и зависит от содержания сайта и преследуемых им целей. Как и возвраты на сайт, постоянные посетители могут быть определены только за счет использования системы идентификации посетителей по cookie-файлам или через авторизацию; НОВАЯ АУДИТОРИЯ – пользователи, пришедшие на сайт в первый раз. Как и возвраты на сайт, новые посетители могут быть определены только при использовании системы идентификации посетителей по cookie-файлам или через авторизацию (по отсутствию регистрационных данных или cookie-файлов). Важно помнить, что оба метода идентификации пользователей не идеальны, поэтому новым может считаться пользователь, который уже был на сайте (но стер cookie или зарегистрировался заново). Все эти перечисленные выше термины нередко встречаются в системах анализа. Многие из них вы будете использовать в своей работе.
Инструменты анализа
Упомянутые выше данные записываются в лог-файл – текстовый файл, где на каждый запрос/обращение к серверу записывается одна строчка данных (рис. 7.3). В этой строке поля с описанными выше параметрами отделены друг от друга пробелами, запятыми, кавычками (зависит от настроек). Для каждой страницы сайта записывается много строк лог-файла – в зависимости от числа элементов, подгружаемых на страницу, а также от формата записи в лог это может быть до нескольких десятков записей.