Jan van Bon - ИТ СЕРВИС–МЕНЕДЖМЕНТ. Вводный курс на основе ITIL
? проактивное Управление Проблемами: предотвращение инцидентов путем совершенствования инфраструктуры;
? предоставление информации: отчеты по серьезным проблемам и достигнутым результатам.
Выходами процесса являются:
? известные ошибки;
? Запросы на Изменения (RFC);
? новые регистрационные данные о проблемах (обновленные с учетом информации о способах решения и/или обходных решениях);
? закрытые после устранения причины проблемы регистрационные записи;
? информация для руководства.
Рис. 5.3. Управление Проблемами среди других процессов
5.3.1. Управление Инцидентами
Управление Инцидентами является важным партнером Процесса Управления Проблемами. Эффективная регистрация инцидентов важна для успешного Управления Проблемами, так как эта информация используется при идентификации проблемы.
Управление Проблемами поддерживает Процесс Управление Инцидентами. Процесс Управления Проблемами изучает проблемы и, пока не будет найдено решение, Управлению Инцидентами предлагаются обходные решения для работы над инцидентом. После установления причины и определения Известной ошибки, может быть предложено быстрое решение ("заплатка")[78], которое поможет предотвратить возникновение инцидентов на некоторое время или уменьшит их негативные последствия. Управление Проблемами может подать Запрос на Изменение, который приведет к окончательному решению.
Примечание. Обходные решения могут создаваться и в Процессе Управления Инцидентами, и в Процессе Управления Проблемами.
5.3.2. Управление Изменениями
Управление Изменениями отвечает за контролируемое проведение изменений, включая Запросы на Изменения для устранения проблем, предложенные Процессом Управления Проблемами. Управление Изменениями несет ответственность за определение степени воздействия изменения и ресурсов, необходимых для его реализации, а также за планирование, согласование и оценку запрашиваемых изменений. Кроме того, Управление Изменениями информирует Процесс Управления Проблемами о ходе работ и о завершении корректирующих изменений. Оценка этим изменениям дается совместно с Процессом Управления Проблемами. Итогом работы является Анализ результатов внедрения[79], после которого в рамках подпроцесса Контроля ошибок может быть закрыта известная ошибка, а также относящиеся к ней (открытые) инциденты.
5.3.3 Управление Конфигурациями
Процесс Управления Конфигурациями предоставляет важную информацию об элементах инфраструктуры, документации, конфигурации программного и аппаратного обеспечения, ИТ-сервисах и других отношениях типа "связан с", "использует" и "является частью". Эти отношения являются исключительно важными для решения проблем.
5.3.4. Управление Доступностью
Процесс Управления Доступностью нацелен на планирование и реализацию согласованных Уровней Доступности. Управление Проблемами оказывает поддержку Управлению Доступностью, определяя и устраняя причины недоступности услуг. Процесс Управления Доступностью направлен на разработку архитектуры и проектирование инфраструктуры, его задача — предупреждать появление проблем и инцидентов путем оптимизации планирования доступности услуг и ее мониторинга.
5.3.5. Управление Мощностями
Управление Мощностями позволяет оптимизировать использование ИТ-ресурсов. Данный процесс предоставляет Управлению Проблемами важную информацию, которую можно использовать для определения проблем. Управление Проблемами оказывает поддержку Управлению Мощностями, устанавливая причины соответствующих проблем и устраняет их.
5.3.6. Управление Уровнем Услуг
Управление Уровнем Услуг включает в себя работы по согласованию и заключению Соглашений о Качестве ИТ-услуг. Управление Уровнем Услуг передает в Процесс Управления Проблемами информацию, которая используется при определении проблем. Процедуры Процесса Управления Проблемами должны поддерживать предоставление услуг в соответствии с согласованными стандартами качества. Эту же роль Управление Проблемами играет в Процессах Управления ИТ-финансами и Управления Непрерывностью ИТ-услуг.
5.4. Виды деятельности
5.4.1. Контроль проблем
Целью этого вида деятельности является выявление проблем и изучение их причин. Контроль проблем должен преобразовать проблему в известную ошибку путем диагностирования неизвестной причины ее возникновения. На рис. 5.4 показаны действия, выполняемые в рамках контроля проблемы.
Рис. 5.4. Контроль проблем (источник: OGC)
Идентификация и регистрация проблемы
В принципе, любой инцидент, возникший по неизвестной причине, может быть связан с проблемой. На практике это имеет смысл делать только тогда, когда инцидент повторяется, возможно его повторение или если это единичный, но серьезный инцидент.
Деятельность по "идентификации проблем" часто выполняют Координаторы проблем. Однако бывает так, что персонал, изначально не вовлеченный в эту работу, например, специалисты по Управлению Мощностями, тоже может выявлять проблемы. Такие "находки" также следует регистрировать как проблемы.
Регистрационные детали проблем схожи с деталями инцидентов, но в случае проблемы не нужно включать в описание информацию о пользователе и т.д. Однако инциденты, связанные с конкретной проблемой, следует идентифицировать и соответствующим образом регистрировать. Ниже даются примеры случаев, когда могут быть идентифицированы проблемы:
? Анализ инцидентов показывает, что некоторый инцидент повторяется, возникает большое количество инцидентов или возникает негативная тенденция.
? Анализ инфраструктуры позволил определить ее слабые места, где могут произойти новые инциденты (возможно, это проводилось средствами Процессов Управления Доступностью и Управления Мощностями).
? Произошел серьезный инцидент, требующий структурного решения для предотвращения его повторения в будущем.
? Существует угроза срыва Уровня Услуг, согласованного с заказчиком (по показателям производительности, мощности ИТ-средств, затрат и т. д.)
? Нельзя установить связь между новыми инцидентами и уже известной проблемой или ошибкой.
? Нельзя установить связь между зарегистрированными инцидентами и любой из известных проблем или ошибок.
Анализ тенденций позволяет обнаружить области, которым требуется особое внимание. Необходимые для этого дополнительные ресурсы нужно обосновать с позиции издержек и выгод для организации. Например, определить области, которым требуется более действенная поддержка, и понять, насколько они важны для предоставляемых услуг.
Такая оценка может базироваться на "болевом показателе" инцидентов, в котором учитываются:
? издержки, которые несет бизнес из-за инцидентов;
? количество инцидентов;
? количество пользователей и бизнес-процессов, затронутых инцидентами;
? время и затраты на разрешение инцидентов.
Классификация и назначение
Проблемы можно классифицировать по областям (категориям). Классификация проблемы выполняется одновременного с анализом степени ее воздействия, т. е. уровня серьезности проблемы и ее влияния на услуги (срочность и степень воздействия). Вслед за этим проблеме присваивается приоритет, точно так же, как в Процессе Управления Инцидентами. Затем на основе результатов классификации за проблемой закрепляются ресурсы и персонал и определяется время, необходимое для ее решения.
Классификация проблемы включает в себя следующее:
? Категория: определение области, например, программное или аппаратное обеспечение;
? Степень воздействия на бизнес-процесс;
? Срочность: допустимая задержка в решении проблемы;
? Приоритет: показатель, объединяющий срочность, степень воздействия, риск и необходимые ресурсы;
? Статус: например, проблема, известная ошибка и т. д.
Классификация не является статичной, она может меняться на протяжении жизненного цикла проблемы. Например, наличие обходного решения или быстрого решения поможет снизить срочность проблемы, в то время как новые инциденты могут привести к усилению степени воздействия проблемы.
Расследование и диагностика
Расследование и диагностика являются итеративными фазами процесса, они неоднократно повторяются, каждый раз приближаясь все ближе к намеченному результату. Часто делаются попытки воспроизвести инцидент в условиях тестирования. Для решения проблемы могут потребоваться дополнительные знания, например, для анализа и диагностики проблемы можно привлечь специалистов из группы поддержки.
Проблемы возникают не только из-за программных или технических средств. Они могут быть вызваны ошибками в документации, ошибками персонала или процедурными ошибками, такими как выпуск неправильной версии программного обеспечения. Поэтому желательно включать описания процедур в Конфигурационную Базу Данных и проводить контроль их версий. В то же время многие ошибки связаны с компонентами ИТ-инфраструктуры.