Алексей Валиков - Технология XSLT
Приведем изображение дерева (рис. 3.8) документа
<а xmlns="urn:a"><b:b xmlns:b="urn:b"/></a>
Рис. 3.8. Изображение дерева документа с узлами пространств имен
Узлы инструкций по обработке
Каждой инструкции по обработке соответствует свой узел. В дерево не включаются узлы инструкций, которые были приведены в декларации типа документа (DTD). Кроме этого, поскольку декларация XML не является инструкцией по обработке, ей не будет соответствовать никакой узел в дереве документа.
Локальной частью расширенного имени инструкции по обработке является имя целевого приложения инструкции. Пространство имен инструкции по обработке всегда нулевое.
Строковым значением инструкции по обработке является ее содержание — последовательность символов, которая начинается после имени приложения и следующего за ним пробела и заканчивается перед символами "?>", которые закрывают инструкцию. Напомним, что символьные данные инструкции по обработке не выделяются в отдельный текстовый узел.
Узел инструкции по обработке помечается именем целевого приложения, заключенным в символы "<?" и "?>". В нижней части изображения узла пространства имен может быть указано содержимое инструкции.
ПримерУзел инструкции по обработке <?xsql quit?> может быть изображен следующим образом (рис. 3.9):
Рис. 3.9. Изображение узла инструкции по обработке
Узел комментария
Узел комментария соответствует каждому из комментариев, которые присутствуют в документе кроме тех, которые находятся в декларации типа документа (DTD). Узлы комментариев не имеют имен; их строковым значением является текст комментария — последовательность символов после "<!--" и до "-->". В изображении дерева узлы комментариев будут помечаться символами "<!-- -->". В нижней части при необходимости будет указываться текст комментария.
ПримерУзел комментария <!-- To do... --> может быть изображен следующим образом (рис. 3.10):
Рис. 3.10. Изображение узла комментария
Сводная таблица характеристик узлов
Для удобства использования мы можем свести в одну таблицу (табл. 3.1) такие характеристики узлов, как строковое значение, локальная часть имени, пространство имен и так далее.
Таблица 3.1. Характеристики различных типов узлов
Тип узла Характеристики Строковое значение Расширенное имя Дочерние узлы Родительские узлы Локальная часть имени Пространство имен Корневой узел Конкатенация текстовых потомков Нет Узлы элементов, комментариев, инструкций по обработке Нет Узел элемента Конкатенация текстовых потомков Имя элемента Пространство имен элемента Узлы элементов, комментариев, инструкций по обработке, текстовые узлы Корневой узел или узел элемента Узел атрибута Значение атрибута Имя атрибута Пространство имен атрибута Нет Узел элемента Текстовый узел Символьные данные Нет Нет Узел элемента Узел пространства имен URI пространства имен Префикс пространства имен Нулевое Нет Узел элемента Узел инструкции по обработке Содержимое инструкции Имя целевого приложения Нулевое Нет Корневой узел или узел элемента Узел комментария Текст комментария Нет Нет Корневой узел или узел элементаОграничения модели XML-документа
Модель XML-документа, описанная выше, является вполне достаточной для того, чтобы манипулировать структурой документа и данными, которые он содержит. Между тем, эта модель имеет определенные ограничения, а именно:
□ Не учитывается информация, содержащаяся в блоке DTD. Как следствие, в XSLT невозможно манипулировать определениями сущностей, элементов, атрибутов и так далее.
□ Не учитываются некоторые синтаксические особенности входящего XML-документа. Например: использовались ли в определенном атрибуте одинарные или двойные кавычки; была ли определенная строка задана сущностью или просто текстом, был ли текст заключен в секции CDATA или нет.
□ Если атрибут элемента был определен в DTD со значением по умолчанию, то в преобразовании нельзя точно сказать, присутствовал ли он физически во входящем документе или нет.
□ Не учитывается, был ли пустой элемент определен как <b></b> или <b/>.
Одним словом, предложенная выше модель не учитывает информацию, которая не важна с точки зрения структуры документа. На практике помимо структуры бывает также важен и детальный синтаксис документа (например, необходимо вместо   выводить ). К сожалению, применение XSLT для таких задач ограничено вследствие ограничений самой модели документа.
Порядок просмотра документа
Узлы дерева XML-документа находятся в определенном порядке, который называется порядком просмотра документа (англ. document order). Этот порядок важен для вычисления XPath-вырэжений, которые оперируют множествами узлов. Несмотря на то, что эти множества не имеют внутреннего порядка, при вычислении выражений узлы в них будут перебираться в прямом или обратном порядке просмотра документа в зависимости от того, какие оси навигации применяются в выражении.
Порядок просмотра документа — это порядок, который соответствует появлению в документе первого символа текстовой записи узла. Например, для элементов это будет порядок появления в документе открывающих тегов.
Более четко порядок просмотра документа определяется следующими правилами:
□ корневой узел является первым узлом в порядке просмотра документа;
□ узлы элементов предшествуют своим дочерним узлам, узлам пространств имен и узлам атрибутов;
□ узлы пространств имен предшествуют узлам атрибутов;
□ узлы атрибутов предшествуют другим дочерним узлам своего элемента;
□ остальные узлы упорядочиваются в последовательности их появления в документе.
Обратным порядком просмотра документа называется порядок, который в точности противоположен обычному порядку просмотра документа. Обычный порядок просмотра документа также называют прямым порядком или порядком документа.
ПримерВ качестве примера приведем схему дерева и выясним порядок просмотра
следующего документа:
<!-- Start -->
<?арр open?>
<а level="0" xmlns:b="urn:b" xmlns="urn:a">
alpha
<b:bravo/><!-- To do... --><charlie/>
delta
</a>
<?app close?>
Дерево этого документа показано на рис. 3.11. Порядок просмотра данного документа будет следующим:
□ корневой узел;
□ узел комментария <!-- start -->;
□ узел инструкции по обработке <?app open?>;
□ узел элемента a;
□ узел пространства имен "urn:а";
□ узел пространства имен "urn:b";
□ атрибут level;
□ текстовый узел "alpha";
□ узел элемента b:bravo;
□ узел пространства имен "urn:а";
□ узел пространства имен "urn:b";
□ комментарий с текстом "To do ...";
□ элемент charlie;
□ узел пространства имен "urn:а";
□ узел пространства имен "urn:b";
□ текстовый узел "delta";
□ узел инструкции по обработке <?арр close?>.
Рис. 3.11. Схема дерева XML-документа
Соответственно, обратный порядок просмотра документа будет начинаться с инструкции по обработке <?app close?> и заканчиваться корневым элементом.
Типы данных