Сидни Фейт - TCP/IP Архитектура, протоколы, реализация (включая IP версии 6 и IP Security)
19.4.7 URL для WAIS
Хотя и редко используемый (если вообще когда-либо), URL был определен для доступа к базам данных WAIS по протоколу Z39.50. Например, интерфейс для каталога общедоступного сервера WAIS имеет форму:
wais://cnidr.org/каталог_сервера
В общем случае URL для WAIS имеют формат:
wais://хост:порт/база_данных
wais://хост:порт/база_данных?search
wais://хост:порт/база_данных/тип/путь
На момент выхода книги немногие (если вообще какие-нибудь) браузеры поддерживали протокол доступа к WAIS. Поиск в базах данных обычно выполняется путем заполнения форм и отправки их на сервер WWW, который должен запустить соответствующее поисковое средство.
19.5 Обобщенный формат URL
Обобщая вышесказанное, отметим, что:
■ URL начинается с указания используемого протокола доступа.
■ Для всех приложений, кроме сетевых новостей и электронной почты, далее следует разделитель ://.
■ Затем указывается имя хоста сервера.
■ Наконец определяется ресурс (иначе будет извлечен файл по умолчанию).
Для сетевых новостей и электронной почты местоположение нужного сервера новостей и почтового шлюза определяется конфигурационной информацией браузера. Применяется только часть разделителя (:), и в URL не указывается никакой серверный хост.
19.5.1 Специальные символы
Иногда идентификатор ресурса содержит пробелы или иные специальные символы (например, слэш или двоеточие), которые применяются в URL как разделители. Например, имена файлов Macintosh и Windows 95 могут содержать пробелы и другие необычные символы.
Специальные символы в именах ресурсов записываются строкой, начинающейся с символа процентов (%). Такое отображение показано в таблице 19.1.
Таблица 19.1 Отображение специальных символов
Специальный символ Пробел / # = ; ? : ~ Представление %20 %2F %23 %3D %3B %3F %3A %7E19.6 Введение в HTML
Документы WWW с гипертекстовыми ссылками записываются на языке разметки гипертекста (Hypertext Markup Language — HTML). Гипертекстовые файлы, совместимые с версиями 1 и 2 HTML, обычно имеют имена в формате:
имя_файла.html
Файл, содержащий расширенные возможности версии 3, именуется как:
имя_файла.html3
На компьютерах DOS и Windows применяется суффикс htm или ht3.
HTML основан на обобщенном стандарте разметки гипертекста (Standard Generalized Markup Language — SGML). Основная идея состоит в размещении в документе специальных тегов для идентификации таких элементов, как заголовки, подзаголовки, границы параграфов, маркированные списки, графические символы и т.д.
HTML должен быть независим от платформы, чтобы обеспечить просмотр гипертекстового документа любыми клиентскими устройствами: от неинтеллектуальных терминалов до мощных рабочих станций. Клиенты должны уметь выводить документы на экранах любого размера и использовать локально выбранные шрифты.
Далее мы рассмотрим основы HTML, следуя спецификации HTML версии 3. HTML становится очень большим по объему языком и имеет массу возможностей.
Например, можно не указывать описание структуры сложных форм при записи пересылаемых от клиента на сервер данных. Такие формы могут использоваться для ввода запросов в базу данных или заказов товаров в интерактивных магазинах.
Другая важная способность — это построение изображений с областями для щелчка мышью. Конечный пользователь может щелкать на области в изображении, чтобы выбрать связанный с этой областью документ.
19.6.1 Создание документа на HTML
Некоторые детали отображения документа оставлены клиенту. Браузер настольной системы обычно разрешает конечному пользователю выбрать шрифты для выводимого текста. Текст HTML-документа будет переформатирован согласно размеру окна экрана и выбранного шрифта. Автор документа HTML может определить следующие элементы:
■ Заголовки
■ Подзаголовки
■ Абзацы
■ Ссылки с помощью URL
■ Списки
■ Предварительно отформатированный текст
■ Форматирование символов
■ Специальные символы
■ Встроенные изображения
■ Внешние графические изображения
■ Формы для ввода данных
■ Карту областей щелчка мышью
■ Таблицы и формулы
Включенный в HTML-документ элемент определяется соответствующим тегом. Например, тег <TITLE> вводит заголовок документа.
Гипертекстовый документ можно создать, используя обычный текстовый редактор. Однако популярные программы текстовых процессоров обеспечивают подключаемые модули для автоматизации создания тегов и позволяют проводить работу в режиме "Что видим, то и получаем". Существуют специальные программные продукты для создания гипертекстовых документов. В них автоматизировано построение различных элементов и по желанию можно скрыть от пользователя примененные теги.
Хороший способ создания документа HTML состоит в том, чтобы отформатировать документ в обычном текстовом процессоре, а затем применить конвертер для автоматического преобразования в HTML.
Общее понимание принципов работы HTML полезно при рассмотрении способов наиболее эффективного использования любых его средств. Кроме того, постоянно появляются новые возможности в самом языке, которые еще не реализованы в соответствующих инструментах, и такого рода данные могут вводиться только вручную. К счастью, HTML достаточно прост для изучения.
19.6.2 Теги HTML
Тег состоит из названия элемента и параметров, заключенных в угловые скобки (<...>). Ниже мы рассмотрим наиболее широко используемые теги. Символы тегов не чувствительны к регистру, но для постоянства мы будем записывать их только в верхнем регистре.
Большинство тегов применяется парами, показывая начало и конец элемента. Заключительный тег имеет то же самое имя, что и начальный, но начинается с символа слэша </...>. Например:
<TITLE>Welcome То The Web</TITLE>
19.6.3 Общий формат HTML-документа
Несколько тегов служат для определения начала и конца HTML-документа или выделяют в нем заголовок и тело. Например:
<HTML> Начало гипертекстового документа.
<head> Начало заголовка.
<!--Last Modified on October 21, 1995--> Комментарий.
<base href = "http://www.abc.com/ind.html3"> Указывает размещение данного
документа.
<TITLE>Welcome to the Web</TITLE> Заголовок, обычно выводимый вверху
клиентского экрана.
</head> Конец заголовка.
<BODY> Начало тела документа.
...
</BODY> Конец тела документа.
</HTML> Конец гипертекстового документа.
19.6.4 Заголовки HTML
Главы, разделы и подразделы документа начинаются заголовками. Можно использовать шесть уровней заголовков, и каждый будет выведен собственным форматом. Например, заголовки первого уровня обычно представлены жирным шрифтом большого размера:
<Н1>Это заголовок первого уровня — самый главный</Н1>
<Н2>Заголовок второго уровня можно применять для разделов</H2>
<H3>Существуют еще заголовки уровней с третьего по шестой</H3>
19.6.5 Абзацы и разрывы
Автор должен указывать границы абзацев, иначе весь выводимый текст сольется вместе. Клиентская программа обычно объединяет повторяющиеся пробелы и пустые строки в один пробел или пустую строку, если не указано иное форматирование.
Старые версии HTML выделяли абзацы, помещая тег <P> в начале каждого нового абзаца:
<P>Это абзац.
<P>Это следующий абзац.
Это справедливо и для версии 3, но в ней можно применять и пару тегов, отмечающих начало и конец абзаца:
<P> Это абзац.</P>
По умолчанию большинство браузеров вставляет между абзацами пустую строку (в версии 3 есть теги для описания другого стиля абзацев, например, для отступа в первой строке). Если нужно начать новую строку, но не новый абзац, используют разрыв: