Владимир Вуль - Электронные издания
✓ использование HTML-форм и CGI-скриптов для их обработки;
✓ динамические публикации страниц в формате IDC/HTX;
✓ публикации динамических Web-страниц в формате ASP;
✓ применение специальных страниц доступа к данным.
Первый вариант связан с пересылкой на сервер запроса в виде HTML-формы, в которой указаны переменные, текущие значения которых требуется узнать. На сервере с помощью CGI-скриптов эти формы обрабатываются и с помощью интерфейса с СУБД, поддерживающей локализованную на нем же базу данных, возвращаются новые значения соответствующих величин, которыми заменяют прежние [11, 15]. Этот способ обеспечивает максимальную гибкость, но требует создания и хранения на сервере CGIскриптов и других пользовательских процедур. Другие варианты организации динамической связи требуют, чтобы на сервере был определен соответствующий источник данных. Технология IDC (Internet Database Connector – средство связи сети Интернет с базой данных)/HTX (HTml eXtension – расширение языка HTML) позволяет передать параметры запроса пользователя к базе данных как часть сообщения от браузера на сервер, получая в ответ динамически сформированную Web-страницу. Запрос, посылаемый серверу, – это текстовый файл в формате IDC, в котором содержится набор операторов языка SQL (Structured Query Language – язык структурированных запросов).
Язык SQL поддерживается практически всеми СУБД. В данном случае с его помощью формируется описание действий, которые выполняются на серверной стороне. Соответственно IDC-файл является исполняемым и на сервере должен размещается в папке Scriots (сценарии), предназначенной для исполняемых процедур. Пользователь обязан иметь возможность занесения файлов в эту папку. В составе IDC-файла должен также находиться шаблон, описывающий Web-страницу, в составе которой находится таблица, форматирование которой определяет, каким образом будут отображаться данные, извлеченные из базы.
Какой же порядок динамического взаимодействия между пользователем и базой данных? Пользователь вводит в адресном окне браузера адрес IDCфайла. Web-сервер отыскивает этот файл в папке Scripts и активизирует динамическую библиотеку httpodbc.dll. Процедуры этой библиотеки просматривают IDC-файл и определяют имя внешнего источника данных (URL базы данных). Из библиотеки выбирается нужный драйвер, который взаимодействует с источником данных, выполняя запрос на языке SQL, и извлекает нужную информацию из этого источника. После этого специальная процедура библиотеки получает из IDC-файла имя шаблона и формирует на основании его гипертекстовый файл, который отсылается браузеру компьютера клиента. Наконец, последний формирует и отображает Web-страницу в своем окне [15].
Технология публикаций ASP (Active Server Pages) подобна рассмотренной первой. Отличие лишь в том, что она адаптирована к использованию Webсервера, работающего в операционной системе Windows и вместо CGIскриптов использует процедуры взаимодействия, написанные на языке VBScript – одной из ветвей языка Bisual Basic.
Самой современной и наиболее эффективной в настоящее время является технология динамической публикации на основе страниц доступа к данным (Data Access Pages – DSP). Страница доступа к данным представляет собой Web-страницу, на которой размещены связанные с внешним источником данных компоненты ActiveX (см. разд. 4.4), а также процедуры, написанные на языке VBScript. Сочетание гибкости управления объектами страниц доступа к данным с мощными функциональными возможностями компонентов ActiveX делает такую технологию чрезвычайно эффективной для организации удаленного доступа к данным и их динамической публикации на Web-страницах.
Страницы доступа к данным интегрированы в СУБД MS Access, причем в окне базы данных им отведена отдельная вкладка "Группы". Они разрабатываются в режиме "Конструктор страниц". Разработанные страницы доступа следует поместить в соответствующую папку Web-сервера. В самой базе данных остаются ярлыки, указывающие на файлы гипертекста, описывающие эти страницы. Использование страниц доступа к данным позволяет создавать интерактивные отчеты, формы для удаленного ввода, редактирования и удаления записей в базе данных, средства для удаленного анализа данных.
Детальное изучение этих технологий не входит в содержание нашей книги. Поэтому мы отсылаем всех интересующихся данным вопросом к книгам [28, 36]. Некоторые сведения по принципам и применению CGI-технологий можно извлечь также из книги [32] и статьи [15].Контрольные вопросы
1. Какие отдельные подсистемы, по вашему мнению, должны входить в состав информационной системы современного издательства? Попробуйте перечислить эти подсистемы и обосновать их необходимость.
2. Какими свойствами должна обладать информационная система современного издательства? Можете ли вы привести пример издательства, где все эти свойства реализованы?
3. Зачем в издательстве нужна интрасеть? Какие функции возлагаются на нее? Вы сталкивались с ними?
4. В каких издательствах требуется экстрасеть и какие функции на нее возлагаются? Вам приходилось сталкиваться с экстрасетями? Какое у вас осталось о них впечатление?
5. Какой компонент издательской системы является, по вашему мнению, основным? Почему вы так считаете?
6. Что должно быть сделано в издательской информационной системе для автоматизации ввода публикаций и их атрибутов? Что для этого требуется от самих публикаций?
7. Какие средства для выделения нетривиальной (существенной) информации из текстовых фрагментов и иллюстраций вы знаете? В чем трудности выделения такой информации из аудио– и видеофрагментов?
8. Какие, по вашему мнению, требуются программные и информационные средства доставки публикаций из хранилища на рабочее место пользователя системы? Чем принципиально отличаются средства доставки мультимедиа-информации?
9. Как должно быть реализовано рабочее место пользователя в издательской информационной системе? С чем должны взаимодействовать клиентские программные средства и какие функции они выполняют?
10.Какие протоколы для передачи данных используются в интрасетях? Как они согласуются с протоколами в сети Интернет?
11.Какие простейшие способы защиты информации применяются для интрасетей? Что такое "брандмауэр" в информационных технологиях? Как он работает?
12.Что такое "Обеспечение для групповой работы"? Какие его основные функции и в чем состоят его преимущества?
13.Попробуйте сформулировать, в чем состоят основные функции интрасетей?
14.Какие вы можете назвать преимущества использования интрасетей? Попробуйте перечислить главные из них.
15.Какие основные требования предъявляются к издательской базе данных или информационному хранилищу издательства? Попробуйте перечислить основные из этих требований.
16.Какими способами или методами организуется хранение электронных публикаций? В чем вы усматриваете различия между ними? Каковы преимущества и недостатки каждого из них?
17.Для чего нужна поисковая система и какие способы организации поиска вы знаете? В чем различия между ними? Какой поисковой системой вы пользовались и в каких случаях?
18.Какие модели полнотекстового поиска вы знаете? В каких ситуациях вы пользовались этими моделями? В чем отличие между ними? Какая модель более эффективна и в каких случаях?
19.Какие критерии эффективности полнотекстового поиска вы знаете? Что такое "точность" и "охват" как характеристики эффективности поиска в системе? Какими соотношениями они связаны?
20.Как оптимизировать структуру издательской базы данных, чтобы она наиболее полно соответствовала предъявляемым требованиям?
21.Какие вы знаете технические средства для долговременного (многолетнего) хранения информации? Чем они отличаются друг от друга с точки зрения технических и стоимостных характеристик?
22.Какие параметры следует хранить в атрибутивной базе данных? Как и по каким параметрам следует реализовать поиск в такой базе?
23.Как и по каким критериям следует строить интерфейс системы поиска изданий по ключевым словам? Как осуществлять выбор ключевых слов и их соединение в логические конструкции?
24.Какие технические средства для доставки потоковой информации клиенту вы знаете? В чем их отличия от обычных персональных компьютеров?
25.Какие файловые и операционные системы используются для доставки информации клиенту?
26.Какая модель взаимодействия медиа-сервера с клиентом применяется в таких системах?
27.Какие подсистемы используются на клиентском (пользовательском) рабочем месте? Назначение каждой их этих подсистем?
28.Как на практике осуществить публикацию содержимого баз данных в виде статических Web-страниц?
29.В чем состоят особенности публикации содержимого баз данных в виде динамических Web-страниц? Какие вы знаете варианты динамического связывания этих страниц с внешними источниками информации?
30.Какой вариант динамического связывания Web-страниц с внешними источниками представляется вам более предпочтительным? По каким причинам? Приходилось ли вам работать со скриптами? Пытались ли вы использовать в них язык Perl?