KnigaRead.com/

Александр Щербина - Интернет для ваших родителей

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Александр Щербина, "Интернет для ваших родителей" бесплатно, без регистрации.
Перейти на страницу:

□ и, наконец, вариант Текстовый файл — в этом случае создается обычный текстовый документ с расширением txt, в котором сохраняется вся текстовая информация страницы, но без какого бы то ни было форматирования. Это самый экономный способ сохранения, он занимает на диске минимум пространства. Правда, работать с таким документом не очень удобно.

После сохранения информация будет доступна вам даже без подключения к Интернету.

В качестве упражнения сохраните несколько страниц разными способами и оцените их достоинства и недостатки.

Глава 2

Поиск информации в Интернете

Любая область человеческой деятельности в том или ином виде нашла свое отражение в Интернете. Важнейшая задача — уметь быстро найти то, что интересует именно вас. Сейчас проводятся международные соревнования по поиску информации. Возможно даже, что поиск информации станет олимпийским видом спорта. Во многом успех зависит от интуиции ищущего и даже от везения. Мы рассмотрим правила и рекомендации специалистов, а дальше все будет зависеть от вас. Большое значение имеет опыт. Поначалу вы станете тратить много времени на поиск простых вещей, а со временем за гораздо меньшее время сможете отыскивать интересную и полезную информацию.

Каталоги

Если вы сами не можете точно сформулировать, что вас интересует — например, что-нибудь про Интернет, то можно воспользоваться каталогом. В Интернете существуют десятки тысяч различных каталогов. Для примера рассмотрим крупнейший русскоязычный каталог mail.ru (рис. 2.1).

На сайте mail.ru найдите ссылку каталог сайтов. Возможно, что страница, открытая вами, будет отличаться от той, что изображена на рис. 2.1. Но принцип каталогов схож — все они имеют древовидную структуру.

Для начала нужно сообразить, в каком разделе каталога могут находиться сайты, посвященные Интернету. Скорее всего — это раздел, который так и называется — Интернет (рис. 2.2).

На этом уровне мы видим, какие подразделы содержатся в данном разделе. Цифры в скобках справа — количество сайтов в подразделе. Конечно, не все эти сайты впрямую посвящены Интернету.

В каталог сайты попадают только по заявке разработчика, который сам выбирает раздел, куда его поместить. Если в каталоге нет конкретного сайта, это означает лишь то, что его хозяин не подал заявку на размещение в каталоге ссылки на его сайт. К тому же регистрация в некоторых каталогах, в частности, в каталоге mail.ru — платная. Возможно, существует еще очень большое количество сайтов на эту тему, хозяева которых решили сэкономить на регистрации.

Перейдем по ссылке Введение в Интернет (рис. 2.3). Вначале как всегда — реклама. Сайты без номера попали сюда на правах рекламы за достаточно большие деньги.

Побродите по каталогу. Возможно, вы найдете для себя что-то неожиданное и интересное. Посмотрите другие каталоги. Сравните их с каталогом mail.ru.

Поисковики

Если вас интересует конкретный вопрос, то лучше обратиться к услугам поисковой машины (ПМ), или поисковой системы (ПС), или, попросту, к поисковику. Поисковик — это довольно сложная компьютерная программа, снабженная зачатками искусственного интеллекта и умеющая самостоятельно обучаться. Система круглосуточно, без выходных и перерывов на обед, сканирует Интернет. Она переходит по ссылке на страницу, находит там новые ссылки, переходит по ним далее и за какое-то время обходит всю сеть. Это время, несмотря на большую скорость работы программы, превышает месяц. Столь большой период обхода объясняется огромным количеством страниц и тем, что постоянно возникают новые страницы и сайты, а какие-то закрываются. Эта часть поисковика называется пауком.

Загрузив страницу, система анализирует ее. Она ищет так называемые ключевые слова, то есть слова, которые могут использовать пользователи при поиске информации. Информация о странице сохраняется в базе данных поисковика.

По запросу пользователя поисковик анализирует свою базу данных и выдает результат обработки запроса в виде списка ссылок на те страницы, где, возможно, существует ответ на вопрос, интересующий пользователя.

Например, мы хотим найти каталоги сайтов. Используем для этого поисковик. Один из популярнейших русскоязычных поисковиков — yandex.ru. Загрузите главную страницу этого сайта.

В центральной части страницы находится поле, предназначенное для ввода поисковых запросов. Как только мы начнем набирать каталог сайтов, программа станет предлагать нам готовые варианты запросов. С первой же буквы второго слова появится нужный вариант (рис. 2.4). Если по нему щелкнуть, то загрузится страница с результатом обработки нашего запроса (рис. 2.5).

Прежде всего, обратите внимание, что по нашему запросу нашлось 270 млн страниц, на которых присутствуют какие-либо каталоги сайтов.

На текущей странице приведен список из десяти сайтов с их кратким описанием. Следующие страницы продолжают этот список. Внизу страницы находится строка навигации с номерами страниц. Сайты в этом списке располагаются в соответствии с неким рейтингом, который определяет сам поисковик.

Попасть «на первую страницу Яндекса», да еще и по интересному запросу — мечта любого хозяина сайта.

При поиске существуют две крайности: в одном случае поисковик сообщает, что по нашему запросу ничего не найдено, в другом — предлагает многомиллионный список, который не просмотреть и за всю жизнь. Если я в строке запроса попрошу работу недалеко от дома, с хорошей зарплатой и необременительными обязанностями, то поисковик, скорее всего, сообщит, что по моему запросу ничего не найдено. Если же я введу в поле поиска слово работа, то мне будет предложен список из более полумиллиарда страниц. Задача в идеале сводится к тому, чтобы, сужая поиск, получить список из нескольких страниц, на которых наверняка присутствует ответ на наш запрос. Если после запроса работа поставить флажок в Санкт-Петербурге, то из 505 млн страниц останется только 14 миллионов. Конечно, это тоже очень много. Далее можно конкретизировать область деятельности и поискать в найденном.

Если вопрос простой, то ответ будет найден на первой же странице из списка. В этом случае нас мало интересует его длина. Например, на запрос курса валют на сегодня вы очень легко найдете ответ на странице поиска, даже не заходя на следующие страницы, — попробуйте.

Язык запросов

Для более профессионального поиска существует специальный язык запросов. Рассмотрим использование этого языка на примере поиска слов песни «Яблоки на снегу». Ничего личного! Я не предлагаю вам петь эту песню. Ну, случайно пришла на ум. Можете потом поискать слова ваших любимых песен.

Для начала определимся, что нет смысла в поле ввода поисковика вводить запрос Яблоки на снегу. Поисковик в запросе игнорирует предлоги, поэтому результаты поиска по запросу яблоки снегу будут очень похожи. Впрочем, можно просто написать яблоки снег — для поисковика и этого достаточно. Он настолько умен, что понимает, что люди идут и человек шел — это, по сути, одно и то же, хотя приведенные слова не имеют даже общего корня.

В языке запросов существуют специальные логические операторы. Вот, наиболее используемые из них:

□ логическое и;

□ логическое или;

□ логическое нет.

В разных поисковых системах для обозначения логических операторов применяются свои специальные символы. В примерах мы будем использовать условные обозначения.

Так по запросу яблоко или снег — будет найдено множество страниц, на которых присутствует слово «яблоко», множество страниц, на которых есть «снег», а также множество страниц, на которых есть как слово «яблоки», так и слово «снег». Правда, слова эти могут быть и не связаны. В одной статье будет рассказываться об урожае яблок в колхозе, а в новостях будет сообщаться о том, что в Мурманске выпал снег.

Поэтому при решении задачи по поиску слов песни нам выгоднее составить запрос с использованием оператора и: яблоко и снег. В этом случае будет отметено множество страниц, на которых есть отдельно «яблоки» и отдельно «снег».

Для демонстрации использования оператора нет рассмотрим другой пример. Допустим, нас интересует информация о Париже. Если мы напишем в поисковике Париж, то будем завалены предложениями турагентств о турах в Париж, о горящих путевках, скидках и пр. Страниц о самом Париже будет относительно мало. Это объясняется очень большой активностью в Интернете турагентств. Поэтому есть смысл составить запрос: Париж нет агентства. Тогда множество страниц туроператоров будут отсеяны. Но разработчики сайтов и рекламщики — ребята ушлые, поэтому наиболее хитрые обойдут и это ограничение.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*