KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Интернет » Алексей Кутовенко - Профессиональный поиск в Интернете

Алексей Кутовенко - Профессиональный поиск в Интернете

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Алексей Кутовенко, "Профессиональный поиск в Интернете" бесплатно, без регистрации.
Перейти на страницу:

Поиск в веб-документах предлагает режимы простого и расширенного поиска. Простой поиск не предоставляет каких-либо фильтров, что компенсируется возможностью автоматического разбора запросов на естественном языке, уверенной обработкой относительно длинных запросов, а также системой автоматического дополнения запроса. Максимальная длина запроса – сорок слов.

Форма расширенного поиска для составления запроса предлагает только одно поле. Логические операторы, связывающие слова запроса, предлагается вводить вручную, благо. Яндекс располагает достаточно подробным языком запросов. Остальные инструменты формы расширенного поиска – это различные фильтры (1.4).

Рис. 1.4. Форма расширенного поиска системы Яндекс

Поле На сайте позволяет ограничить поиск определенным сайтом. Поле В регионе является фильтром, с помощью которого можно перейти к локальному поиску в ресурсах, связанных с определенной географической областью.

Фильтр Слова позволяет гибко управлять областью поиска указанных ключевых слов. Поиск может вестись как во всем тексте веб-страниц, так и ограничиваться только их заголовками. Здесь же находится группа переключателей, отвечающая за работу механизма учета морфологии в ходе поиска. Переключатель В любой форме дает поисковику команду искать не только указанную в запросе форму слова, но и другие его варианты. Переключатель Точно так, как в запросе отключает эту функцию Яндекса для всех слов запроса. Фильтр Язык ограничивает область поиска только документами на определенном языке. Поддерживается восемь языков, в том числе украинский, белорусский, татарский и казахский – достаточно редкие гости на других поисковых системах.

Фильтр Дата обновления позволяет указать временной промежуток создания или обновления нужных веб-страниц. Помимо перечня интервалов, данный фильтр позволяет указать произвольный диапазон дат. Фильтр Формат отвечает за выбор форматов нужных документов. Кроме веб-страниц в формате HTML, Яндекс индексирует файлы Microsoft Office (DOC, XLS, PPT), RTF, PDF и Flash-ролики. Интересно, что при ранжировании результатов поиска файлов различных типов используются стандартные алгоритмы Яндекса для работы с текстом и особенностями оформления. Для проиндексированных файлов названных типов в кэше поисковика сохраняется их текстовая версия.

Под формой составления запроса выводится блок, в котором составленный с помощью перечисленных инструментов запрос формулируется в виде текста на естественном языке. Это позволяет лучше представить условия запроса и избежать логических несоответствий.

Страница выдачи результатов поиска содержит список найденных ссылок. По умолчанию он сортируется по релевантности. Поддерживается также сортировка результатов по дате публикации или обновления. Переключатель режимов сортировки находится в нижней части страницы.

Для каждого результата приводится заголовок страницы, текстовая выдержка, ссылки на сохраненную копию страницы и другие результаты этого запроса к данному сайту. Для крупных интернет-ресурсов демонстрируются также ссылки на их основные разделы Наблюдать работу этого механизма можно, например, в результатах, полученных на крупных справочных ресурсах.

Непосредственно возле поля запроса находятся переключатели режимов поиска в найденном и локального поиска. Регион для локального поиска определяется автоматически, на основе IP-адреса пользователя. Изменить его можно вручную при общей настройке механизма поиска Яндекса.

Боковая панель страницы выдачи предлагает ссылки на результаты поиска по введенному пользователем запросу в вертикальных базах изображений и видео. Каких-либо дополнительных инструментов быстрого уточнения запроса на странице выдачи Яндекса нет (рис. 1.5).

Рис. 1.5. Страница выдачи поисковой системы Яндекс

После регистрации бесплатного аккаунта открывается доступ к службе «Мои находки». Она предназначена для сохранения истории поиска с помощью Яндекса. Любопытно, что сохраненные запросы впоследствии демонстрируются в списке автоподсказок при наборе нового запроса в поле поиска.

Новостной поиск Яндекса основан на индексировании ресурсов, участвующих в партнерской программе поисковика. Для попадания в индекс ресурс должен удовлетворять ряду требований как технического плана, так и организационного. В частности, сайт должен предлагать оригинальный контент, регулярно обновляться, а также иметь определенный стаж работы в интернете.

При поиске новостей на первый план выходит оперативность обновления индексных баз. Для решения этой задачи используется особый робот-индексатор, способный обрабатывать ресурсы в течение короткого промежутка времени. В результатах поиска можно увидеть ресурсы, обновленные десяток минут назад. Правда, такая оперативность достигается не для всех ресурсов, и в среднем Яндекс индексирует новости немного медленней, чем Google.

Форма расширенного поиска в новостях значительно отличается от аналогичной формы обычного веб-поиска. С ее помощью можно выбрать одну или несколько новостных рубрик для поиска и определиться с регионом, к которому должны относиться новостные сообщения. Фильтр Источники содержит перечень новостных ресурсов, с которыми работает Яндекс. При необходимости в этом списке можно отобрать только нужные источники и ограничить ими поиск.

Страница результатов поиска в новостях также имеет свои отличия. Фильтр Результаты поиска не только выводит статистику проведенного поиска, но и позволяет одним щелчком отобрать видеосообщения, статьи или интервью. Здесь же выводятся ссылки на так называемые пресс-портреты героев новостей, найденных по запросу пользователя. Пресс-портрет содержит краткую характеристику персонажа, его основной деятельности, список доступных интервью, перечень последних новостей, а также список пресс-портретов людей, часто упоминающихся в новостях вместе с данной личностью. Необходимо отметить, что пресс-портрет – это не заранее составленная справочная статья, а результат автоматической обработки информации новостных ресурсов.

Фильтр времени публикации позволяет отбирать новости по запросу за определенный промежуток времени – от текущего дня до месяца. А вот расположенная непосредственно под полем запроса панель с перечнем основных новостных рубрик поисковым фильтром не является – это просто ссылки на тематические страницы с последними новостями.

Результаты поиска по умолчанию группируются по сюжетам – подборкам новостей, посвященных одному событию, что позволяет составить мнение о том или ином событии по материалам нескольких источников. Для каждого результата приводятся заголовок, источник и время публикации.

Сервис Яндекс. Словари является справочным ресурсом. Он предлагает поиск по крупным онлайновым словарям и энциклопедиям, а также перевод на иностранные языки. Для уточнения запроса служит фильтр типа справочного ресурса. Поиск может быть ограничен только энциклопедиями или только результатами перевода. На странице выдачи результаты группируются по видам словарей, в которых было найдено определение ключевого слова из запроса. Сначала выводятся результаты универсальных источников, затем – тематических словарей и справочников. Результаты перевода на другие языки демонстрируются на отдельной панели.

Сервис Яндекс. Блоги работает с крупными блог-площадками, а также форумами, экспортирующими информацию о своих сообщениях в формате RSS. Доступны простой и расширенный режимы поиска. Простой поиск не предлагает каких-либо дополнительных инструментов, кроме самой строки поиска. Режим расширенного поиска здесь обладает своей спецификой, отражающей особенности контента. Фильтр Область поиска позволяет выбирать для поиска конкретный вид социального ресурса: блог, микроблог или форум. Поддерживается поиск в конкретном ресурсе и в диапазоне указанных пользователем дат. Особенно интересен блок фильтров. Автор. Он позволяет искать сообщения конкретного автора или сообщества. Кроме того, предлагается фильтр персональных характеристик автора: возраст, местоположение, пол и даже музыка, прослушиваемая автором в момент публикации записи, если, конечно же, в блоге есть такая информация. При поиске в блогах поддерживаются все стандартные поисковые операторы Яндекса, а также некоторое количество специальных операторов, которые в большинстве своем воспроизводят функции фильтров расширенного поиска.

Яндекс отличается гибким и достаточно подробным языком поисковых операторов, который можно использовать при составлении запроса. Подробный перечень доступных операторов, а также примеры их использования приведены в приложении А.

Из дополнительных поисковых инструментов отметим панель для браузеров Яндекс.Бар. Она предлагает быстрый поиск на всех сервисах Яндекса, умеет подсвечивать найденные слова на веб-страницах, а также переводить выделенные пользователем слова на иностранные языки.

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*