Алексей Кутовенко - Профессиональный поиск в Интернете
Яндекс отличается гибким и достаточно подробным языком поисковых операторов, который можно использовать при составлении запроса. Подробный перечень доступных операторов, а также примеры их использования приведены в приложении А.
Из дополнительных поисковых инструментов отметим панель для браузеров Яндекс.Бар. Она предлагает быстрый поиск на всех сервисах Яндекса, умеет подсвечивать найденные слова на веб-страницах, а также переводить выделенные пользователем слова на иностранные языки.
Bing
Историю интернет-поиска от Microsoft простой не назовешь. На последовательно предлагаемых публике сервисах неоднократно менялись алгоритмы, используемые базы данных и, конечно же, названия. До начала 2000-х поисковик не располагал собственными базами и работал с внешними индексами от AltaVista, Inktomi и Looksmart. Первоначальное имя MSN Search использовалось до 2006 года, а затем на несколько лет изменение названий поисковика стало для Microsoft традицией.
Вместе с окончательным переходом на поиск в собственных индексныхMSN Search была переименована сначала в Windows LiveLive Search. Наконец, в начале лета 2009 на смену Live Search пришел новый поисковый проект Bing.
«Bing позволит иначе взглянуть на поиск информации в интернете и поможет пользователям в принятии важных решений», – именно таким заявлением начинался пресс-релиз Microsoft, посвященный запуску Bing. Стремления разработчиков были понятны: поисковики от Microsoft, несмотря на все старания, на Западе стабильно уступали по популярности лидерам – Google и Yahoo!. Если же говорить о русскоязычных версиях предыдущих поисковых проектов Microsoft, то по количеству и качеству находимых ссылок они намного уступали крупным российским поисковикам. В попытке догнать конкурентов разработчики Bing сделали ставку на улучшение качества поиска и внедрение новых технологий, многие из которых были приобретены вместе с создавшими их фирмами.
Необходимо заметить, что русскоязычная версия Bing, как и большинство других локализованных версий, лишена ряда дополнительных функций, например поиска по магазинам. Поскольку они, по сути, работают только в Северной. Америке, подробно останавливаться на них смысла нет.
В настоящее время Bing работает по собственным индексным базам и предлагает поиск веб-страниц, изображений и видеороликов. Все эти базы представлены в виде вкладок над главным полем поиска.
При поиске веб-документов доступны режимы простого и расширенного поиска. Интерфейс такого привычного элемента, как форма расширенного поиска, в Bing выполнен достаточно интересно. Форма открывается не в новом окне, а прямо на странице выдачи, что достаточно удобно, поскольку результаты изменения запроса на странице выдачи отражаются сразу, и уточнение запроса происходит весьма быстро.
К сожалению, система Bing лишена некоторых полезных и привычных на других крупных поисковиках функций. Например, она не обрабатывает слова, по ошибке набранные в другой раскладке, что уже давно умеют делать многие конкуренты. Не справляется она и с опечатками в ключевых словах – как на русском, так и на английском языках.
Форма расширенного поиска Bing состоит из четырех вкладок. Вкладка Условия поиска предлагает работу с логическими операторами, которые выбираются в предлагаемом выпадающем меню. Новые ключевые слова с автоматически добавленными операторами присоединяются к исходному поисковому запросу. Вкладка Веб-сайт или домен позволяет вести поиск только на конкретном сайте или домене, а также исключать соответствующие ресурсы из результатов поиска. Вкладки Страна или регион и Язык в полном соответствии со своими названиями дают возможность ограничить поиск определенным национальным сегментом интернета или же веб-страницами на указанном языке. Отметим, что в отличие от Google и Яндекс, в Bing поиск можно вести одновременно по нескольким выбранным языкам. Для этого достаточно добавить несколько соответствующих условий в форме расширенного поиска.
Страница поисковой выдачи Bing состоит из области просмотра результатов и боковой панели, содержащей вспомогательные инструменты. При веб-поиске на этой панели демонстрируются предложения по уточнению запроса. Надо сказать, что данная технология действительно работает неплохо и помогает быстро уточнять запросы. Для найденных ссылок показываются заголовок и адрес веб-страницы, краткая текстовая выдержка, а также ссылка на кэшированную версию страницы (рис. 1.6).
Рис. 1.6. Форма расширенного поиска Bing открывается прямо на странице результатов поиска
Мультимедиа-поиск Bing представлен базами изображений и видео. Для поиска изображений предлагается только режим простого поиска. Инструменты уточнения запроса вынесены на боковую панель страницы выдачи Доступны несколько фильтров. К традиционным для современных универсальных поисковиков отнесем фильтры размера картинки и ее цветности. В меню фильтра размера изображения присутствует пункт. Фоновые рисунки, который позволяет отбирать картинки в стандартных разрешениях для использования в качестве «обоев» рабочего стола персонального компьютера. Фильтр Макет позволяет отобрать изображения различных форматов: квадратные, широкоэкранные, а также высокие, то есть ориентированные по вертикали.
Гораздо интересней эффект применения фильтров, анализирующих визуальные характеристики самого изображения. Фильтр Стиль достаточно успешно отличает фотоснимки от рисунков и коллажей. Любопытен поиск по наличию на изображении людей, который предлагает несколько возможностей: можно искать только лица, портреты или же изображения людей в полный рост. Работает этот фильтр весьма качественно. Отметим, что система неплохо справляется даже с рисованными изображениями.
Дополнений у поисковика Microsoft Bing немного. Предложения ограничиваются поисковыми плагинами для браузеров.
Exalead
Одной из особенностей Европы, в том числе и в сфере интернет-поиска, является большое количество национальных языков. Поисковик, претендующий на место ведущего в Европе, просто обязан хорошо индексировать национальные сегменты интернета и качественно обрабатывать запросы на многочисленных европейских языках – как крупнейших, так и менее распространенных. Именно в данной области европейская разработка может получить серьезное конкурентное преимущество по сравнению с мощными заокеанскими конкурентами. На роль такого европейского поисковика в настоящее время всерьез претендует система Exalead. Данный проект был разработан в рамках исследовательской программы Quaere, финансируемой Евросоюзом.
Exalead располагает собственными индексными базами. Основные поисковые ресурсы системы – это базы веб-документов, изображений, видео и новостей. Стартовая страница Exalead предлагает возможность персональной настройки. На этой странице можно разместить ссылки на свои любимые сайты – они будут отображаться в виде графических миниатюр-скриншотов. Правда, для этого придется бесплатно зарегистрировать аккаунт, а также разрешить браузеру хранить куки-файлы Exalead.
Веб-поиск Exalead предлагает режимы простого и расширенного поиска. Форма расширенного поиска, как и в Bing, открывается прямо на странице выдачи Отметим, что Exalead предлагает не просто привычную форму с набором дополнительных полей, а сложное выпадающее меню, которое играет роль мастера по уточнению запроса (рис. 1.7). При выборе того или иного пункта в меню мастера в строку запроса добавляются новые элементы, а при необходимости операторы и спецсимволы.
Рис. 1.7. Мастер расширенного поиска Exalead
В меню мастера выделено три тематических блока. Первый блок дает возможность определиться с вариантами уточнения запроса. Предлагаются поиск по фразе, обязательное включение и исключение заданных пользователем слов, а также поиск с помощью масок. Поддерживается использование в запросе стандартных логических операторов. Кроме этих базовых опций, предлагаются и более интересные варианты. В режиме Approximate Spelling Search ищутся слова, подобные по написанию заданным. Режим Phonetic Search позволяет найти слова, похожие по своему звучанию на указанные пользователем. Если предложения по исправлению опечаток уже давно можно найти на других поисковиках, то поиск по звуковой транскрипции слова можно назвать новинкой.
Оставшиеся два блока расширенного поиска предлагают отфильтровать результаты по дате их появления в индексе поисковика, а также ограничить поиск определенным сайтом, заголовком страницы или другим формальным признаком.
Каждую позицию в перечне найденных ссылок на странице выдачи сопровождают миниатюры-скриншоты страниц и краткая текстовая аннотация (рис. 1.8). Страница выдачи Exalead также отличается широким выбором вспомогательных инструментов, собранных на боковой панели. Первый блок фильтров позволяет ограничить выдачу результатами, найденными на сайтах и в блогах. Следующие два блока позволяют отобрать контент определенного формата. Распознается большое количество «офисных» форматов файлов, а также видео– и аудиофайлы. Фильтр даты публикации позволяет быстро просмотреть результаты, проиндексированные в определенный промежуток времени. По умолчанию шаг такого фильтра – один год. Фильтр Related Terms предлагает ознакомиться с автоматически подобранными дополнительными ключевыми словами, которые способны помочь в уточнении запроса.