Алексей Кутовенко - Профессиональный поиск в Интернете
В Nigma работает система автоматического дополнения вводимого запроса. Помимо предложений по написанию запроса, здесь появляются дополнительные результаты: перевод вводимых слов на английский язык, короткие ответы на прямые вопросы к системе, а также справка из Википедии по теме запроса. Кроме того, по выпадающему меню автозаполнения можно перемещаться с помощью клавиатуры, что улучшает эргономику. В результате данное меню превратилось в самостоятельный и довольно мощный инструмент поиска.
При работе с англоязычными запросами можно воспользоваться инструментом. Англоподсказка, который подсказывает правильные грамматические конструкции для запросов на английском языке, подставляет в запрос синонимы, имеющие аналогичный русский перевод. Однако пока это экспериментальная функция и ее возможности ограничены.
Поисковик Nigma обладает мощной системой поиска ответов на конкретные вопросы, а также может решать математические примеры и работать с химическими реакциями – уникальное пока предложение среди универсальных поисковиков. Для некоторых типов задач (линейные, биквадратные, бикубические уравнения и другие) выводятся не только ответ, но и ход решения задачи. Кроме того, быстрые ответы на такие вопросы демонстрируются в меню автозаполнения.
Подводя итог, можно сказать, что за счет охвата всех крупных русскоязычных индексных баз Nigma – отличное решение для широкого поиска. А применение кластеризации позволяет быстро уточнять свой запрос даже при первоначальном поиске в условиях малознакомых тем, благо дополнительные ключевые слова предлагаются автоматически. В результате данную систему вполне можно рекомендовать для повседневного универсального применения (рис. 3.1).
Рис. 3.1. Российский кластерный метапоисковик Nigma
Для обработки массива найденных ссылок Nigma, как уже было сказано, использует кластеризацию по собственному алгоритму, оптимизированному с учетом особенностей русского языка. Интерфейс страницы выдачи Nigma состоит из основного списка результатов и боковой панели, в которой выводятся иерархический список выделенных системой кластеров, а также краткие справочные сведения о предмете поиска. При щелчке на кластере открывается не только страница соответствующих результатов, но и список вложенных кластеров, позволяющих уточнить запрос. Кроме того, в Nigma действует система фильтрации результатов – установив флажки возле нерелевантных кластеров, их можно быстро исключить из общей выборки.
Интересной экспериментальной функцией Nigma является инфопоиск. Посмотреть на результаты инфопоиска можно на общей странице выдачи Действует он следующим образом. При индексации веб-страницы разбиваются на отдельные блоки данных. Блоки, относящиеся к вашему запросу, добавляются к результатам поиска с высоким рейтингом. В результате на высоких позициях в списке выдачи пользователь видит не только ссылки на максимально релевантные веб-страницы, но и отдельные блоки данных для менее релевантных страниц. Это действительно удобно: мы не теряем полезную информацию из «длинного хвоста» результатов и экономим время, которое иначе пришлось бы потратить на просмотр дополнительных веб-страниц.
Новинками Nigma являются режимы табличного и музыкального поиска. Если ответы на запрос пользователя можно представить в структурированном виде, Nigma формирует на основе найденных данных таблицу и выводит ее на странице выдачи над общим списком результатов. Это удобный режим представления данных, ценность которого повышает возможность сохранения таблицы в формате CSV. К сожалению, эта экспериментальная функция пока работает только с очень небольшим количеством запросов, кроме того, она замедляет работу поисковика. Если для вашего запроса доступен режим таблицы, то на странице выдачи появится специальный значок.
Поиск музыки с помощью Nigma интересен тем, что при индексировании аудиофайлов информация извлекается из MP3-тегов, что позволяет реализовать режим структурированной демонстрации результата поиска. Сведения о найденном файле представляются в виде таблицы. Информация группируется по именам исполнителей, названиям альбомов и композиций, а также жанрам. Кроме того, на соответствующей панели выводится текст песни, если таковой был найден. В принципе, подобный режим поиска привычен при работе со всевозможными плеерами, поддерживающими создание библиотек мультимедиа, однако в сфере интернет-поиска, тем более универсального, это новинка, причем весьма удобная. Найденные записи можно прослушать прямо на странице результатов поиска – для этого в Nigma предусмотрен встроенный плеер. Заметим, что Nigma выдает прямые ссылки на файлы, а не отправляет пользователя на исходную веб-страницу. Пользователи Nigma могут загрузить на сервер собственные файлы в формате MP3, которые будут исправно проиндексированы и станут доступны для всех посетителей Nigma. Свои файлы при желании впоследствии можно будет удалить.
Nigma предлагает также метапоиск в базах изображений поисковиков, задействованных при обычном поиске документов. Здесь кластеризация не используется – доступна только группировка результатов по размерам картинок.
Yippy
Кластерный метапоисковик Yippy имеет уже достаточно богатую историю. Используемый в нем алгоритм был разработан компанией Vivisimo. Под этим же именем система поиска работала до 2004 года, когда на основе алгоритмов Vivisimo был создан метапоисковик Clusty. Помимо более простого интерфейса, эта система в отличие от «демонстратора технологий» Vivisimo была рассчитана на самую широкую публику. Наконец, в 2009 году вместе с очередным изменением интерфейса и появлением дополнительных возможностей метапоисковик получил и новое имя – Yippy, под которым он сейчас и работает.
Yippy получает данные из дюжины источников. Для веб-поиска используют результаты систем Bing, Ask, Yahoo! и Open Directory. Кроме веб-поиска возможен поиск в новостях и блогах. В случае новостей задействуются базы CNN, Yahoo! ТТН Times и Reuters. Для поиска в блогах используются базы Blogpulse, Blogdigger, Feedster и Technorati.
Если рассматривать список этих индексных баз с практической точки зрения, то можно сделать вывод, что поиск с помощью Yippy станет хорошим дополнением к поиску с помощью Google. У вас будет возможность просмотреть объединенные результаты практически всех основных поисковиков на одной странице, обеспечив тем самым значительное расширение базы поиска и экономию собственного времени. Доступные варианты поиска выводятся в виде вкладок над полем ввода запроса. Интересно, что набор этих вкладок, а также список используемых в них поисковых ресурсов можно настраивать. Кроме того, можно создать собственную вкладку и подобрать состав входящих в нее ресурсов. Для перехода к такой настройке служит ссылка Preferences, находящаяся справа от поля поиска. Другие элементы управления на странице настройки позволяют задать количество результатов на одной странице выдачи, а также состав вспомогательной информации, выводимой рядом со ссылками на странице выдачи (рис. 3.2).
Рис. 3.2. Yippy является одним из самых мощных кластерных метапоисковиков
Процесс составления запроса здесь не отличается от «обычных» поисковиков. Все дополнительные инструменты уточнения запроса собраны на странице выдачи Кластеры, которые здесь называются «облаками» (Clouds), представлены на боковой панели в виде наглядного иерархического дерева. По умолчанию показывается не все дерево, а только корневые разделы, которые можно раскрывать щелчками мыши. В нижней части боковой панели находится поле быстрого поиска в найденных кластерах (Find in clouds). После отработки уточненного запроса все кластеры, в которых встречается дополнительный термин, получают цветную подсветку. Кроме вкладки Clouds, на боковой панели расположены вкладки Sources и Sites. Они носят вспомогательный характер и позволяют сортировать результаты веб-поиска по другим признакам, например поисковым машинам, с которых были получены ссылки, или же по доменам найденных сайтов. Названия и содержание закладок Yippy изменяются в зависимости от типа поиска. Например, при поиске изображений кластеры выделяются по размерам изображений, имени и домену источника, а также типу файла.
Форма расширенного поиска, вызываемая ссылкой Advanced, содержит фильтры языка и типа файлов и позволяет ограничить поиск конкретным сайтом или доменом.
В аннотациях к найденным ссылкам на странице выдачи Yippy показывается традиционная для метапоисковиков строка, сообщающая, в каких именно базах был найден данный документ и его рейтинг в этих системах. Удобная особенность Yippy – возможность предварительного просмотра найденных страниц в небольшом фрейме прямо на странице результатов поиска рядом со ссылками.
Весьма интересным получился раздел кластерного поиска в Википедии, который становится удобным средством поиска в случае, когда требуется не просто найти одну статью по конкретной теме, а охватить целиком некую предметную область. Выделяемые системой кластеры здорово экономят время, которое при обычном режиме поиска было бы затрачено на открытие и просмотр связанных статей из Википедии.