Алексей Кутовенко - Профессиональный поиск в Интернете
Лучшая на сегодняшний день реализация социального поиска в файлообменниках – это проект Rapid Search Engine. Данный поисковик работает только с файлами, размещенными на файлообменнике Rapidshare. Для поиска используются две базы: индекс сайтов, размещающих файлы на Rapidshare, и индексная база прямых ссылок на файлы, генерируемая с помощью пользователей проекта. Разработчики этого поисковика сообщают о почти пятнадцати миллионах проиндексированных файлов. Темпы пополнения индексной базы достаточно стабильны.
На данном ресурсе действуют простой и расширенный режимы поиска. Панель расширенного поиска вызывается щелчком на кнопке Advanced, расположенной под полем ввода запроса. Запрос можно уточнить с помощью фильтра типа файла (аудио, видео, архивный, образ CD/DVD и др.). Здесь же можно ограничить поиск одной из баз Rapid Search Engine с помощью переключателя Web search/Database search (рис. 9.2). В режиме Database Search в списке выдачи будут присутствовать прямые ссылки на файлы, а в режиме Web Search – веб-страницы, содержащие ссылки на файлы. Опция Use ajax включает режим использования интерфейса страницы выдачи, построенного на технологии AJAX.
Рис. 9.2. Rapid Search Engine является в настоящее время лучшим социальным поисковиком для Rapidshare
Страница выдачи в режиме веб-поиска предлагает минимум информации о найденных ресурсах: заголовок найденной веб-страницы, ее адрес, а также текстовую выдержку, обычно содержащую текст, находящийся рядом со ссылкой на файл, размещенный на Rapidshare. Предлагается и несколько вспомогательных инструментов для просмотра кэшированной версии веб-страницы и для автоматического извлечения ссылок на файлы из текста веб-страницы. Обратиться к этой функции можно с помощью ссылки Get RS Links, находящейся справа от каждого найденного результата.
При поиске в базе прямых ссылок на файлы страница выдачи выглядит иначе. Для каждого результата приводятся имя файла, в котором выделены найденные ключевые слова из поискового запроса пользователя, его размер, а также прямая ссылка на страницу скачивания этого файла на сервисе Rapidshare.
Кроме инструментов поиска Rapidshare Search Engine предлагает несколько дополнительных инструментов, полезных для работы с результатами поиска. Это уже упомянутый инструмент автоматического извлечения ссылок на Rapidshare с указанных веб-страниц, а также инструмент Check rapidshare links, который проверяет указанные пользователем или же полученные в ходе поиска на данном ресурсе ссылки на файлы. Если какие-либо из найденных файлов были удалены, появится соответствующее предупреждение. В результате достигается заметная экономия времени поиска нужной рабочей ссылки.
Любой поисковый запрос можно сохранить и создать на его основе оповещение. Как только в базе Rapidshare Search Engine появятся новые ссылки, подходящие под условия запроса, на указанный при создании оповещения электронный адрес будет отправлено сообщение.
Пополнить базу ресурса своими ссылками можно с помощью формы Add rapidshare links. Для описания своих ресурсов используются привычные ключевые слова – полезно, если имя файла не характеризует его содержание. Необходимо обратить внимание на то, что ссылки на защищенные паролями файлы принимаются только в случае, если автор сообщает ссылку на веб-страницу, содержащую пароль.
Rapidshare Search Engine располагает собственным поисковым плагином, выполненном в формате OpenSearch и работающим на всех поддерживающих этот стандарт браузерах. Кроме того, для браузера Firefox предлагается дополнение RSE Tools. С его помощью можно вести поиск на Rapidshare Search Engine, быстро находить в тексте открытой веб-страницы ссылки на файлы Rapidshare, а также проверять их работоспособность.
Метапоиск торрент-ресурсов
Технологии Peer to Peer (P2P) прочно вошли в практику современной Сети. Торрент-сети содержат значительные объемы контента и пользуются заслуженной популярностью. Одним из центральных звеньев торрент-сетей являются трекеры – сайты, на которых собирается информация о доступных релизах и где можно найти ссылки на сами торренты. Однако ни один трекер, даже самый крупный, не может похвастаться абсолютно полным охватом ресурсов. В такой ситуации вполне естественным стало появление поисковых систем, которые объединяют результаты поиска на нескольких торрент-трекерах. Другими словами – специализированных поисковиков.
С точки зрения организации процесса поиска современные торрент-поисковики можно разделить на две условные группы: машины, интерфейс которых построен на фреймах, и поисковики, проводящие дополнительную обработку получаемых с разных трекеров результатов поиска.
Фреймовые торрент-поисковики являются простейшим средством организации такого поиска. В подобных проектах результаты с нескольких трекеров выводятся во фреймах или на вкладках страницы поиска. С одной стороны, это нельзя назвать полноценным метапоиском, поскольку запрос приходится повторять для каждого трекера, результаты не объединяются, а их дополнительная обработка не проводится. С другой стороны, при таком поиске список выдачи сразу нескольких трекеров доступен для просмотра на одной странице, что удобно не только при поиске, но и простом просмотре каталогов.
«Настоящие», если можно так сказать, торрент-поисковики близки по особенностям своей работы к метапоисковикам, применяемым при обычном веб-поиске. Такие машины не ограничиваются простым перенаправлением пользователей на страницу внешнего ресурса. Здесь полученные с нескольких трекеров результаты поиска объединяются в общий список, который затем подвергается дополнительной обработке. Некоторые поисковики предлагают прямые ссылки на файлы торрентов, другие направляют пользователей за ссылками на оригинальные страницы задействованных в поиске трекеров.
TorrentScan
Один из наиболее показательных примеров фреймового торрент-поиска – ресурс TorrentScan. Данный проект по умолчанию работает с полутора десятками крупных трекеров, в числе которых такие известные проекты, как isoHunt и Demonoid. Список поддерживаемых ресурсов можно менять и дополнять при настройке поиска. Интерфейс проекта переведен на дюжину языков, среди которых есть и русский.
Собственно, к метапоиску здесь относятся только две панели инструментов: боковая со списком доступных трекеров и верхняя, на которой перечислены тематические разделы активного в данный момент трекера. Все остальное пространство страницы TorrentScan занимает фрейм, в который загружается страница просматриваемого трекера с результатами поиска по запросу пользователя. При смене трекера состав инструментов на панели поиска меняется – там отображаются только средства настройки активного в данный момент ресурса.
Меню Настройки содержит три раздела Раздел Глобальные настройки отвечает за внешний вид поисковика. Здесь можно выбрать цветовую схему оформления и расположение списка трекеров (вертикальное или горизонтальное). В разделе Настройки списка сайтов можно упорядочить состав списка трекеров панели поиска. Допускается изменение их порядка, удаление и добавление ресурсов. В последнем случае можно добавлять трекеры из предлагаемого в этом же разделе списка. Доступно более пятидесяти вариантов. Для работы с частными трекерами, естественно, понадобится располагать собственными аккаунтами на таких проектах. По умолчанию все параметры TorrentScan сохраняются в куки-файлах браузера. Если вас не устраивает подобный подход, можно воспользоваться разделом. Настройки закладок. Здесь можно сгенерировать ссылку, которая будет содержать все заданные параметры, и передать ее поисковику в виде параметров URL-адреса.
TorrentScan также предлагает вспомогательные разделы Облако поиска, Статистика и Trends. Первый из них демонстрирует пользователю облако с перечнем наиболее популярных в данный момент торрентов. Раздел Статистика предлагает ознакомиться со статистикой работы некоторых крупных трекеров. Этот раздел использует инструмент Google Analytics для построения единой диаграммы подсчета посещаемости крупнейших торрент-трекеров. Раздел Trends предлагает информацию о тридцати наиболее популярных запросах недели.
TorrentScan располагает полным набором поисковых плагинов. В отличие от большинства поисковиков, этот список не ограничивается поисковыми плагинами для браузеров Firefox и Internet Explorer. Здесь есть решения и для Google Chrome, а также плагины для клиентов BitTorrent и uTorrent. Кроме того, предлагаются поисковые гаджеты для Google Desktop, Google Toolbar и боковой панели Windows.
PlentyOfTorrents
Похожие возможности предлагает фреймовый поисковик PlentyOfTorrents. Как и TorrentScan, проект выводит построенную на фреймах страницу и меню быстрого выбора целевого трекера.
Никакого объединения результатов поиска, полученных из различных источников, в данном случае, конечно же, не происходит. После отправки запроса открывается страница целевого торрента, а в верхней части окна сохраняется панель инструментов PlentyOfTorrents. Она содержит несколько тематических списков торрентов. Каждая категория выполнена в виде выпадающего меню. При выборе какого-либо трекера его страница с результатами поиска автоматически загружается в основной фрейм. Каждый раз набирать свой запрос заново при этом не нужно, что экономит время пользователя. Проект PlentyOfTorrents интересен также собственным каталогом трекеров.