Алексей Колик - Альтернатива: мы или конкуренты
Программа предназначена для исследования массивов текстовой информации с целью выявления сущностей и связей между ними. Программа осуществляет семантически-визуальный анализ. Результат работы – отчет об исследуемом объекте. Предназначена для следующих категорий пользователей: аналитики, работающие с текстовыми данными; специалисты служб безопасности, конкурентной разведки, маркетинга, PR; журналисты, детективы, политтехнологи. Особенности: небольшой размер; работа с основными текстовыми форматами:.doc,docx,rtf,txt,html,odt,pdf; хранение всех данных на компьютере пользователя; возможность настройки под требования конкретного пользователя, формат хранения данных проекта в. XML файле позволяет пользователям обмениваться проектами.[23]
Разработчик программы – «Лаборатория перспективных разработок». Позволяет:
– извлекать сущности из текстов и документов по сути неограниченных размеров;
– устанавливать связи между извлеченными сущностями по неограниченному числу параметров, часть из которых встроена в программу, а другие могут быть введены пользователем самостоятельно;
– визуализировать взаимоотношения между сущностями;
– архивировать полученные результаты анализа, как в табличной, так и в визуальной форме и выводить их в сторонние приложения или на печать.[24]
OutWit Hub Pro EditionПрограмма позиционируется фирмой – разработчиком как собственная машина по созданию web-коллекций. Она позволяет мониторить неограниченное число сайтов и других web-ресурсов. Возможности программы:
– во-первых, позволяет парсить и извлекать все ссылки, которые содержатся на сайте;
– во-вторых, с приближающейся к 100 % точности извлекать все e-mail и телефоны, содержащиеся на всех (подчеркиваю, на всех) страницах сайта. В том числе, на страницах не связанных с другими;
– в-третьих, извлекать и скачивать с сайта любые тексты, в том числе содержащие заданные слова, сущности или предложения. Иными словами, для каждой группы сайтов могут быть заданы определенные онтологии (сущности) и скачаны будут с сайтов только те тексты, которые содержат указанные онтологии. При этом существует опция, которая позволяет скачивать тексты, появившиеся только после определенной даты.
– в-четвертых, позволяет извлекать с интернет-ресурсов изобразительный материал, и что более важно для конкурентной разведки фотоизображения, с автоматическим извлечением из них метаданных;
– в-пятых, и возможно это самая любопытная функция программы, она тщательно обследует весь сайт, включая страницы, не связанные ссылками с другими страницами ресурса, или страницы, фактически находящиеся в своего рода «сером», или даже невидимом интернете.[25]
Метапоисковые машиныМетапоисковая машина не имеет собственных пауков и собственной базы данных. Она в неизменном виде размещает запрос в тех поисковых машинах, которые отметил пользователь, а затем дожидается ответа от них и выдает результат со всех машин на одной странице. Для удобства пользователя эти результаты содержат пометку о том, с какой поисковой машины был получен тот или иной ответ.[26]
Метапоисковая машина:
– посылает запрос на огромное количество разных поисковых систем и поисковых серверов, с последующим определением наиболее вероятных источников информации на одной странице;
– тестирует Сеть на предмет наличия информации, релевантной запросу;
– не обладая собственной индексной базой данных, метапоисковая система выступает в качестве шлюза, который передает через свой интерфейс запросы на автономные ИПС и возвращает результаты поиска;
– обрабатывает полученные результаты, удаляет повторяющиеся адреса ресурсов и представляет более широкий спектр того, что представлено в сети Интернет в виде обобщенного результата;
– метасистема допускает передачу запросов не только на автоматические индексы, но и в те каталоги, которые сопровождаются локальной поисковой машиной;
– позволяет оценить результативность применения отдельных ИПС для решения конкретной поисковой задачи.[27]
Примеры некоторых метапоисковых машин:
– Nigma (http://nigma.ru);
– xrambler (http://xrambler.ru;
– Metabot (http://www. metabot.ru/);
– Copernic (http://www.copernic.com).
Сторожевые роботыНи специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц. Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаление кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.[28]
Примеры сторожевых роботов:
– WebSite-Watcher (http://www.aignes.com);
– Copernic Tracker (http://www.copernic.com);
– Check and Get (http://activeurls.com/ru/download.php);
– ChangeNotes (http://www.changenotes.com).
Существуют еще немалое количество других программ, но для их описания необходима отдельная книга. Можно определенно сказать, что интерес к таким программам со стороны клиентов увеличивается, все большее количество бизнес-аналитиков, маркетологов, конкурентных разведчиков понимает их значение и пользуется ими. Вместе с тем, не все руководители бизнеса разделяют их мнение относительно необходимости выделения финансовых ресурсов на закупку программ. Дело в том, что далеко не каждый топ-менеджер осознает важное значения информационного обеспечения бизнеса, многие из них не готовы рассматривать инвестиции в информационную систему как не менее важную задачу, чем приобретение оборудования для производства или материалов. Вот и получается, что конкурентный разведчик в течение долгих месяцев ходит к директору с просьбой разрешить приобрести столь необходимое ему программное обеспечение, но слышит неизменный отказ. В результате он продолжает пользоваться архаичными методами получения информации, теряя время и качество выполнения работ.