Журнал Компьютерра - Журнал «Компьютерра» №38
Недавно начал бурно развиваться еще один новый вид проектов в Интернете - сервисы, создаваемые «поверх» поисковых порталов (и их сервисов), крупных магазинов, блогов за счет объединения различных типов данных. Несколько примеров: поиск людей (коллег, одноклассников) с одновременным показом их местонахождения на картах Google; разбор криминальных сводок с сайта полиции города с отметкой происшествий на тех же картах Google, что позволяет понять, насколько криминализован твой район; соединение данных об автомобильных пробках от Yahoo! с картами Google; поиск по Amazon и объединение на той же странице данных других магазинов для сравнения цен, и т. д.
Пока этот вид бизнеса довольно рискованный, ибо зависит от доброй воли всех владельцев данных. Скажем, Google категорически против метапоисковых сервисов, использующих его результаты поиска (он даже блокирует их, если создается большой трафик), но не очень возражает против использования своих карт. Есть уже случаи блокирования со стороны Yahoo! и Google доступа с таких гибридных сайтов, замешивающих их данные. Но надо учесть, что обычно с грандами Интернета трудно договориться заранее. А вот постфактум - можно. Если ты сделал гибридный сайт, никого не спрашивая, и доказал, что можешь привлечь большую аудиторию, а главное - можешь показать, где в твоей схеме деньги для Google или MSN, то договариваться гораздо проще. Стало быть, риск есть, но выигрыш может быть громадным и быстрым - гибридные сайты зачастую привлекают миллионы посетителей моментально и без всякой раскрутки.
Машинный перевод для поисковиков и мобильников
Машинный перевод - больная тема вот уже полвека. Несмотря на значительные вложения и затрату чудовищного количества человеко-лет в США, Европе и России, прорыва нет. Состояние отрасли всякий может увидеть на примере работы российского «ПРОМТа». В последние годы «ПРОМТ», несомненно, лучшая в мире система перевода. Но то, что эта лучшая в мире система дает на выходе, часто напоминает не очень хороший подстрочник. Сейчас компьютерные переводчики можно использовать только для выбора текста на нужную тему, для быстрого ознакомления с документацией на товар или изделие, для пролистывания сайта конкурента в Китае или Японии (ценно хотя бы то, что вместо кракозябров на экране появляется привычная латиница или кириллица). Я считаю, что традиционные «словарные» системы автоматического перевода уже восемь-десять лет находятся в идейном тупике, и из технологии перевода, основанного на словарях, выжато все возможное.
Однако задача перевода вдруг обрела второе дыхание. Автоматические переводчики теперь нужны не только профессионалам-переводчикам, аналитикам спецслужб и библиотекарям, и это дает надежду на прорыв. Появилась новая аудитория - пользователи Интернета и мобильных устройств, которым требуется языковая прозрачность информационного пространства. Тут же возник и новый подход к решению задачи автоматического перевода - использующий, при помощи поисковых машин, «человеческие» образцы перевода. Это развитие довольно давней идеи статистического перевода, применяемой к гигантским индексам поисковиков - хранилищам текстов с удобным поиском и сравнением образцов.
Идея поискового перевода внешне проста: поисковик, индексирующий гигантский объем данных, всегда может вычленить из него параллельные тексты (или хотя бы фразы) - образцы перевода, сделанные людьми (даже если в Сети эти образцы лежат далеко друг от друга и внешне не связаны). Сделать это можно по «похожести» - так же как поисковик определяет дубли веб-страниц на одном языке.
Ну а сделать из образцов параллельных текстов гибкие шаблоны перевода - задача лингвистически сложная, но вполне решаемая. Вот и Google уже создает свой переводчик и даже получает за него призы[Об этой и других новых идеях в области машинного перевода см. «КТ» #608- Л. Л.-М]. Я уверен, что вскоре этим займутся и другие поисковики, например MSN. Впрочем, не факт, что преуспеют здесь именно поисковики. Скорее, их ресурсы будут текстовой базой для систем перевода, созданных разработчиками, имеющими опыт в прикладной лингвистике.
Итак, если вспомнить про конвергенцию Интернета с мобильниками и распознавание речи, мы вплотную подходим к идее устройства, описанного в фантастических романах, - к универсальному коммуникатору, маленькой коробочке, лежащей на столе и переводящей речь разноплеменных собеседников.
Интернет-маркетинг и реклама
В настоящее время происходит быстрый идеологический сдвиг в области интернет-рекламы. На смену традиционной баннерной и контекстной рекламе (по поисковым словам) идет контекстно-чувствительная реклама. Эта реклама способна учитывать как контекст страниц, на которых она показывается, так и контекст пользователя (его предыдущие действия и привычки поведения в Сети). Фактически на стыке традиционной интернет-рекламы и классического маркетинга возникает новое направление, я назову его управление аудиторией. Первыми, относительно простыми примерами за последние два-три года послужили системы контекстно-чувствительной рекламы наподобие Google AdSense, «АвтоКонтекста» Бегуна, РОРЕРа и подобных им. Сейчас возникают новые игроки, новые продукты и сервисы.
Например, появляются разветвленные партнерские системы с показом на веб-страницах товарных предложений, релевантных содержанию страницы. На смену баннерам могут прийти «мини-сайты» с возможностью навигации по ним прямо на рекламной площадке, без перехода на рекламируемую веб-страницу. Следует упомянуть автоматизированные сервисы по управлению интегрированными рекламными кампаниями на аукционе eBay, в контекстных системах в поисковиках и на партнерских сайтах (с анализом эффективности, автоматическим отзывом проданных или непродающихся позиций и пр.). Сюда же относится тематическая реклама в блогах и новостных RSS-лентах; реклама в почте, привязанная к содержанию писем. Быстро развивается также анализ поведения аудитории и отдельного пользователя, с распознаванием категории пользователя по его поведению. Вместо традиционных счетчиков появляются аналитические продукты нового поколения, позволяющие контролировать не посещаемость, а полное состояние интернет-маркетинга клиента.
Мне кажется, лицо интернет-рекламы радикально изменится за ближайшие два-три года, и тут огромный простор для инноваций.
Я не коснулся других огромных областей для инноваций, возникающих на стыках отраслей (скажем, веб-сервисов и мобильных сервисов), - например, средств использования традиционного софта новыми способами. Каждый такой стык - бесконечная тема. Инновации возникают там, где возникают реальные потребности массы пользователей, или там, где кто-то умный придумывает для них новую потребность. А таких областей вокруг ИТ - множество.
О «большом скачке» на рынке платформ
Начну с несколько неожиданной, наверное, аналогии. В советской традиции было принято, говоря о промышленности в целом, выделять группу А и группу Б: производство средств производства и производство товаров народного потребления (в других терминах - тяжелая и легкая промышленность). На мой взгляд, в индустрии информационных технологий к сегодняшнему дню образовалась более сложная модель: можно выделить по крайней мере четыре четко очерченных сегмента - средства разработки, платформы, бизнес-приложения и решения, ориентированные на конечного пользователя (при этом первые три сегмента соответствуют группе А, а последний - группе Б). Естественно, существует ряд решений на стыке сегментов (например, домашние сети - это и платформа, и потребительская технология). Важно, однако, что говорить об инновационной привлекательности ИТ в целом бессмысленно - в этих сегментах принципиально различные показатели возврата инвестиций.
Очевидно, что самым массовым рынком является рынок потребительский. Именно на нем всегда достигался максимальный успех внедрения новых технологий, даже в случае базовых высокотехнологичных решений. Персональных компьютеров, например, в мире гораздо больше в частном пользовании, нежели в организациях. Наблюдаемая в России картина (домашних компьютеров - примерно четверть от всех имеющихся в стране) свидетельствует только о перекошенном и неразвитом рынке. Но, скажем, феномен мобильных телефонов реализовался в нашей стране уже по общемировой схеме.
Поэтому я думаю, что с точки зрения инновационной привлекательности потребительский рынок ИТ является наиболее перспективным, тем более что в последнее время многие технологии, изначально создававшиеся для решений, ориентированных на бизнес, начали прокладывать путь в дома, квартиры и карманы людей (например, уже упоминавшиеся домашние сети). Сегодня ясен уже и мэйнстрим направления развития потребительского ИТ-рынка - это тотальная конвергенция всего и вся. Совсем скоро - лет через десять-пятнадцать - мы забудем о раздельных сетях и каналах доставки информации (сегодня в типичную квартиру приходят, не говоря об эфирных сетях, по крайней мере телефонный провод, радиовещательный кабель, телевизионный коаксиал, а в продвинутую - еще и кабель локальной сети). Они будут проинтегрированы в общей проводной или беспроводной широкополосной сети передачи данных с коммутацией пакетов, а все оконечные устройства (телефоны, телевизоры, радиоприемники, музыкальные центры, часы и т. д.) станут различными модификациями компьютерной платформы. Эта тенденция настолько очевидна, что даже не хочется приводить подтверждающие примеры. Те, кто сможет включиться в этот процесс и предложить новые (и востребованные!) функциональные устройства, услуги и бизнес-модели, просто обречены на успех. Одновременно, кстати, этот процесс является и угрозой для многих представителей традиционного бизнеса, особенно коммуникационного, - как бы традиционные операторы ни боролись с IP-телефонией, будущее за ней (или за ее следующей реинкарнацией), а при массовом внедрении широкополосных беспроводных сетей (например, WiMAX) на существенное техническое перевооружение придется пойти и операторам мобильной связи.