Коллектив Авторов - Цифровой журнал «Компьютерра» № 89
- Как вы думаете, продукты и решения, созданные в рамках НПП, должны быть свободными? Какова, на ваш взгляд, роль разработчиков проприетарного ПО в развитии НПП?
- Мы не закрываем двери для разработчиков проприетарного ПО. Проект создания НПП является открытым, и в нём могут участвовать любые компании. Единственное пожелание: линейка продукции НПП должна быть функционально полной и соответствовать потребностям всех областей применения ПО.
Конечно, доля свободного ПО должна быть достаточно велика для обеспечения потребителю права выбора, за что он готов платить, а за что — нет. Что же касается использования международного опыта, то я приветствую создание любых форм сотрудничества отечественных разработчиков и мировых брендов в области ИТ. Нельзя искусственно делить мир на «своих» и «врагов».
Просто надо учитывать, в каких областях применения можно и целесообразно использовать совместные продукты, а в каких — нет. На мой взгляд, национальная программная платформа — это прежде всего линейка продукции, созданная на территории России с участием отечественных коллективов разработчиков, интеллектуальная собственность на которую также принадлежит (полностью или частично) российским гражданам или организациям. Однако критерии отнесения программной продукции к НПП ещё не выработаны и обязательно будут обсуждаться.
— Как вы в целом оцениваете нынешнюю ситуацию с НПП? Есть ли у проекта шансы на успех и что необходимо, чтобы НПП не постигла судьба некоторых других государственных инициатив в области ИТ?
- ТП НПП относится к разряду реально работающих платформ. За прошедшие полгода мы без привлечения государственных инвестиций открыли четыре региональных центра компетенции по поддержке разработок на свободном ПО (в Новосибирске, Кирове, Санкт-Петербурге и Самаре). В сентябре открыт первый отраслевой центр компетенции по развитию медицинских информационных систем (в Иркутске). Готовится стратегический план исследований и разработок. Так что ТП НПП живёт и, я надеюсь, будет дальше развиваться. Что же касается условий успеха, то здесь главное — участие в проекте компаний-единомышленников, последовательность действий и чёткое целеполагание. Многие предыдущие проекты гибли из-за постоянных изменений главной задачи, смены правил игры во время матча. Надеюсь, участие в ТП НПП всех категорий организаций — от академической науки и государственных учреждений до оборонных предприятий и малого бизнеса — позволит нам решить все задачи, указанные в нашем Меморандуме о создании НПП.
К оглавлению
Андрей Плахов («Яндекс») о поисковой технологии «Спектр»
Юрий Ильин
Опубликовано 07 октября 2011 года
- Расскажите, пожалуйста, как появилась технология «Спектр» и для чего предназначена? На кого в первую очередь она ориентирована?
- Как появилась? Мы в какой-то момент заметили, что люди чем дальше, тем больше задают запросов, сформулированных не до конца и неконкретно. Например, запрос «Ягуар» или «МГУ». Когда человек назвал какую-то организацию, или явление, или объект, но непонятно, что за объект и что именно он ищет про него. Про МГУ можно искать просто информацию, условия поступления, можно искать список факультетов, и так далее.
- Тем более «МГУ» сейчас себя норовит называть каждый заштатный институт.
- Да, и это отдельная проблема. Под «Ягуаром» может подразумеваться автомобиль, животное, напиток – всё, что угодно. Люди привыкли, что поисковые системы всё точнее угадывают, что имелось в виду, поэтому таких запросов со временем становится больше, и нам нужно учиться обрабатывать их лучше.
Проблема была в том, что традиционные методы оценки не очень хорошо работают с такими запросами. Качество поиска оценивается рядом метрик, цифр. Есть много разных методик, но большинство из них не учитывают проблемы таких неоднозначных запросов – если все десять результатов примерно про одно и то же, это считается хорошим результатом. Нужно было придумать способ измерять насущность этой проблемы и сделать такое ранжирование, которое бы с ней справлялось. Чтобы в выдаче были результаты и про то и про это, чтобы люди, ищущие разные вещи, находили для себя то, что нужно, и получали полный обзор по этому запросу. Так и появился «Спектр».
- Насколько я понимаю, полный обзор – это 100 страниц результатов. Как человеку ориентироваться?
- Всё равно нужно каким-то образом вместить наиболее актуальную информацию в первый десяток результатов. Без некоторой потери смысла не обойтись. Мы работаем над тем, чтобы смысл терялся как можно меньше.
- Как давно задействована технология?
- Она запущена в конце прошлого года.
- И как вы оцениваете её результаты на данный момент?
- Мы измеряем количество людей, которые не удовлетворены результатами поиска. Как мы это понимаем? Бывает, что человек задал свой запрос, увидел какие-то результаты, посмотрел на них, почитал и никуда не кликнул, а вместо этого закрыл браузер или задал другой запрос с целью всё-таки что-то найти. Если такое происходит, то обычно это плохо. Число таких запросов с введением нового ранжирования уменьшилось.
- А какие-то средства противодействия манипуляциям результатами поиска задействованы?
- Да, они, конечно, нужны. Более того, они обязательны. «Яндексу» есть на ком тренироваться, как отслеживать накрутки и так далее. На практике накрутками занимаются, чтобы подвинуть в выдаче не какой-то специфический результат, а свой собственный магазин, свой сайт. Если научиться такие стандартные накрутки отлавливать и с ними бороться, а мы это делаем постоянно, то те же методы могут быть использованы для более экзотических случаев.
На самом деле за этим стоит некая этическая концепция. Хорошо всё, чем хорошо пользоваться. Если люди ищут какой-то натуральный феномен и результат сам по себе действительно набирает популярность, то мы не судим, хорошо это или плохо. Нашим пользователям это интересно, значит, нужно найти и показать. Но мы должны бороться с накрутками, когда кто-то при помощи ботов или просто ручного труда низкооплачиваемых «роботоподобных» людей делает вид, что этот результат набирает популярность. Вот это то, с чем нужно бороться, и нужно отличать друг от друга эти вещи. Это чисто техническая задача.
- То есть даже «ботоподобных» людей можно отбивать программой-антиботом?
- Конечно. Они же по инструкции работают, всё равно у них есть неестественные паттерны в поведении.
- Вот вы говорите про стандартные случаи накрутки, а нестандартные в техническом плане что могут из себя представлять?
- В техническом? Ну, я, во-первых, сейчас не смогу ничего реалистичного предположить, потому что если мы об этом знаем, то оно уже не является чем-то нестандартным. Во-вторых, даже если я сейчас что-нибудь такое придумаю, то не хочется подавать идеи. Но, например, можно как-то более «материально» использовать таких «роботоподобных» людей. Или можно начать что-то вроде вирусной рекламы, которая будет рекламировать не товар, не сайт, а что-то другое. Но мы все равно научимся с этим справляться, как уже справились с другим хорошим примером нестандартной концепции – линк-бомбингом, когда на сайт ссылаются несколько разных людей по ссылкам, содержащим всякие нехорошие слова. Затем в социальных сетях появляются сообщения: смотрите, по этим нехорошим словам находится вот этот сайт, прикольно! И все начинают ретвитить такие ссылки или кидать их друг другу.
- Как вы оцениваете, скажем так, конкурентные преимущества «Яндекса», по сравнению с другими поисковиками, действующими в России? Правда, насколько я понимаю, их осталось совсем немного...
- В России основных игроков сейчас три: есть «Яндекс», есть русский Google и есть Mail.ru. По крайней мере с точки зрения бренда.
Насколько большим конкурентным преимуществом является качество поиска? Это не так очевидно, как запуск, условно говоря, новых сервисов, но есть точная корреляция между долей и качеством поиска, и она вполне понятна, потому что если человек задаёт запрос в поисковике и чего-то не находит, он легко ищет в другом.
Большинство людей знает, что поисковики бывают разные, и очень многие пользуются браузерами, где можно легко переключаться между разными поисковиками. И если вы хороший ответ не нашли, а конкурент нашёл, то это серьёзный сигнал для пользователя к более частому переключению. Поэтому любое улучшение ранжирования помогает держать марку.