Время 21:20  Дата 30.08.2011

Яндекс будет таргетировать рекламу по признакам


Яндекс начинает таргетировать медийную рекламу по социально-демографическим признакам. Теперь на сервисах Яндекса, например, Новости, Почта и Карты, рекламодатели могут предлагать товары и услуги конкретно той части российской аудитории, на чей пол и возраст они рассчитаны.




Для внедрения социально-демографического таргетинга компания разработала новую технологию — Крипта. Она создана на основе метода машинного обучения Матрикснет, с помощью которого строится формула ранжирования поиска Яндекса. Крипта анализирует сотни факторов, например, длину поисковых запросов и наличие в них определённых слов. Она ежедневно обрабатывает данные о практически всех пользователях Яндекса и разделяет их по поведению в интернете — на мужчин и женщин, а также по возрастным группам.

Для этого использовалась обезличенная информация о поле и возрасте пользователей из сети профессиональных контактов Мой Круг — люди чаще указывают реальные данные, когда речь идёт о работе. Для уточнения информации из профессиональной сети её сравнили с указанной в профиле пользователя на Яндексе. После перекрёстной проверки осталось около миллиона анкет с наиболее достоверной информацией.

Потом система собрала информацию о поведении этих пользователей в интернете. Например, о длине поисковых запросов, наличии в них определённых слов, о периодах активности за сутки и т.д. Социально-демографические признаки и данные о поведении пользователей в интернете использовались для обучения алгоритма. Из этих данных разработчики создали две выборки: обучающую и тестовую. Пользователей разделили на две группы: примерно 700 тысяч для обучения Крипты и 300 тысяч для последующей проверки. Проанализировав данные из обучающей выборки, система отобрала 300 наиболее важных факторов для определения пола и возраста, а также рассчитала значимость каждого из них.

Следующий этап — проверка того, насколько хорошо обучилась Крипта. Из данных в тестовой выборке убрали информацию о поле и возрасте пользователей, чтобы Крипта выяснила это самостоятельно. Для каждого пользователя она определила вероятность того, мужчина это или женщина и к какой из пяти возрастных групп он относится. Разработчики сравнили результаты с имеющимися данными и усовершенствовали алгоритм обучения. После ряда проверок и усовершенствований технологию внедрили.

При выборе нужной аудитории из всех пользователей Яндекса пол определяется с вероятностью 74% — в полтора раза точнее, чем наугад. Возрастная группа, например, от 25 до 34 лет (самая большая по численности группа пользователей) определяется с вероятностью 45%, что более чем в два раза точнее случайного определения. Когда реклама таргетируется на меньшую аудиторию, точность определения демографии увеличивается. Например, при охвате половины аудитории указанные вероятности равны 85% и 52% соответственно.

Технологию можно научить различать пользователей интернета не только по полу и возрасту. Ей не важно, какие общие признаки или интересы объединяют людей в реальной жизни. Но Крипта отличит разные группы друг от друга, если их поведение в интернете будет заметно различаться.

«Разделение аудитории рекламы по полу и возрасту — это только первый шаг. Крипту можно научить различать, например, владельцев кошек и владельцев собак, пешеходов и водителей, — говорит Лев Глейзер, директор по развитию медийных продуктов Яндекса. — Если у разных групп людей поведение в интернете тоже разное, то Крипта сможет их отличить друг от друга».



Адрес новости: http://siteua.org/n/290403