Модуль сбора информации для профилирования интернет-пользователей

Авторы патента:


 

Полезная модель относится к рекламе в Интернет, к системам представления рекламной информации пользователям сетей в Интернет и позволяет повысить производительность средств распространения рекламных информационных материалов в Интернет и эффективность рекламного и информационного воздействия на пользователей.

Сущность технического решения заключается в создании модуля сбора информации для профилирования Интернет-пользователей, содержащего

блок связи с внешними базами данных со статистикой,

контроллер Интернет индексов,

последовательно включенные блок связи с сетью оператора и блок оборудования DPI(Deep Packet Inspection),

подсистему агрегирования данных,

подсистему профилирования данных,

причем выходы блока оборудования DPI, блока связи с внешними базами данных со статистикой и контроллер Интернет индексов подключены к раздельным входам подсистемы агрегирования данных, а выход подсистемы агрегирования данных подключен к подсистеме профилирования данных. Кроме того, подсистема профилирования данных содержит объединенные по входу и имеющие раздельные выходы блок сегментации базовых признаков, блок сегментации ситуативной потребности и блок сегментации регулярной потребности.

Предлагаемой полезной моделью обеспечивается достижение технического результата в виде повышения точности определения параметров профилирования Интернет-пользователей для обеспечения повышения качества целенаправленного рекламирования.

Полезная модель относится к рекламе в Интернет, к системам представления рекламной информации пользователям сетей в Интернет и позволяет повысить производительность средств распространения рекламных информационных материалов в Интернет и эффективность рекламного и информационного воздействия на пользователей.

Используемые в описании сокращения:

DPI (Deep Packet Inspection) - класс систем, решения, на основе которых позволяют получать полную картину использования сети, выявлять абонентов, которые потребляют большие объемы графика, а также эффективно управлять графиком в режиме реального времени, что помогает создавать или оптимизировать сервисные предложения, повышать качество услуг, управлять сервисными политиками и обеспечивать защиту сети и ее пользователей.

http-трафик - поток (или объем) информации, проходящей через канал связи или приходящийся на сайт/сервер.

URL - стандартизированный способ записи адреса ресурса в сети Интернет.

Cookie - небольшой фрагмент данных, созданный веб-сервером или веб-страницей и хранимый на компьютере пользователя в виде файла, который веб-клиент (обычно веб-браузер) каждый раз пересылает веб-серверу в HTTP-запросе при попытке открыть страницу соответствующего сайта.

соц. дем. характеристики - данные о пользователе, включающие в себя информацию об его образовании, пол и возраст человека, уровень дохода, место проживания и/или место выхода в Интернет, краткосрочные и долгосрочные потребительские предпочтения. Набор данных может меняться, в зависимости от потребностей рекламодателей.

Уровень техники.

Известна система для способа демонстрации информационных материалов, включающего нанесение информационных материалов на находящийся в сети Интернет носитель, в виде сайта регионального web-клуба по интересам (web-клуб любителей биллиарда), в качестве информационных материалов применена реклама товаров и услуг региональных товаропроизводителей или информация о региональных товаропроизводителях, при этом информационный материал рассчитан на интересы региональных посетителей web-клуба или непосредственно связан с профессиональными интересами региональных посетителей web-клуба, причем каждый web-клуб рассчитан на определенную возрастную категорию региональных посетителей с учетом их половой принадлежности [RU 2006116999, G09F 19/00, опубл. 10.12.2007].

Известна система для способа распространения рекламы среди пользователей компьютеров, подключенных или временно подключаемых к сети Интернет, при котором рекламодатель или представитель рекламодателя с помощью компьютера, подключенного или временно подключаемого к сети Интернет, через сеть Интернет размещает или создает рекламный материал на рекламном сервере, после чего этот рекламный материал хранят на рекламном сервере и передают его с рекламного сервера по сети Интернет на компьютер пользователя для отображения в программе Интернет-обозревателе после того, как этот компьютер загрузил в Интернет-обозреватель web-страницу или часть web-страницы, содержащую инструкции Интернет-обозревателю или дополнительным модулям Интернет-обозревателя получить этот или неопределенный рекламный материал с этого рекламного сервера и отобразить полученный рекламный материал в программе Интернет-обозревателе на этой web-странице или части web-страницы, согласного которого рекламный материал или часть рекламного материала выполняют в виде интерактивного опроса, на рекламном сервере хранят множество рекламных материалов, а рекламным сервером является одиночный компьютер, подключенный к сети Интернет, который осуществляет сбор рекламных материалов от рекламодателей или их представителей, на котором хранят рекламные материалы, который осуществляет передачу рекламных материалов через сеть Интернет, и который осуществляет сбор, хранение и обработку результатов интерактивных опросов или рекламным сервером является группа компьютеров, подключенных к сети Интернет, между которыми распределены функции сбора, хранения и передачи рекламных материалов по сети Интернет, и функции сбора, хранения и обработки результатов интерактивных опросов [RU 2006116999, G09F 19/00, опубл. 10.12.2007].

Известен способ рекламирования товаров и услуг в сети Интернет с применением априорных данных, состоящий из (а) отслеживания, для наборов из 1 или более рекламных объявлений, информации об эффективности рекламного объявления относительно документа, и (б) агрегирования, относительно документа, информации об эффективности наборов рекламных объявлений, согласно которого в нем учитывается априорная информация, документом является страница в сети Интернет, а дополнительно включающий (в) определение коэффициента уверенности данных об эффективности, (г) комбинирование общей информации по эффективности, информации по эффективности относительно конкретного документа (сайта в сети Интернет) и априорной информации, в том числе по эффективности относительно социальных или других групп [RU 2008114783 G09F 19/00 опубл. 27.10.2009].

Известен способ доставки целевой рекламы и/или информации и система для осуществления способа, предназначенные для целенаправленной с учетом предполагаемых потребительских предпочтений абонентов рекламы, согласно которым доставку рекламы и/или информации операторами связи или провайдерами сети Интернет осуществляются так, что при подключении абонента к сети оператора производят его аутефикацию и открывают канал связи с удаленными базами данных, одновременно на сервере оператора создают страницу командного кода с последовательностью команд запроса рекламного контента, а после получения информационного пакета от абонента команду обращения сохраняют и обрабатывают в сервере оператора, и вводят в конец последовательности команд запроса рекламного контента страницы командного кода, затем отправляют эту страницу командного кода абоненту, а после ее загрузки воспроизводят на средстве отображения терминала рекламный контент во время просмотра которого повторно инициализируют информационный пакет абонента, содержащий команду обращения к адресу удаленного ресурса и отправляют его по каналу связи к удаленным базам данных [RU 2357298, G09F 19/00 G06Q 30/00, опубл. 27.05.2009].

Известны программные приложения с внедренными рекламными объявлениями, сконфигурированные таким образом, чтобы обнаруживать когда пользователь встречает конкретный программный элементом и предоставлять рекламное объявление как альтернативу выполнения команды, причем приложение дополнительно сконфигурировано для облегчения поисков продукта или услуги, предлагаемой спонсором рекламного объявления обнаруживать, когда командный элемент выбран для исполнения, при этом предоставление рекламного объявления, затем содержит представление пользователю рекламного объявления, которое относится к выполнению команды, приложение дополнительно сконфигурировано облегчать (поиски продукта или услуги, предлагаемые спонсором рекламного объявления. Получаемый при этом компьютерно-реализованный рекламный компонент сконфигурирован так, чтобы облегчить связывание команд с рекламными объявлениями в программном приложении, связывать рекламные объявления, ассоциативно связанные с несколькими рекламодателями, с командами в программном приложении, предоставлять спонсору программного приложения списка рекламных объявлений, которые могут быть связаны с командой в приложении, облегчать компенсацию спонсору за размещение рекламы в приложении в соответствии со множеством различных моделей компенсации, а также предоставлять рекламодателю список команд, ассоциативно связанных с приложением или множеством приложений, предоставлять рекламодателю объективные критерии для оценки привлекательности рекламы данной команды или приложения, информации, связанной с терминами запроса, используемыми в приложении для запроса команд [RU 2008146515, G06Q 30/00, опубл. 27.05.2010].

Недостатком известного уровня техники является то, что в большинстве указанных выше существующих рекламных системах используется только один источник данных, по которым определяются характеристики Интернет-пользователей. Такое ограничение дает возможность определять параметры профиля с большими погрешностями.

Чем больше информации можно агрегировать для одного пользователя, тем точнее можно будет определять данные его профиля.

Техническим результатом предлагаемой полезной модели является повышение точности определения параметров профилирования Интернет-пользователей для обеспечения повышения качества целенаправленного рекламирования.

Указанный технический результат достигается в модуле сбора информации для профилирования Интернет-пользователей, содержащем

блок связи с внешними базами данных со статистикой,

контроллер Интернет индексов,

последовательно включенные блок связи с сетью оператора и блок оборудования DPI(Deep Packet Inspection),

подсистему агрегирования данных,

подсистему профилирования данных,

причем выходы блока оборудования DPI, блока связи с внешними базами данных со статистикой и контроллер Интернет индексов подключены к раздельным входам подсистемы агрегирования данных, а выход подсистемы агрегирования данных подключен к подсистеме профилирования данных.

Кроме того, подсистема профилирования данных содержит объединенные по входу и имеющие раздельные выходы блок сегментации базовых признаков, блок сегментации ситуативной потребности и блок сегментации регулярной потребности.

Полезная модель поясняется чертежами.

На фиг.1 - представлена общая схема модуля сбора информации для профилирования Интернет-пользователей.

На фиг.2 показан пример выполнения подсистемы профилирования данных.

Модуль сбора информации для профилирования Интернет-пользователей, содержит блок связи с внешними базами данных со статистикой 1, контроллер Интернет индексов 2, последовательно включенные блок связи с сетью оператора 3 и блок оборудования DPI(Deep Packet Inspection) 4, подсистему агрегирования данных 5, подсистему профилирования данных 6, причем выходы блока оборудования DPI 4, блока связи с внешними базами данных со статистикой 1 и контроллер Интернет индексов 2 подключены к раздельным входам подсистемы агрегирования данных 5, а выход подсистемы агрегирования данных 6 подключен к подсистеме профилирования данных 6.

Подсистема профилирования данных 6 содержит объединенные по входу и имеющие раздельные выходы блок сегментации базовых признаков 7, блок сегментации ситуативной потребности 8 и блок сегментации регулярной потребности 9.

Модуль может являться составной частью общего программно-аппаратного комплекса таргетированной рекламной системы. Данный модуль осуществляет сбор информации о поведении пользователей в Интернете из различных источников, в дальнейшем эти данные используются для формирования профилей пользователей социально-демографическим признакам, краткосрочным и долгосрочным интересам, Сформированные профили передаются рекламной системе для формирования рекламных продуктов и принятия решения о показе рекламных материалов конечным пользователям. Информация в профиле задается как значения из предопределенного набора, задаваемого для множества возможных характеристик. При этом для каждого профиля потребителя используется только какое-то конкретное подмножество характеристик. Значения по каждой характеристике задаются в вероятностном виде, а профиль потребителя параметризуется в зависимости от контекста. Вероятностные характеристики профилей пользователей детализируются по дню.

Данный модуль позволяет осуществлять сбор информации из различных источников:

DPI системы, установленные на площадках Интернет-провайдеров. Информация из этого источника может определять следующие данных о пользователях: запросы к сайтам (функция от времени), пол, возраст, доход, регион.

Принцип работы DPI системы состоит в анализе http-трафика, генерируемом абонентами оператора. Анализ графика осуществляется в реальном времени и не оказывает влияния на пользование абонентами услугами оператора. В результате анализа графика, оборудование DPI выдает поток данных о переходах абонента по веб-сайтам и страницам. При этом оборудование DPI, в составе которого есть сервер промежуточной обработки информации сопоставляет активность, исходящую от конкретных IP адресов абонентов с информацией, которая запрашивается из соответствующей базы данных оператора связи. После этого собранная информация обрабатывается на промежуточном сервере провайдера и полностью деперсонализируется для дальнейшей ее передачи по открытым каналам Интернет.

Такой алгоритм сбора поведенческой информации позволяет с одной стороны проводить сбор необходимой информации без нарушения конфиденциальности абонентов оператора в соответствии с законами, с другой стороны устанавливать и поддерживать четкое соответствие между абонентами и посещаемыми ими веб-ресурсами на протяжении более чем одной сессии работы в Интернет.

Cookie рекламной системы: граф запросов к сайтам.

В момент захода пользователей на рекламную площадку, где установлен код рекламной системы, на компьютер пользователя устанавливается файл cookie, в котором пользователю присваивается уникальный идентификатор. В дальнейшем, при посещении любых страниц в Интернете, на которых установлен код рекламной системы, URL посещенных страниц привязываются к идентификатору пользователя и хранятся в удаленной базе данных. Исходя из этого, чем на большем количестве сайтов в Интернете будет установлен код рекламной системы, тем больше информации о передвижении пользователя можно будет собрать данных. На основании данных о посещении сайтов, можно определить интересы пользователей в Интернете, а сравнив эти данные с эталонной выборкой, можно определить социально демографические данные о пользователе.

Структурированные базы данных с информацией о пользователях из внешних источников. Данные могут содержать в себе базовые соц.-дем. характеристик пользователей их краткосрочные и долгосрочные интересы, истории покупок социальный статус и т.п.

В качестве таких источников могут выступать сайты: социальные сети, программы лояльности, почтовые программы, интернет-магазины, базы вакансий и т.п. Любой сервис в Интернете, где пользователь указывает в явном виде свои персональные данные, может выступать их источником, при согласии пользователей, заполняющих регистрационные поля. Эти данные, в большинстве случаев, могут служить в качестве эталонной информации, на основании которых, будет проводиться машинное обучении системы определения соц.-дем. данных пользователей, исходя из модели их поведения в Интернете.

Счетчики посещений интернет-сайтов и другие рекламные системы: эти программы могут устанавливать cookies на компьютеры пользователей.

Данные о посещенных пользователями страницах, на которых установлены коды счетчиков и других рекламных систем, могут быть использованы для определения поведенческих характеристик пользователя - за счет расширения охвата сайтов, и определения большего количества документов, которые посещает пользователь в Интернете.

Данные из различных источников проходят предварительную обработку, приводятся к унифицированному формату и синхронизируются.

Общим узлом для всех внешних источников данных является подсистема агрегирования данных. В задачи этой системы входит непосредственное получение информации от внешних источников всех типов и дальнейшая унификация этой информации для приведения ее в соответствие определенным стандартам. Заключительной задачей, за которую отвечает система агрегирования данных, является выгрузка информации в подсистему профилирования данных.

Подсистема профилирования данных отвечает за сегментацию всех загружаемых в нее профилей абонентов по определенным группам, категориям и интересам. Такая сегментация используется в дальнейшем для таргетирования показов рекламных материалов соответствующим профилям абонентов.

Категориями сегментации служат такие социальные и демографические параметры как:

а) Базовые признаки: пол, возраст, регион/местоположение, доход (блок сегментации базовых признаков).

Признак, по которому рекламодатель может осуществлять соц.-дем. таргетирование. Все эти параметры, кроме региона, довольно трудно определить в общем случае по косвенным признакам, поэтому чаще всего стараются получать данные, заполненные непосредственно самим пользователям. Если данные о пользователе получить из внешних источников невозможно, то применяются алгоритмы, позволяющие определить эти данные, исходя из поведения пользователя в Интернете, либо каким-либо другим косвенным признакам.

б) Временный интерес: ситуативная потребность (блок сегментации ситуативной потребности).

Потребность, которая занимает внимание пользователя в данный конкретный момент. В настоящее время наиболее известным использованием данного таргетинга можно называть контекстную поисковую рекламу, при которой пользователю показывается реклама, соответствующая его поисковому запросу. Срок актуальности данной характеристики ограничен.

в) Постоянный интерес: регулярная потребность (блок сегментации регулярной потребности).

Потребность, которая у пользователя возникает регулярно, и которая не требует от него обязательного «действия», но если он получит какое-то интересное предложение в рамках этой потребности, то он может им воспользоваться (мобильная связь, Интернет, банк и т.п.).

Сегментация производится путем сопоставления информации о посещенных абонентом веб сайтах и страницах с контекстом информации, которая содержится на данном веб сайте или странице.

Совместная работа подсистем профилирования данных и агрегирования данных, дает возможность значительно снизить погрешности определения параметров профиля пользователя и увеличить целенаправленность подачи рекламы.

Таким образом, обеспечивается - достижение предлагаемой полезной моделью технического результата в виде повышения точности определения параметров профилирования Интернет-пользователей для обеспечения повышения качества целенаправленного рекламирования.

1. Модуль сбора информации для профилирования Интернет-пользователей, содержащий

а. блок связи с внешними базами данных со статистикой,

b. контроллер Интернет-индексов,

с. последовательно включенные блок связи с сетью оператора и блок оборудования DPI (Deep Packet Inspection),

d. подсистему агрегирования данных,

е. подсистему профилирования данных,

причем выходы блока оборудования DPI, блока связи с внешними базами данных со статистикой и контроллер Интернет-индексов подключены к раздельным входам подсистемы агрегирования данных, а выход подсистемы агрегирования данных подключен к подсистеме профилирования данных.

2. Модуль сбора информации по п.1, отличающийся тем, что подсистема профилирования данных содержит объединенные по входу и имеющие раздельные выходы блок сегментации базовых признаков, блок сегментации ситуативной потребности и блок сегментации регулярной потребности.



 

Похожие патенты:

Таргетированная мобильная реклама (рекламная система) вконтакте, facebook и других социальных сетях относится к системам продажи и покупки рекламы в Интернете и позволяет повысить производительность средств распространения рекламных информационных материалов в Интернет и эффективность рекламного и информационного воздействия на пользователей.

Изобретение относится к информационным системам сбора, хранения, обработки и использования информации и может быть использовано при конструировании систем оперативного управления информацией, принадлежащей на правах собственности как отдельных людей, учреждений и предприятий, так и городов или регионов в целом

Техническим результатом предлагаемого устройства, реализующего способ параллельного вейвлет-преобразования, является получение спектра сигнала с минимальными задержками по времени и высоким разрешением по частоте

Полезная модель относится к области информационно-аналитических систем, предназначенных для сбора, обработки, анализа, структурирования и визуализации информации из разнородных источников
Наверх