img21 января 2015 в 13:01

Е-контента- российское облачное решение для рекомендаций

Е-контента- стартап, предлагающий свою разработку автоматического рекомендательного движка для медиасервисов. Особенность решения - эффективных подход к проблеме «холодного старта» за счет привлечения и анализа дополнительной информации об интересах пользователя.

Е-контента- стартап, предлагающий свою разработку автоматического рекомендательного движка для медиасервисов. Особенность решения - эффективных подход к проблеме «холодного старта» за счет привлечения и анализа дополнительной информации об интересах пользователя.

Компания «Е-контента» - российский стартап, возникший как сервис рекомендаций для читателей и покупателей электронных книг и затем перепрофилировавшийся в рекомендательный движок для владельцев медиаконтента. Решение сейчас активно развивается. Как отмечает директор и создатель компании Зоя Никитина, стартап - это состояние поиска, когда команда единомышленников ищет бизнес-модель и постоянно готова к изменениям. Основной костяк сотрудников стартапа - это не наемные работники, исполняющие указания сверху, а квалифицированные партнеры - люди, обладающие необходимой компетенцией, видением перспектив и заинтересованные в успехе. Поиск правильной команды, как отмечает Зоя, был самой трудной ее задачей как руководителя и занял почти два года. Сейчас в компании работают трое единомышленников-основателей и каждый отвечает за свое направление: бизнес, математические алгоритмы и их реализацию. Кроме того, постоянно работает группа программистов, воплощающая задумки в жизнь. «Направление деятельности определилось около года назад. После создания команды и оформления идеи мы привлекли небольшие сидовые (начальные) инвестиции от бизнес-ангела и начали работу», - рассказывает Зоя.

Бизнес-модель

Первым образцом для «Е-контенты» послужил известный американский сервис Goodreads, рекомендующий книги на основе предпочтений по жанрам, оценок прочитанных книг и профиля Фейсбука. У Goodreads миллионы пользователей. Новый пользователь при заходе должен проставить оценки нескольким десяткам книг, после этого начинает работать рекомендательный движок. В информации о книгах есть ссылки на интернет-магазины, где их можно купить; после покупки Goodreads получает комиссию.

«Е-контента» попробовала создать аналогичный сервис, а в качестве подключенного магазина выбрала Amazon. Как рассказывает Зоя Никитина, российские продавцы электронных книг в тот момент имели слишком небольшой ассортимент и неотлаженную программу аффилированных продаж, когда за перепродажу контента партнеру гарантировался бы процент от сделки. Однако после предварительной оценки окупаемости от идеи собственного сервиса пришлось отказаться. Дело в том, что книги - недорогой товар. Если с помощью сервиса продается книга стоимостью 10 долларов, то даже если комиссия будет 10%, заработок составляет всего доллар. Нужно учесть, что конверсия из посетителей в покупатели в среднем держится на уровне 2%. Исходя из этого понятно, что для окупаемости у сайта, рекомендующего книги и использующего такую схему монетизации, должна быть громадная, многомиллионная посещаемость, поэтому придется либо вкладывать колоссальные средства в маркетинг и продвижение, либо ждать результата долгие годы.

Логичным выводом для «Е-контенты» стала ориентация на B2B-сегмент и технологический сервис для всего мира. Вариантов выбора было два. Во-первых, можно было стать рекомендательным движком для сервисов электронной коммерции. Именно это направление советовали бизнес-консультанты. Электронная коммерция успешно развивается во всем мире, в интернет-магазинах продаются любые товары, то есть сфера деятельности рекомендательного движка максимально велика. В этой области работают многие рекомендательные сервисы, среди российских наиболее известны Retail Roсket и Crosss.

Однако компания выбрала другой путь - рекомендации в области медиаконтента. По мнению Зои, это направление сейчас развивается динамично. На российском рынке есть всего с десяток действительно успешных интернет-магазинов - это, например, «Юлмарт» и Wildeberries. В основном же площадки работают на грани самоокупаемости и не могут себе позволить платить сторонним сервисам значительные средства. В то же время медиарынок бурно развивается. Книги, например, все больше читаются именно в электронном виде, и даже в России появились и продажи, и подписные сервисы. В 2013 году 7% мирового рынка продаж книг формировали электронные издания, а к 2020 году их доля будет уже 25%. Видео тоже распространяется теперь в электронном виде, все контент-провайдеры выходят в онлайн и интернет-кинотеатров становится все больше. «Мы считали суммарный объем мирового рынка: к 2020 году по книгам, видео и аудио он будет составлять 70 мрд долларов в год», - рассказывает Зоя. Медиасервисам, работающим через Интернет, нужны технологические партнеры. Лидеры продаж на этом рынке - такие компании, как Amazon, - очень много вкладывают в технологии, в том числе в рекомендательные движки. Амазон, скажем, инвестирует в R&D 2,6 млн долларов ежегодно. Противостоять такой мощи отдельным контент-провайдерам очень сложно, но нужно стараться, а для этого им имеет смысл объединять усилия и привлекать сторонние решения. «Поэтому здесь появляется место для таких компаний, как мы, - узко заточенных на какую-то специфическую разработку, - рассказывает Зоя. - Мы создаем продукт как аутсорсеры для медиакомпаний, которые, с одной стороны, не могут ждать и тратить миллионы на собственные технологии, а с другой стороны, им нужно сильное конкурентное преимущество уже сегодня. Мы конкурируем с другими технологическими компаниями, которые делают такие же решения на европейском или американском рынке. Кто лучше, определят пользователи, которые будут реагировать на рекомендации либо рублем, либо кликом, либо временем, проведенным за просмотром фильма, - это ключевые показатели, по которым будут ориентироваться сервисы-клиенты».

Итак, решено было заниматься рекомендациями именно для медиасервисов: делать решение для книг, музыки, видео, а также, возможно, игр и обучающих курсов и предлагать решение по модели SaaS.

Работа началась с книг. «Е-контента» предложила внедрить свои пилотные решения двум книжным сервисам, Bookmate и MyBook.

Первые «пилоты» - рекомендации книг

Bookmate выдает персональные рекомендации новым пользователям, чтобы поскорее сделать из посетителя покупателя. До этого для этой цели использовались редакторские рекомендации - читателям предлагались тематические списки. Задачи у редакторских рекомендаций несколько другие, но, естественно, сервис оценивал результаты пилотного внедрения персональных автоматических рекомендаций «Е-контенты» по сравнению с работой существующего сервиса. Зоя Никитина рассказывает, что тестирование оказалось очень успешным: «Персональные рекомендации позволили заметно улучшить результаты - сравнительные AB-тесты показывают, что кликабельность предлагаемых названий книг в случае персональных рекомендаций в 2,17 раза выше, чем редакторских. Это очень хороший результат. Поэтому наше решение продолжает работать на Bookmate и будет и дальше улучшаться и дорабатываться, мы не стоим на месте».

Новый подобный «пилот» внедряется в принадлежащем магазину «Литрес» сервисе MyBook, тоже предлагающем платную месячную подписку. Сейчас идет тестирование для пользователей мобильного приложения.

Решение - сбор информации и алгоритм

Решение, которое предлагает компания, - облачное, оценки предпочтений считаются на серверах «Е-контенты». «Е-контента» получает от сервиса данные об интересах читателей (явных, например рейтингах, и неявных - времени чтения той или иной книги) и в случае необходимости дополняет их. Как рассказывает Зоя Никитина, основная проблема, которая выявилась в процессе пилотных внедрений, - это именно сбор данных о пользователях. Некоторые сервисы эти данные вообще не собирают. Некоторые собирают, но их недостаточно для эффективного поиска пользователей с похожими вкусами. В этом случае есть несколько вариантов : можно, например, использовать данные из профилей пользователей в соцсетях, можно дополнительно покупать информацию у специальных агрегаторов - так называемых Data Management Platform, которые по крупицам копят данные о всех пользователях Интернета. Когда мы разрешаем использовать информацию, которую мы оставляем на каких-то сайтах, например за какие-то дополнительные услуги, эта информация собирается такими агрегаторами. Один из примеров таких компаний - Facetz. Собирается также информация об устройствах, например мак-адресе телефона и списке установленных на нем приложений, геолокацией определяется местоположение пользователя и т.д. Чем больше данных, тем точнее результат.

Зоя Никитина: «Заслуга эффективной работы алгоритмов Е-Контенты принадлежит директору R&D Александру Петрову. Александр закончил Московский государственный университет, факультет вычислительной математики и кибернетики, и прежде чем присоединиться к команде «Е-Контенты», работал с большими данными в компаниях Mail.ru и Yandex. В частности, ему принадлежит идея «скармливать» рекомендательному движку данные от социальных сетей. В нашем тесте с Bookmate использование информации о группах «ВКонтакте», в которых состоит пользователь, позволила в разы увеличить эффективность рекомендаций по сравнению с изначальными показателями. Эффективность при этом оценивалась по количеству открываемых пользователями книг. Мы хотим в будущем развивать использование соцсетей для определения интересов пользователей. В России на эту тему мало кто проводит исследования и устанавливает взаимосвязи между поведением людей в социальных сетях и их эмоциональным и психологическим состоянием. За рубежом, в Станфорде и Кембридже, есть исследователи, которые изучают возможности извлечения информации о пользователе из неявных данных, например из периодичности обновления аватара или количества читаемых новостных лент . Мы ведем с ними переговоры для того, чтобы наладить сотрудничество. Мы считаем, что социальная психология пользователей в разных странах близка и эти исследования можно использовать для рекомендательных движков в любой стране мира».

Да, сразу отметим, что данные о пользователях исключительно важны потому, что в своем рекомендательном движке «Е-контента» использует механизм коллаборативной фильтрации. При этом для работы алгоритма можно не использовать детальную информацию о жанрах или сюжете рекомендуемых книг. Самое главное - определить интересы пользователя и найти других пользователей с более-менее похожими вкусами. Получается, что ваши единомышленники советуют вам те книги, которые им понравились, и задача движка - найти именно тех единомышленников, на основе мнений которых можно предсказать, насколько вас заинтересует та или иная книга, доступная в данном сервисе. Это принципиально другой подход по сравнению с фильтрацией по контенту, в котором вам предлагают книги, похожие на то, что вас заинтересовало в данный момент или нравится в целом. Фильтрация по контенту базируется не на информации о пользователях, а на информации о книге: метаданных, тексте, критических статьях. Оба подхода имеют преимущества и недостатки. Основное преимущество коллаборативной фильтрации - возможность не ограничиваться все теми же жанрами, авторами и сюжетами, а находить неожиданное и интересное. Основной недостаток в том, что для адекватного результата может не хватать информации о пользователях, особенно при старте сервиса. Именно поэтому есть необходимость привлекать сторонние данные, как и упоминалось выше.

С точки зрения математики обе системы рекомендаций разрабатываются уже давно, коллаборативная фильтрация в случае статического медиаконтента (библиотек или видео по запросу) используется, пожалуй, чуть чаще, потому что «коллективный разум» использовать проще, чем оттачивать алгоритмы извлечения метаданных, особенно для видео. Есть даже готовые бесплатные программные библиотеки, которые теоретически позволяют сэкономить время разработки. Но «Е-контента» проанализировала имеющиеся варианты и решила сделать собственное решение с нуля и написать весь движок самостоятельно. По мнению Зои Никитиной, время, которое программисты тратят на написание собственного кода, близко к тому, которое требуется для работы с чужими библиотеками, а поскольку решение нужно постоянно обновлять и модифицировать, удобнее, когда оно не зависит от чужих разработок. Опыт, который был у команды «Е-контенты», показывал, что, если есть время и силы, лучше заниматься разработкой своего программного продукта. Решение написано на Python и оттестировано на достаточно высоконагруженных сервисах - у Bookmate несколько миллионов пользователей, а скорость ответа облачного рекомендательного движка исчисляется долями миллисекунд.

Самый долгий процесс - пересчет модели для учета всех последних изменений в рекомендациях и оценках других пользователей, он происходит дважды в сутки, что позволяет оперативно отслеживать изменения, но не перегружать движок.

Видео

Естественным продолжением работы «Е-контенты» с книжными сервисами стали рекомендации для видео по запросу. Это направление стало развиваться совсем недавно: с первыми потенциальными партнерами представители «Е-контенты» познакомились на Петербургском медиафоруме осенью этого года. Базовое решение используется то же, что и для книг, но для конкретных компаний, с которыми ведутся переговоры о тестировании, его нужно дорабатывать. Сериалы, например, рекомендуются по-другому, чем фильмы, а если речь идет о потреблении контента на телевизоре, то нужно учитывать, что его смотрит не один пользователь, а несколько, поэтому нужно определять личность зрителя по паттерну поведения.

Схема работы обычно следующая: «Е-контента» предлагает проинтегрировать решение и протестировать его, причем почти бесплатно. Партнер платит только небольшую цену за интеграцию, в соответствии с необходимым количеством часов, которые на нее потребуются. Иногда это занимает несколько дней. Иногда больше, например, если сервис не собирал данные о пользователях или есть какие-то технические сложности. После этого запускается бесплатный пилотный проект и оценивается результат. На все это уходит совсем немного времени - около полутора месяцев. Если оказывается, что рекомендации приносят пользу, на сервис предлагается подписаться.

Сейчас запущен пилотный проект с платформой «Видимакс», ведутся переговоры с интернет-видеосервисами и операторами платного кабельного ТВ. Конкретные результаты можно ожидать через месяц.

Оценка эффективности

Бизнес-цели и ключевые метрики, по которым измеряется эффективность, оговариваются для каждого партнера. Основные метрики, которые используются сейчас в тестах, - это покупки и время. Как рассказывает Зоя, время - более существенный критерий для рекламных и подписных сервисов (для уже существующих подписчиков). В случае продаж книги, фильма, песни или подписки критерии оценки - это клики, и, конечно, самый главный показатель - продажи. Баланс между оценкой по кликам и продажам зависит от конкретного сервиса-партнера. Например, в книжных сервисах «Е-контента» исследовала варианты соотношения платного и бесплатного контента в выдаче. Чем больше бесплатного контента, тем больше кликов. Пользователи закономерно чаще открывают и читают бесплатные книги. Но одновременно для увеличения лояльности и повышения продаж пользователям важно предлагать те книги, которые их в данный момент интересуют, а не только бесплатную классику. Доля бесплатного контента должна быть невелика, потому что заплатить 150-200 рублей за месяц подписки на книжный или видеосервис сейчас может практически любой. Для видеосервисов соотношение будет свое; для каждого конкретного партнера параметры нужно настраивать отдельно.

Перспективы

Как отмечают аналитики, в современном развитии российских интернет-сервисов есть одна важная особенность - широкое использование российских платформ и решений. Пока российских рекомендательных движков для медиаконтента очень мало и у каждого стартапа есть возможность завоевать российский рынок, если вовремя начать, найти свою нишу и партнеров.

«Е-контента» - все еще стартап, но развивается достаточно быстро. Рекомендации книг начались с середины 2013 года, и уже есть успешные внедрения и первые клиенты. Рекомендации видеоконтента начались совсем недавно, результаты пилотов в видео станут известны через пару месяцев. Идет сбор данных, оптимизация движка, прорабатываются нюансы и детали, которые нужны для каждого конкретного внедрения. Компания также начала переговоры с европейскими и американскими клиентами.

При этом определилось и направление, в котором «E-контента» надеется получить конкурентные преимущества по сравнению с другими разработчиками. Это использование социальных сетей и фокус на медиарынке, без распыления на другие индустрии электронной коммерции.

Зоя Никитина: «Социальная психология, которая подкреплена исследованиями (big data), - это перспективное направление и для рекомендательных сервисов, и для других персональных услуг.

В России пока все собирают данные, с том числе и данные о поведении пользователей в соцсетях, но эти данные не анализируются, так как нет нужных ресурсов и исследователей. У нас есть идеи развивать это направление в России, совместно с университетами создать центр разработки, поставить задачи, привлечь иностранных экспертов. Пока это отдельная проектная линия, и она займет не один год работы. А затем мы сможем использовать результаты в нашей деятельности».

Подписка на рассылку

Подпишитесь на рассылку, чтобы одним из первых быть в курсе новых событий