Задачка для дата сайентистов по Data Warehouse

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!

Привет, хабровчане! Недавно в OTUS мы провели соревнования по Data Science. По задаче в категории Data Warehouse нам прислали всего два решения — и мы решили поинтересоваться у более широкой аудитории, насколько сложной получилась эта задача. Если вы работаете с данными, приглашаем попробовать ее решить и получить приятные бонусы от OTUS.


Категория: Data Warehouse

Сквозная аналитика и практики Data-driven для e-Commerce: построение логической модели Хранилища Данных, расчет бизнес-метрик и формирование аналитических Витрин.

Задача:

Помочь владельцу e-Commerce-платформы принимать обоснованные и взвешенные решения на основании данных.

Бизнес-проблематика:

До того как вы взялись за задачу решения принимались на интуитивном уровне, без веских обоснований и часто оказывались ошибочными/убыточными.

Основная проблема бизнеса сегодня – отсутствие прозрачности и прогнозируемости по основным показателям: трафик, пользователи, взаимодействия, траты на привлечение, выручка, отдача на инвестиции, конверсии в клиентских воронках.

Владельцы бизнеса не могут ответить на элементарные вопросы:

  • Поведенческие характеристики, вовлеченность, интерес аудитории (веб-аналитика)

  • Какова доля рекламного трафика в общем объеме?

  • Есть ли связь между затратами на рекламу и конверсиями?

  • Какие каналы привлечения (кампании, объявления) являются наиболее перспективными и прибыльными, а от каких следует отказаться?

  • Насколько эффективно выстроены этапы пользовательской воронки?

  • На каких этапах воронки теряется большое количество лидов? Где и что можно улучшить?

Ваша задача — помочь выстроить культуру принятия решений, основанных на объективных фактах и событиях.

ПОЛНОЕ ОПИСАНИЕ С ДАННЫМИ ЗАДАНИЯ ЗДЕСЬ


Условия:

Свои решения присылайте через форму

Дедлайн: 30 мая, воскресенье, 23:00

Определение лучшего решения: 2 июня

Бонусы:

Автор лучшего решения по мнению команды жюри — экспертов OTUS — получит 50% скидку на курс на выбор:

  • Data Engineer

  • Hadoop, Spark, Hive

  • Data Warehouse Analyst

  • или другой из курсов раздела Data Science.

Все остальные участники, приславшие корректное решение, получат скидку 20% на один из курсов раздела Data Science.

В комментариях допустимо обсуждать задачу, но просим не публиковать здесь решение до закрытия дедлайна.

Жюри:

  • Артемий Козырь – более 5 лет опыта с Хранилищами данных, построении ETL/ELT систем

В рамках соревнований была задача в категории Machine Learning, в которой требовалось построить рекомендательную систему для OTUS. При этом модель должна уметь работать, в том числе, и с новыми пользователями, которые еще не купили ни одного курса. Ответы на это задание прислали 14 участников. Итоговое решение получилось почти в 3 раза лучше по качеству, чем предложенный бейслайн.

Ждем ваших решений и комментариев по поводу задачи!

Источник: https://habr.com/ru/company/otus/blog/559618/


Интересные статьи

Интересные статьи

Эта статья является конспектом книги «Designing Data-Intensive Applications». В предыдущем конспекте мы рассмотрели «грязную» операцию чтения – это разновидность состояния гонки, возникаю...
Впервые о намерении создать полноценный плавучий дата-центр компания Nautilus Data Technologies (NDT) заявила несколько лет назад. В 2015 году она разработала и протестировала прототип,...
From this article, you will learn how to recover data from DVR and NVR video recorders. We will explore the peculiarities of how they store video files, why such files can be lost, and ho...
Сегодня отправимся в Калининский район Санкт-Петербурга и со всех сторон посмотрим на дата-центр "Ростелеком-ЦОД", который запустился в декабре 2020 года. Новый ЦОД постр...
Представляем вашему вниманию перевод статьи, посвящённой использованию атрибутов data-*. Это — атрибуты, которые можно применять для удобного хранения в стандартных HTML-элементах различной полез...