И снова привет! Совсем недавно на Хабре публиковалась статья о больших данных металлургической промышленности и других технологиях. Кроме того, в том же материале рассказывалось о хакатоне с «Норникелем», который, как и планировалось, проходил с 16 по 18 апреля. Результаты уже известны, так что самое время их оценить. Все самое интересное, как водится — под катом.
Что за хакатон?
Это был 36-часовой онлайн-хакатон для:
— разработчиков
— дата сайентистов
— аналитиков
— менеджеров
Состоял он из двух основных треков:
Пенная вечеринка — определение по видео скорости потока пены с металлом и других параметров флотации для оптимизации работы оператора на производстве.
Больничные листы — создание модели предсказания ухода на больничный сотрудников в одном из производственных цехов Норникеля с использованием обезличенных данных о сотрудниках и их окружении.
Общий призовой фонд хакатона составил 500 000 рублей: по 250 000 рублей на каждый трек. Плюс каждый из участников получает мерч. Более того, за приз зрительских симпатий участники получают AirPods Pro, и доступны еще промокоды «Яндекс.Плюс», Okko, Gmoji.
Технологическим партнёром по вычислительным мощностям выступила компания SberCloud, выделившая участникам ресурсы облачной платформы ML Space и суперкомпьютера «Кристофари».
Немного важных цифр
На участие в хакатоне подали заявки 1027 человек — это отличный результат.
Тщательный отбор прошли заявки 25 команд, всего 98 участников. Забегая наперед, скажем, что 23 сдали решения по завершении, то есть справились с основной задачей. Ну а победителей определяло жюри.
Кстати, география участников была достаточно обширной — заявки поступили из Москвы, Санкт-Петербурга, Новосибирской, Свердловской, Калининградской областей, республики Татарстан, Краснодарского и Красноярского края. Всего мы насчитали 65 регионов!
Ну а теперь — к победителям
Для удобства будем указывать победителей для каждой из двух секций.
Призеры «Пенной вечеринки»
Команда «Random Seed and Nickel», которая заняла первое место. Ее участники — Андрей Рагимов, Валерий Шляпников, Сергей Соловьев, Никита Бузанов.
Для определения по видео скорости потока пены с металлом и других параметров флотации команда разработала:
Variational autoencoder для детектирования аномалий. Классические CV-алгоритмы для определения характеристик пены.
Проект был представлен в виде демо-визуализации с приближенной к финальной версии архитектурой. Оценить проект можно вот здесь (это репозиторий демо-визуализации).
Комментарий команды: «Мы просто хотели решить задачу не хуже других команд. Упаковать решение и удивить судей. Считаем, что нам это удалось».
Команда также рассчитывает на продолжение сотрудничества, с реализацией как предложенной на хакатоне идеи, так и дополнительных идей.
Ну а приз — 120 000 рублей. Неплохо!
Команда DigitalRover, она заняла второе место. Ее участники —
Эдуард Шамшурин, Мария Галкина, Михаил Дмитриев, Станислав Лебёдкин, Олег Черемисин.
Проект этой команды — интерактивный аналитический дашборд для контроля и управления флотационной машиной. Аналитика строится на как на принципах классического компьютерного зрения, так и на современных высокоскоростных нейронных архитектурах (YOLOv4) и собственного исследования автоэнкодеров. Отличительной особенностью является децентрализованная архитектура на Nvidia Jetson NANO.
Комментарий команды: «Хотели поработать над решением интересной реальной задачи такого гиганта, как Норникель. И, конечно, получить приз. Цели достигли, все отлично».
Участники Digital Rover также планируют продолжить сотрудничество с «Норникелем» для реализации своего решения.
Размер приза, который получила команда — 80 000 рублей.
Команда AutoDS, занявшая третье место. Участники —
Максим Орехов, Алексей Клоков, Артём Сенин, Игорь Иноземцев.
В ходе реализации проекта команда реализовала ряд алгоритмов и подходов, включая как State Of The Art алгоритмы предсказания Optical Flow, так и более традиционные классические метрики. Для нахождения пузырьков участники дотренировали алгоритм PointRend с хорошего чекпойнта и получили очень хорошие результаты. Комбинированное решение из Deep Learning и Classic CV алгоритмов показывает отличные результаты, обеспечивая хорошую комбинацию качества и скорости.
Приз — 50 000 рублей.
Призеры «Больничных листов»
Команды «Канапе» и Team Datamotion заняли первое место. Жюри просто не смогло отдать предпочтение кому-то одному, уж слишком интересными оказались оба проекта.
Состав команды «Канапе» — Максим Шевченко, Андрей Захаров,
Николай Попов. Кстати, эта команда получила еще и приз зрительских симпатий с призом — AirPods Pro для всей команды.
Суть проекта — базовое решение для предложенной задачи, с которым удалось занять первое место на публичном лидерборде. Помимо решения основной задачи участники предложили другие задачи, которые могут быть решены на основе этого набора данных.
Состав команды Team Datamotion — Георгий Рак, Evgenii Munin, Илья Ревин, Артем Савинов, Али Сафиуллин.
Суть проекта — 12 моделей с разными горизонтами прогнозирования (Catboost + LSTM + LogReg). Сгенерированные фичи: заболеваемость в отделах, фичи рабочего графика/часов работы, фичи родственников и другие возможности. В качестве исходных данных использовали информацию за 2015 — 8/2019: сезонная заболеваемость в регионе, данные погоды, данные о вредности производства. Финальное решение: Блендинг лучших моделей (Catboost + LSTM + LogReg).
Приз — по 75 000 рублей каждой из команд.
Команда «Скажите А» заняла второе место.
Состав команды: Светлана Сущинская, Ольга Филиппова, Елена Твердохлебова.
Суть проекта — Lightgbm с временным фичами, ситуацией, родственниками и другими возможностями. Команда настраивала лимит вероятности с расчетом на ковидный год. Валидация проводилась по последнему году.
Приз — 50 000 рублей.
Ну и команда «PyPyPy» заняла третье место.
Состав команды: Никита Фомичев, Александр Абрамов.
Суть ее проекта — модель предсказания заболеваемости на основе данных о предыстории болезней. Участники сделали небольшой граф взаимодействия смен и отделов через сотрудника, плюс использовали SHAP для интерпретации влияния фичей на заболеваемость.
Приз — 50 000 рублей.
Поздравляем победителей!
Подводя итоги, стоит вспомнить ожидания организаторов хакатона: «Хочется, как и всегда – довольных участников. При прочих равных, участники хакатона – это самый дорогой ресурс. Если сделать участников довольными с помощью интересных прикладных задач, а еще и к этому добавить промокоды на еду, призы, подарки, то они сами создадут почву для исследований, новые пул-реквесты, запустят новые стартапы или устроятся работать в «Норникель»».
Что же, участники, жюри, организаторы — все остались довольны результатами. Хотелось бы надеяться на то, что некоторые из предложенных идей будут реализованы уже на производстве.