Big Data в металлургии и охране труда: результаты хакатона с «Норникелем»

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.
image

И снова привет! Совсем недавно на Хабре публиковалась статья о больших данных металлургической промышленности и других технологиях. Кроме того, в том же материале рассказывалось о хакатоне с «Норникелем», который, как и планировалось, проходил с 16 по 18 апреля. Результаты уже известны, так что самое время их оценить. Все самое интересное, как водится — под катом.
Что за хакатон?

Это был 36-часовой онлайн-хакатон для:

— разработчиков
— дата сайентистов
— аналитиков
— менеджеров

Состоял он из двух основных треков:

Пенная вечеринка — определение по видео скорости потока пены с металлом и других параметров флотации для оптимизации работы оператора на производстве.

Больничные листы — создание модели предсказания ухода на больничный сотрудников в одном из производственных цехов Норникеля с использованием обезличенных данных о сотрудниках и их окружении.

Общий призовой фонд хакатона составил 500 000 рублей: по 250 000 рублей на каждый трек. Плюс каждый из участников получает мерч. Более того, за приз зрительских симпатий участники получают AirPods Pro, и доступны еще промокоды «Яндекс.Плюс», Okko, Gmoji.

Технологическим партнёром по вычислительным мощностям выступила компания SberCloud, выделившая участникам ресурсы облачной платформы ML Space и суперкомпьютера «Кристофари».

Немного важных цифр


На участие в хакатоне подали заявки 1027 человек — это отличный результат.

Тщательный отбор прошли заявки 25 команд, всего 98 участников. Забегая наперед, скажем, что 23 сдали решения по завершении, то есть справились с основной задачей. Ну а победителей определяло жюри.

Кстати, география участников была достаточно обширной — заявки поступили из Москвы, Санкт-Петербурга, Новосибирской, Свердловской, Калининградской областей, республики Татарстан, Краснодарского и Красноярского края. Всего мы насчитали 65 регионов!

Ну а теперь — к победителям


Для удобства будем указывать победителей для каждой из двух секций.

Призеры «Пенной вечеринки»


Команда «Random Seed and Nickel», которая заняла первое место. Ее участники — Андрей Рагимов, Валерий Шляпников, Сергей Соловьев, Никита Бузанов.



Для определения по видео скорости потока пены с металлом и других параметров флотации команда разработала:
Variational autoencoder для детектирования аномалий. Классические CV-алгоритмы для определения характеристик пены.

Проект был представлен в виде демо-визуализации с приближенной к финальной версии архитектурой. Оценить проект можно вот здесь (это репозиторий демо-визуализации).

Комментарий команды: «Мы просто хотели решить задачу не хуже других команд. Упаковать решение и удивить судей. Считаем, что нам это удалось».

Команда также рассчитывает на продолжение сотрудничества, с реализацией как предложенной на хакатоне идеи, так и дополнительных идей.

Ну а приз — 120 000 рублей. Неплохо!

Команда DigitalRover, она заняла второе место. Ее участники —
Эдуард Шамшурин, Мария Галкина, Михаил Дмитриев, Станислав Лебёдкин, Олег Черемисин.



Проект этой команды — интерактивный аналитический дашборд для контроля и управления флотационной машиной. Аналитика строится на как на принципах классического компьютерного зрения, так и на современных высокоскоростных нейронных архитектурах (YOLOv4) и собственного исследования автоэнкодеров. Отличительной особенностью является децентрализованная архитектура на Nvidia Jetson NANO.

Комментарий команды: «Хотели поработать над решением интересной реальной задачи такого гиганта, как Норникель. И, конечно, получить приз. Цели достигли, все отлично».

Участники Digital Rover также планируют продолжить сотрудничество с «Норникелем» для реализации своего решения.

Размер приза, который получила команда — 80 000 рублей.

Команда AutoDS, занявшая третье место. Участники —
Максим Орехов, Алексей Клоков, Артём Сенин, Игорь Иноземцев.



В ходе реализации проекта команда реализовала ряд алгоритмов и подходов, включая как State Of The Art алгоритмы предсказания Optical Flow, так и более традиционные классические метрики. Для нахождения пузырьков участники дотренировали алгоритм PointRend с хорошего чекпойнта и получили очень хорошие результаты. Комбинированное решение из Deep Learning и Classic CV алгоритмов показывает отличные результаты, обеспечивая хорошую комбинацию качества и скорости.

Приз — 50 000 рублей.

Призеры «Больничных листов»


Команды «Канапе» и Team Datamotion заняли первое место. Жюри просто не смогло отдать предпочтение кому-то одному, уж слишком интересными оказались оба проекта.



Состав команды «Канапе» — Максим Шевченко, Андрей Захаров,
Николай Попов. Кстати, эта команда получила еще и приз зрительских симпатий с призом — AirPods Pro для всей команды.

Суть проекта — базовое решение для предложенной задачи, с которым удалось занять первое место на публичном лидерборде. Помимо решения основной задачи участники предложили другие задачи, которые могут быть решены на основе этого набора данных.



Состав команды Team Datamotion — Георгий Рак, Evgenii Munin, Илья Ревин, Артем Савинов, Али Сафиуллин.

Суть проекта — 12 моделей с разными горизонтами прогнозирования (Catboost + LSTM + LogReg). Сгенерированные фичи: заболеваемость в отделах, фичи рабочего графика/часов работы, фичи родственников и другие возможности. В качестве исходных данных использовали информацию за 2015 — 8/2019: сезонная заболеваемость в регионе, данные погоды, данные о вредности производства. Финальное решение: Блендинг лучших моделей (Catboost + LSTM + LogReg).

Приз — по 75 000 рублей каждой из команд.

Команда «Скажите А» заняла второе место.

Состав команды: Светлана Сущинская, Ольга Филиппова, Елена Твердохлебова.



Суть проекта — Lightgbm с временным фичами, ситуацией, родственниками и другими возможностями. Команда настраивала лимит вероятности с расчетом на ковидный год. Валидация проводилась по последнему году.

Приз — 50 000 рублей.

Ну и команда «PyPyPy» заняла третье место.

Состав команды: Никита Фомичев, Александр Абрамов.



Суть ее проекта — модель предсказания заболеваемости на основе данных о предыстории болезней. Участники сделали небольшой граф взаимодействия смен и отделов через сотрудника, плюс использовали SHAP для интерпретации влияния фичей на заболеваемость.

Приз — 50 000 рублей.

Поздравляем победителей!

Подводя итоги, стоит вспомнить ожидания организаторов хакатона: «Хочется, как и всегда – довольных участников. При прочих равных, участники хакатона – это самый дорогой ресурс. Если сделать участников довольными с помощью интересных прикладных задач, а еще и к этому добавить промокоды на еду, призы, подарки, то они сами создадут почву для исследований, новые пул-реквесты, запустят новые стартапы или устроятся работать в «Норникель»».

Что же, участники, жюри, организаторы — все остались довольны результатами. Хотелось бы надеяться на то, что некоторые из предложенных идей будут реализованы уже на производстве.
Источник: https://habr.com/ru/post/553738/


Интересные статьи

Интересные статьи

Сегодня, в 20:00 в прямом эфире выступит Никита Александров — Data Scientist в Unity. Никита закончил ФКН ВШЭ, во время последнего курса получил стипендию Эразмуса и съездил на...
Представляем вашему вниманию перевод статьи, посвящённой использованию атрибутов data-*. Это — атрибуты, которые можно применять для удобного хранения в стандартных HTML-элементах различной полез...
Привет, Хабр! Представляю Вашему вниманию перевод руководства «Spring MVC + Spring Data JPA + Hibernate — CRUD Example» автора Nam Ha Minh. В этом руководстве по Java Spring вы узнаете, как на...
Многие сталкивались с замечательной функцией, к примеру, на коммутаторах HPE — если конфиг по какой-то причине не сохранен вручную, после перезагрузки накатывается предыдущий сохраненный конфиг. ...
Первые методы, использующие сенсорное раздражение для улучшения состояния при болезни Альцгеймера, были разработаны около двух лет назад, тогда речь шла о световой стимуляции. Теперь ученые приме...