Data Science требует использования статистических методов и алгоритмов машинного обучения для работы с большим объёмом данных, и для того чтобы делать это эффективно, вам потребуется много практики. Отличная возможность попрактиковаться — соревнования по Data Science. Они служат платформой для изучения лучших практик, получения отзывов и повышения квалификации. Это также отличный способ расширить возможности творить и границы в области науки о данных. Я делал подобный список и в прошлом году, поэтому подумал, что это будет хорошее время, чтобы обновить его на 2021 год.
Большинство конкурсов данных предполагают, что участники решают реальную бизнес-задачу, используя методы геймификации, чтобы найти лучшее решение в короткие сроки. Быть хорошим специалистом по Data Science означает обладать знаниями в предметной области, поэтому соревнования — отличная возможность погрузиться в предметную область и понять, как использовать свои знания для решения бизнес-задач. Вот 10 соревнований по Data Science и искусственному интеллекту или платформ соревнований, на которых вы сможете вывести свои навыки на новый уровень в 2021 году. Если у вас есть предложения, что добавить в список, оставьте их в комментариях.
Что это такое?
Numer.ai, согласно их веб-сайту, — «самый сложный турнир по науке о данных на планете», его поддерживает Union Square Ventures, соучредитель Renaissance и Coinbase. Основная идея турнира — создать мировой открытый хедж-фонд путём моделирования фондового рынка. На веб-сайте подробно описаны эти шаги:
Специалисты по Data Science, которые примут во всём этом участие, получат выплаты (в криптовалюте), исходя из производительности моделей. На данный момент исследователям данных выплачено в общей сложности 37 160 659 долларов США.
Как это работает: ставка делается, чтобы заработать. Вы либо зарабатываете, либо сжигаете процент от своих акций в зависимости от производительности вашей модели. Прочитать об этом больше можно на веб-сайте.
Когда
Турнир питает хедж-фонд в режиме реального времени, поэтому должен продолжаться до тех пор, пока работает хедж-фонд. Чтобы узнать больше о Numer.ai, читайте их блог здесь.
Что это такое?
IASC — это ассоциация Международного статистического института (ISI), цель которой — продвижение теории, методов и практики статистических вычислений, а также развитие интереса и знаний в области эффективных и действенных статистических вычислений (с веб-сайта). Тема: анализ данных, связанных с качеством жизни.
Ваша презентация должна чётко описывать значимость ваших выводов как для отдельных людей, так и для общества. Первичный набор данных может поступать из одной или нескольких баз данных, но объединение информации из разных баз данных может помочь получить интересные и оригинальные выводы. Соревнование открыто для всех желающих представить свой плакат на выставке WSC 2021. Над вашим PDF можно работать лично или в небольшой группе (до 5 участников).
Когда — окончательные материалы (в формате PDF) должны быть представлены 30 апреля 2021 года.
Что это такое?
Ежегодный TopCoder Open (ТСО), организованный TopCoder, — это запредельный турнир по программированию и дизайну.
В общей сложности 6 конкурсных треков, где первые соревнования проходят онлайн, победители накапливают баллы TCO на протяжении всего соревнования, а те, кто наберёт наибольшее количество баллов, выигрывают поездку в финал TCO. TCO также проводит небольшие региональные мероприятия, поощряя участников со всего мира.
Всего есть шесть конкурсных треков:
Чтобы узнать больше, прочитайте обзор.
Когда — старт дан 1 января 2021 года!
Что это такое?
Хозяева Challenge Data — ENS и Collège de France. Организован сбор бизнес-задач Data Science с данными, предоставляемыми государственными службами, компаниями и лабораториями. Нужно решить следующие проблемы:
А у участников есть публичные (представления рангов в открытом тестовом наборе) и закрытые таблицы лидеров (ранговые представления в закрытом тестовом наборе). Подробнее читайте в основной документации и часто задаваемых вопросах.
Когда — соревнование началось 4 января 2021 года.
Что это такое?
Kaggle не нуждается в представлении благодаря распространённости в сообществе Data Science. Это самая популярная платформа для проведения соревнований по Data Science с очень хорошими призами. Соревнования Kaggle созданы, чтобы бросать вызов конкурентам на всех этапах их карьеры в области машинного обучения. Существует обширный ряд типов соревнований (из документации):
Последние соревнования
Что это такое?
CodaLab — это платформа с открытым исходным кодом, которая даёт экосистему для проведения вычислительных исследований более эффективным, воспроизводимым и командным образом. В CodaLab есть два аспекта: рабочие листы и соревнования.
Рабочие листы позволяют воспроизводить сложные исследовательские программы и создавать «исполняемые статьи». Используйте любой формат данных или язык программирования — платформа отлично подходит для опытного пользователя! У рабочих листов Codalab есть открытые экземпляры, размещённые в Стэнфордском университете.
Сегодня соревнования объединяют всё сообщество в решении самых сложных проблем с данными и вычислениями. Вы можете выиграть призы, а также создать своё собственное соревнование.
Последние соревнования — 2020 Seu Video Caption Competition.
Что это такое?
DrivenData привносит передовые методы в области Data Science и краудсорсинга в некоторые из самых больших социальных проблем, а также организации, берущие эти проблемы на себя. Существует множество онлайн-задач, обычно длящихся 2-3 месяца, где глобальное сообщество специалистов Data Science соревнуется за лучшую статистическую модель для решения сложных, значимых прогностических задач.
Согласно веб-сайту:
Последние соревнования — MagNet: Model the Geomagnetic Field.
Что это такое?
«Последнее поле битвы Data Science», коллекция соревнований, чтобы сражаться, побеждать, практиковаться, учиться и создать своё портфолио Data Science! Хакатоны в области Data Science на DataHack позволяют конкурировать с ведущими исследователями данных и экспертами в области машинного обучения во всем мире. Это ваш шанс поработать над задачами науки на реальных данных, повысить мастерство, учиться у профессионалов в области информатики и машинного обучения, а также прорубить свой путь к вершине хакатона! У вас также есть шанс выиграть призы и устроиться на работу в компанию Data Science вашей мечты. Начните хакатон Data Science уже сегодня!
Последние соревнования — Loan Prediction.
Что это такое?
Онлайновая платформа для проведения соревнований по машинному обучению. Здесь найдутся самые сложные бизнес-проблемы, которые теперь можно решить с помощью Data Science и ML. Соревнуйтесь с сотнями специалистов на хакатоне, созданном индустрией.
Последние соревнования — Buyer’s Time Prediction Challenge.
Что это такое?
Zindi — первая платформа для проведения соревнований в области Data Science в Африке. На Zindi расположена целая научная экосистема данных, в которую входят учёные, инженеры, академики, компании, НПО, правительства и институты, сосредоточенные на решении самых насущных проблем Африки.
Для специалистов, от новичков до рок-звёзд, Zindi, — это место, где можно получить доступ к африканским наборам данных и решить проблемы Африки. Специалисты по работе с данными найдут на Zindi все необходимые инструменты, чтобы соревноваться, делиться идеями, оттачивать свои навыки, создавать свой профессиональный профиль, находить возможности карьерного роста и весело проводить время! Заметьте, что некоторые проблемы стоят только перед жителями Африки.
Последние соревнования — Uber Nairobi Ambulance Perambulation Challenge.
Что это такое?
AIcrowd — это платформа для оптимизации рабочего процесса, связанного с искусственным интеллектом, как внутри компании, так и за её пределами путём выполнения задач, связанных с искусственным интеллектом, машинным обучением и другими задачами в области Data Science. Она помогает организациям — будь то предприятия, университеты, правительственные учреждения или НПО — разрабатывать, управлять и продвигать свои задачи. Она оптимизирует рабочий процесс машинного обучения и связывает ваши задачи со специалистами и энтузиастами в области машинного обучения и Data Science, которые совместно пытаются найти наиболее точные, эффективные и действенные решения.
Последние соревнования — Motor insurance market simulation.
Что это такое?
IronViz — крупнейший в мире конкурс по визуализации виртуальных данных — зажигает и демонстрирует мощь сообщества Tableau, позволяя вам взаимодействовать с рок-звёздами данных по всему миру. Три финалиста (определяемые по результатам отборочного турнира IronViz в начале этого года) выйдут на Чемпионат IronViz в октябре 2021 года. Победитель зарабатывает не только право на хвастовство в течение года и место среди невероятного списка прошлых чемпионов, в 2020 году на кону было $ 10,000, но и пожертвование в размере $ 5,000 в пользу некоммерческой организации по выбору чемпионов.
Когда — будет объявлено позже.
Если вы студент или если вы преподаватель, поощряющий студентов изучать Data Science и AI, посмотрите на эти задачи.
Спасибо, что прочитали! Пожалуйста, оставьте в комментариях любые другие крутые соревнования, которых нет в списке. Берегите себя и счастливых вам хаков!
Большинство конкурсов данных предполагают, что участники решают реальную бизнес-задачу, используя методы геймификации, чтобы найти лучшее решение в короткие сроки. Быть хорошим специалистом по Data Science означает обладать знаниями в предметной области, поэтому соревнования — отличная возможность погрузиться в предметную область и понять, как использовать свои знания для решения бизнес-задач. Вот 10 соревнований по Data Science и искусственному интеллекту или платформ соревнований, на которых вы сможете вывести свои навыки на новый уровень в 2021 году. Если у вас есть предложения, что добавить в список, оставьте их в комментариях.
1. Numer.ai
Что это такое?
Numer.ai, согласно их веб-сайту, — «самый сложный турнир по науке о данных на планете», его поддерживает Union Square Ventures, соучредитель Renaissance и Coinbase. Основная идея турнира — создать мировой открытый хедж-фонд путём моделирования фондового рынка. На веб-сайте подробно описаны эти шаги:
- Начните с качественных данных о хедж-фондах.
- Примените машинное обучение для прогнозирования поведения фондового рынка.
- Предоставьте свои прогнозы, чтобы контролировать капитал хедж-фонда Numer.ai.
Специалисты по Data Science, которые примут во всём этом участие, получат выплаты (в криптовалюте), исходя из производительности моделей. На данный момент исследователям данных выплачено в общей сложности 37 160 659 долларов США.
Как это работает: ставка делается, чтобы заработать. Вы либо зарабатываете, либо сжигаете процент от своих акций в зависимости от производительности вашей модели. Прочитать об этом больше можно на веб-сайте.
Когда
Турнир питает хедж-фонд в режиме реального времени, поэтому должен продолжаться до тех пор, пока работает хедж-фонд. Чтобы узнать больше о Numer.ai, читайте их блог здесь.
2. IASC Data Analysis Competition 2021
Что это такое?
IASC — это ассоциация Международного статистического института (ISI), цель которой — продвижение теории, методов и практики статистических вычислений, а также развитие интереса и знаний в области эффективных и действенных статистических вычислений (с веб-сайта). Тема: анализ данных, связанных с качеством жизни.
Ваша презентация должна чётко описывать значимость ваших выводов как для отдельных людей, так и для общества. Первичный набор данных может поступать из одной или нескольких баз данных, но объединение информации из разных баз данных может помочь получить интересные и оригинальные выводы. Соревнование открыто для всех желающих представить свой плакат на выставке WSC 2021. Над вашим PDF можно работать лично или в небольшой группе (до 5 участников).
Когда — окончательные материалы (в формате PDF) должны быть представлены 30 апреля 2021 года.
3. TopCoder Open 2021
Что это такое?
Ежегодный TopCoder Open (ТСО), организованный TopCoder, — это запредельный турнир по программированию и дизайну.
В общей сложности 6 конкурсных треков, где первые соревнования проходят онлайн, победители накапливают баллы TCO на протяжении всего соревнования, а те, кто наберёт наибольшее количество баллов, выигрывают поездку в финал TCO. TCO также проводит небольшие региональные мероприятия, поощряя участников со всего мира.
Всего есть шесть конкурсных треков:
- Алгоритмы.
- Разработка.
- Первый на финише.
- Марафон.
- Дизайн пользовательского интерфейса.
- Обеспечение качества.
Чтобы узнать больше, прочитайте обзор.
Когда — старт дан 1 января 2021 года!
4. Challenge Data 2021
Что это такое?
Хозяева Challenge Data — ENS и Collège de France. Организован сбор бизнес-задач Data Science с данными, предоставляемыми государственными службами, компаниями и лабораториями. Нужно решить следующие проблемы:
- Данные.
- Скоринг.
- Тестовый набор.
- Оценка.
А у участников есть публичные (представления рангов в открытом тестовом наборе) и закрытые таблицы лидеров (ранговые представления в закрытом тестовом наборе). Подробнее читайте в основной документации и часто задаваемых вопросах.
Когда — соревнование началось 4 января 2021 года.
5. Kaggle Competitions
Что это такое?
Kaggle не нуждается в представлении благодаря распространённости в сообществе Data Science. Это самая популярная платформа для проведения соревнований по Data Science с очень хорошими призами. Соревнования Kaggle созданы, чтобы бросать вызов конкурентам на всех этапах их карьеры в области машинного обучения. Существует обширный ряд типов соревнований (из документации):
- Оборочные соревнования.
- Соревнования исследований.
- «Песочница».
- Рекрутинговые соревнования.
- Годовые соревнования.
- Соревнования с ограниченным участием.
Последние соревнования
- Riiid! Answer Correctness Prediction — $ 100,000
- Jane Street Market Prediction — $ 100,000
- RANZCR CLiP — Catheter and Line Position Challenge — $ 50,000
6. CodaLab
Что это такое?
CodaLab — это платформа с открытым исходным кодом, которая даёт экосистему для проведения вычислительных исследований более эффективным, воспроизводимым и командным образом. В CodaLab есть два аспекта: рабочие листы и соревнования.
Рабочие листы позволяют воспроизводить сложные исследовательские программы и создавать «исполняемые статьи». Используйте любой формат данных или язык программирования — платформа отлично подходит для опытного пользователя! У рабочих листов Codalab есть открытые экземпляры, размещённые в Стэнфордском университете.
Сегодня соревнования объединяют всё сообщество в решении самых сложных проблем с данными и вычислениями. Вы можете выиграть призы, а также создать своё собственное соревнование.
Последние соревнования — 2020 Seu Video Caption Competition.
7. Driven Data
Что это такое?
DrivenData привносит передовые методы в области Data Science и краудсорсинга в некоторые из самых больших социальных проблем, а также организации, берущие эти проблемы на себя. Существует множество онлайн-задач, обычно длящихся 2-3 месяца, где глобальное сообщество специалистов Data Science соревнуется за лучшую статистическую модель для решения сложных, значимых прогностических задач.
Согласно веб-сайту:
- Всё начинается с данных — конкурентам даеётся набор данных как с зависимыми, так и с независимыми переменными.
- Второй набор данных данных — только с независимыми переменными, а зависимые переменные, соответствующие этому набору, держатся в секрете.
- Вы строите модель.
- Представляете прогнозы для второго набора, сравниваете их с фактическими.
- Команда с лучшей производительностью объявляется победителем.
Последние соревнования — MagNet: Model the Geomagnetic Field.
8. DataHack
Что это такое?
«Последнее поле битвы Data Science», коллекция соревнований, чтобы сражаться, побеждать, практиковаться, учиться и создать своё портфолио Data Science! Хакатоны в области Data Science на DataHack позволяют конкурировать с ведущими исследователями данных и экспертами в области машинного обучения во всем мире. Это ваш шанс поработать над задачами науки на реальных данных, повысить мастерство, учиться у профессионалов в области информатики и машинного обучения, а также прорубить свой путь к вершине хакатона! У вас также есть шанс выиграть призы и устроиться на работу в компанию Data Science вашей мечты. Начните хакатон Data Science уже сегодня!
Последние соревнования — Loan Prediction.
9. Machine Hack
Что это такое?
Онлайновая платформа для проведения соревнований по машинному обучению. Здесь найдутся самые сложные бизнес-проблемы, которые теперь можно решить с помощью Data Science и ML. Соревнуйтесь с сотнями специалистов на хакатоне, созданном индустрией.
Последние соревнования — Buyer’s Time Prediction Challenge.
10. Zindi
Что это такое?
Zindi — первая платформа для проведения соревнований в области Data Science в Африке. На Zindi расположена целая научная экосистема данных, в которую входят учёные, инженеры, академики, компании, НПО, правительства и институты, сосредоточенные на решении самых насущных проблем Африки.
Для специалистов, от новичков до рок-звёзд, Zindi, — это место, где можно получить доступ к африканским наборам данных и решить проблемы Африки. Специалисты по работе с данными найдут на Zindi все необходимые инструменты, чтобы соревноваться, делиться идеями, оттачивать свои навыки, создавать свой профессиональный профиль, находить возможности карьерного роста и весело проводить время! Заметьте, что некоторые проблемы стоят только перед жителями Африки.
Последние соревнования — Uber Nairobi Ambulance Perambulation Challenge.
11. AIcrowd
Что это такое?
AIcrowd — это платформа для оптимизации рабочего процесса, связанного с искусственным интеллектом, как внутри компании, так и за её пределами путём выполнения задач, связанных с искусственным интеллектом, машинным обучением и другими задачами в области Data Science. Она помогает организациям — будь то предприятия, университеты, правительственные учреждения или НПО — разрабатывать, управлять и продвигать свои задачи. Она оптимизирует рабочий процесс машинного обучения и связывает ваши задачи со специалистами и энтузиастами в области машинного обучения и Data Science, которые совместно пытаются найти наиболее точные, эффективные и действенные решения.
Последние соревнования — Motor insurance market simulation.
12. Iron Viz 2021
Что это такое?
IronViz — крупнейший в мире конкурс по визуализации виртуальных данных — зажигает и демонстрирует мощь сообщества Tableau, позволяя вам взаимодействовать с рок-звёздами данных по всему миру. Три финалиста (определяемые по результатам отборочного турнира IronViz в начале этого года) выйдут на Чемпионат IronViz в октябре 2021 года. Победитель зарабатывает не только право на хвастовство в течение года и место среди невероятного списка прошлых чемпионов, в 2020 году на кону было $ 10,000, но и пожертвование в размере $ 5,000 в пользу некоммерческой организации по выбору чемпионов.
Когда — будет объявлено позже.
Для учащихся
Если вы студент или если вы преподаватель, поощряющий студентов изучать Data Science и AI, посмотрите на эти задачи.
- Nittany AI Challenge — предлагает командам студентов возможность побороться за награду в области Data Science, разрабатывая и представляя решения на основе искусственного интеллекта, чтобы сделать мир вокруг нас лучше с помощью четырёх столпов: образование, окружающая среда, здоровье и гуманизм.
- Data Mining Cup — вдохновляет отечественных и иностранных студентов на интеллектуальный анализ данных и предлагает им найти лучшее решение проблемы интеллектуального анализа данных, конкурируя с другими.
- Imagine Cup Junior 2021 — предоставляет учащимся в возрасте от 13 до 18 лет возможность узнать о технологиях и о том, как их можно использовать, чтобы изменить мир к лучшему. Глобальная задача сосредоточена на искусственном интеллекте (AI), знакомстве студентов с ИИ и инициативах [Microsoft AI for Good] (https://www.microsoft.com/en-us/ai/ai-for-good), чтобы они могли придумать идеи для решения социальных, культурных и экологических проблем.
Идите в ногу с последними конкурсами с помощью этих ресурсов
- mlcontest.
- eval.ai.
- aicrowd.
- Data Science.ai.
Спасибо, что прочитали! Пожалуйста, оставьте в комментариях любые другие крутые соревнования, которых нет в списке. Берегите себя и счастливых вам хаков!
- Обучение профессии Data Science
- Обучение профессии Data Analyst
Другие профессии и курсы
ПРОФЕССИИ
КУРСЫ
- Профессия Java-разработчик
- Профессия Frontend-разработчик
- Профессия Веб-разработчик
- Профессия Этичный хакер
- Профессия C++ разработчик
- Профессия Разработчик игр на Unity
- Профессия iOS-разработчик с нуля
- Профессия Android-разработчик с нуля
КУРСЫ
- Курс по Machine Learning
- Продвинутый курс «Machine Learning Pro + Deep Learning»
- Курс «Python для веб-разработки»
- Курс по JavaScript
- Курс «Математика и Machine Learning для Data Science»
- Курс по аналитике данных
- Курс по DevOps