Тренды в Data Scienсe 2020

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.
image

Google Trends по запросу «data science»

Краткое изложение


  • По нашим оценкам, вакансии в advanced analytics насчитывают почти 1 миллион человек во всем мире, 291 тысяча из них в США.
  • За последние два года дефицит работ в области data science значительно сократился – были наняты около 800 тысяч специалистов, однако на данный момент десятки вакансий так и остаются нетронутыми, причем подавляющее большинство из них – в США.
  • Самый большой спрос на рабочих в области advanced analytics – в области залива Сан- Франциско с самыми высокими зарплатами и самым большим количеством вакансий, за ней следуют крупные городские центры вроде Нью-Йорка, Бостона, Вашингтона и Сиэтла.
  • Средняя заработная плата по стране у data scientists остается выше $100,000 – эта тенденция просматривается почти во всех штатах, удовлетворенность работой и престиж также остаются на высоком уровне.
  • Для подготовки специалистов в advanced analytics было создано больше ста образовательных программ.

image

Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:

  • Курс по Machine Learning (12 недель)
  • Обучение профессии Data Science с нуля (12 месяцев)
  • Профессия аналитика с любым стартовым уровнем (9 месяцев)
  • Курс «Python для веб-разработки» (9 месяцев)



Вступление


Вот уже последние несколько лет data science является одним из самых ярких трендов в бизнесе. В 2012 году Harvard Business Review назвали работу data scientists «самой сексуальной работой 21-го века». Многочисленные отчеты (1, 2, 3, 4) писали, что мир сталкивается с огромным дефицитом data scientists. Создавались буткемпы и университетские программы, чтобы решить вопросы, связанные с огромным спросом на навыки в этой области.

К «advanced analytics» мы относим всех, кто сам относит себя к data scientist, специалистам по машинному обучению или ИИ-исследователю.

Спрос и предложение data scientists – май 2020


Общее число рабочих в области advanced analytics



На сегодняшний день в мире насчитывается чуть менее одного миллиона рабочих в области advanced analytics (см. раздел методологии ниже), из которых 290 тысяч или же примерно 30% приходится на Соединенные Штаты Америки. На данный момент численность data scientists значительно превосходит численность инженеров по машинному обучению и исследователей ИИ как в США, так и во всем мире, однако и инженеры, и исследователи являются новыми на рынке труда и в будущем могут значительно вырасти.

image

Сравнение общего числа продвинутых аналитиков в мире в разбивке по должности, май 2020 г.

Открытые и дефицитные вакансии


На сегодняшний день на LinkedIn открыты около 86 тысяч вакансий в сфере advanced analytics, большая часть (53.4 тысячи) приходится на США. Интересно отметить, что США представляет собой непропорционально большое число открытых вакансий (62%) по сравнению с долей рабочих в advanced analytics во всем мире (30%), хоть это и можно списать на ложную методологию сбора данных (см. раздел методологии ниже).

image

Количество открытых ролей advanced analytics по сравнению с общим числом профессиональных сотрудников advanced analytics

Мы можем использовать число открытых вакансий (по сравнению с количеством имеющихся сотрудников) в качестве приблизительного показателя, чтобы понять сколько всего работников недостает. Из приведенного ниже графика видно, что открытых вакансий по всему миру на 9% больше, чем непосредственно сотрудников, в то время как в США это число достигает примерно 18.7%.


Сокращение дефицита


Сегодня в США насчитывают примерно 53 тысячи свободных рабочих мест в области advanced analytics. Однако, в августе 2018 года LinkedIn опубликовал отчет – на тот момент дефицит составлял около 151 тысячи рабочих мест. За последние два года дефицит значительно сократился – по всему миру была нанята примерно 831 тысяча профессионалов в области advanced analytics (см. ниже).

image

Apteo оценивает общее количество продвинутых аналитиков с течением времени

image

Дефицит продвинутых аналитиков в 2018 году по сравнению с 2020 годом

Распределение открытых вакансий и недостаток рабочих по городам США


Общее число специалистов и вакансий


Никого не удивит, что наибольшая часть работников в advanced analytics находятся в районе залива Сан-Франциско – примерно 45.7 тысяч человек, как и наибольшее количество открытых вакансий – около 8 тысяч. На втором месте идет Нью-Йоркская агломерация – около 38.8 тысяч сотрудников и 5.9 тысяч вакансий. На третьем месте район Большого Бостона – 15.9 тысяч сотрудников и 3.3 тысячи вакансий.

Самая высокая доля на душу населения


На первом месте район залива Сан-Франциско – 5.9 тысячи человек на миллион. На втором месте идет Сиэтл – 4.3 тысячи на миллион, завершает Бостон – 3.2 тысячи на миллион.

Наибольшая нехватка рабочей силы


Наибольший процент (39.2%) открытых вакансий – в городе Вашингтон.

image

Расширенная аналитика сотрудников и вакансий по городам

image

Заработная плата и удовлетворенность работой в США



Заработная плата в этой сфере варьируется по всей Америке. Основываясь на данных из различных источников, мы подсчитали, что средняя зарплата специалистов достигает примерно $114,000 в год, что соответствует примерно $14,000 в районе залива Сан-Франциско.

В 2020 году работа в data science заняла третье место по Америке по версии Glassdoor (сразу после Front End Engineer и Java Developer). С 2016 по 2019 года data scientists занимали первое место.

image

Образовательные программы и требуемые навыки


Для удовлетворения потребностей в бизнесе появилось множество новых образовательных программ. На данный момент существует как минимум 79 буткемпов, 62 программы бакалавриата и 111 магистерских программ, ориентированных на data science. Ниже мы перечислим наиболее упоминаемые программные средства и навыки для специалистов в области advanced analytics

Top Tools


  • Python
  • SQL
  • R
  • Spark
  • Cloud
  • AWS
  • Java
  • Tensorflow


Top Skills


  • Machine Learning / Regression
  • Statistics
  • Research
  • Prediction
  • Visualization
  • Recommendation
  • Optimization
  • Deep Learning
  • Natural Language Processing


image

Образовательные программы

Вывод


Очевидно, что data science продолжает быть крайне востребованной и на сегодняшний день. В то время как мир, судя по всему, быстро удовлетворяет этот спрос, по-прежнему существует острая нехватка рабочих в области advanced analytics. Интересно то, что возникают и новые должности типа инженера по машинному обучению (machine learning engineer) или ИИ-исследователя (A.I. researcher), и вполне вероятно, что для них потребуются дополнительные сотрудники, поскольку все больше компаний работают над внутренним продвижением data science.

Рост количества должностей отражает растущее желание организаций и компаний использовать данные для более компетентных решений. Хоть организации и нанимают все больше людей, крайне маловероятно, что все, кроме самых престижных компаний, смогут нанять достаточное количество сотрудников для удовлетворения своих бизнес потребностей.

Методология


Расчет занятости и дефицита


Для идентификации data scientists и открытых вакансий в data science, мы провели поиск по ключевым словам на LinkedIn по трем наиболее распространенным названиям вакансий, которые мы ассоциируем с математической, инженерной и аналитической работой, в которой, по нашему мнению, и заключается работа data scientist при помощи премиум аккаунта генерального директора и соучредителя Apteo Шанифа Дханани. Названия вакансий следующие – «data scientist», «инженер по машинному обучению» и «исследователь искусственного интеллекта».

«Data scientist» и «инженер по машинному обучению» также могут быть связаны с такими ключевыми словами как «data science» и «инженер МО», поэтому для предотвращения двойного подсчета мы использовали бинарный поиск – искали ровно один термин за раз, исключая все остальные термины. Например, мы соединили результаты из следующих двух запросов для поиска «data scientists»:

“data science” -”data scientist” -”machine learning engineer” -”ml engineer” -”ai researcher” and “data scientist” -”data science” -”machine learning engineer” -”ml engineer” -”ai researcher”

Поскольку LinkedIn отображает результаты только из своей расширенной сети, вполне вероятно, что результаты могут быть чуть более занижены по сравнению с реальными цифрами, однако мы считаем, что и эти цифры дают приблизительную оценку расчетных значений, которая может быть полезна при анализе рынка труда в области data science.

Источники информации:

  • Данные поиска работ на LinkedIn, полученные 1-го мая 2020 года.
  • Google (численность населения)



Расчет заработной платы


Единого правдивого источника для расчета заработной платы просто не существует. Правительство США, рекрутинговые компании и независимые отчеты публикуют разные значения о заработной плате advanced analytics. Для наших отчетов мы собрали как можно больше независимых значений как на государственном, так и на национальном уровне и использовали среднее значение.

Источники информации:

  • www.indeed.com/career/data-scientist/salaries
  • www.bls.gov/oes/current/oes_nat.htm
  • www.glassdoor.com/List/Best-Jobs-in-America-2019-LST_KQ0,25.htm
  • engineering.indeedblog.com/blog/2018/12/theres-no-such-thing-as-a-data-scientist
  • www.informationweek.com/top-paying-us-cities-for-data-scientists-and-data-analysts/d/d-id/1336248
  • www.forbes.com/sites/louiscolumbus/2018/01/29/data-scientist-is-the-best-job-in-america-according-glassdoors-2018-rankings/#18be35165535
  • blog.rjmetrics.com/2015/10/05/how-many-data-scientists-are-there
  • www.linkedin.com/salary/search?keywords=data%20scientist%3Ftrk
  • learning.linkedin.com/blog/tech-tips/why-it-s-really-good-to-be-a-data-scientist-right-now
  • datascience.berkeley.edu/blog/data-scientist-salary
  • www.dezyre.com/article/data-scientist-salary-report-of-100-top-tech-companies-/218
  • nycdatascience.com/blog/student-works/how-much-do-data-scientists-make-8
  • www.govtech.com/data/GT-OctoberNovember-2017-States-Compete-for-Top-Data-Science-Talent.html
  • www.predictiveanalyticsworld.com/machinelearningtimes/data-scientist-best-job-america/8465
  • www.ziprecruiter.com/Salaries/Highest-Paying-Data-Scientist-Salary-by-City
  • www.indeed.com/career/data-scientist/salaries
  • www.builtinnyc.com/salaries/data-analytics/data-scientist/new-york
  • blog.galvanize.com/top-10-data-science-salary-locations-2020
  • datascience.berkeley.edu/blog/data-scientist-salary



Рост занятости


Как и в случае с расчетом заработной платы, за последние годы имеется крайне мало информации о количестве сотрудников в advanced analytics. Используя множество различных источников, мы вычислили наилучшую оценку количества работников за каждый год. В некоторых случаях мы использовали внешние данные в качестве наших, в других – мы делали вывод на основе кривой с использованием имеющихся у нас данных.

Источники информации:

  • www.economicmodeling.com/2018/04/30/four-things-you-should-know-data-scientists
  • www.kdnuggets.com/2018/09/how-many-data-scientists-are-there.html
  • askwonder.com/research/data-scientists-u-s-globally-employers-actual-names-and-categories-largest-data-zwejqia2b
  • www.stitchdata.com/resources/the-state-of-data-science
  • www.forbes.com/sites/louiscolumbus/2017/12/11/linkedins-fastest-growing-jobs-today-are-in-data-science-machine-learning/#c94067d51bd9
  • dmaiph.com/2018/09/23/how-many-data-scientists-are-there-and-is-there-a-shortage
  • insidebigdata.com/2018/08/19/infographic-data-scientist-shortage
  • news.linkedin.com/2018/8/linkedin-workforce-report-august-2018



Образовательные программы и требуемые навыки



Следует снова проговорить, что было сложно оценить образовательные программы. В каждом университете свое название для программы по data science, поэтому нам приходилось субъективно определять, какие программы включать в список, а какие исключать из него. Мы попытались отобрать те программы, основанные на математической строгости, вычислительной работе и аналитике. Мы исследовали различные отчеты и агрегаторы для сбора данных по университетским программам, а также различные буткемпы для определения суммарных показателей для 2020-го года.

Источники информации:

  • careerkarma.com/rankings/best-data-science-bootcamps
  • www.discoverdatascience.org/programs/bachelors-in-data-science
  • www.datasciencegraduateprograms.com/school-listing/#context/api/listings/prefilter
  • www.collegekickstart.com/blog/item/undergraduate-schools-with-strong-data-science-programs
  • techcrunch.com/2015/12/31/how-to-stem-the-global-shortage-of-data-scientists

Читать еще


  • Крутые Data Scientist не тратят время на статистику
  • Как стать Data Scientist без онлайн-курсов
  • Шпаргалка по сортировке для Data Science
  • Data Science для гуманитариев: что такое «data»
  • Data Scienсe на стероидах: знакомство с Decision Intelligence
Источник: https://habr.com/ru/company/skillfactory/blog/508450/


Интересные статьи

Интересные статьи

На днях состоялся запуск Creative Commons Legal Database — одного из долгожданных проектов от Creative Commons, нацеленного на сбор и систематизацию информации, связанной с лицензиями Cre...
Вячеслав Ермолин, 3 августа 2020 г. Текущая статистика запусков 2020 год Миссия: Rideshare SSMS PoC — групповой запуск микро- и наноспутников на солнечно-синхронную орбиту. З...
Всем привет! Продолжаем обзоры новостей свободного и открытого ПО и немного железа. Всё самое главное про пингвинов и не только, в России и мире. Два анонса ноутбуков специальн...
Предлагаем вашему вниманию подборку с ссылками на новые материалы из области фронтенда и около него. Читать дальше →
Довольно часто владельцы сайтов просят поставить на свои проекты индикаторы курсов валют и их динамику. Можно воспользоваться готовыми информерами, но они не всегда позволяют должным образом настроить...