Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
В чёрную пятницу, пока у нас стартует флагманский курс Data Science, делимся интерактивными графами подписок веб-разработчиков и разработчиков моделей ML, а также знакомим читателей с инструментом визуализации больших графов — PyGraphistry.
Такие данные — косвенный индикатор конкуренции языков и технологий. К примеру, можно попробовать выяснить, сколько разработчиков C++ следят за разработчиками Rust и наоборот. За подробностями и кодом приглашаем под кат.
Интерактивный граф вы найдёте здесь.
Загрузка набора данных
Мы проанализируем GitHub при помощи набора данных в Kaggle. Узлы — это разработчики, которые поставили звезду не менее чем 10 репозиториям. Если человек является разработчиком машинного обучения, то ml_target=1
, иначе ml_target=0
.
import pandas as pd
# Download the data at https://www.kaggle.com/femikj/github-social-network
nodes = pd.read_csv("github-social-network/github_target_1.csv")
# Change datatypes
nodes.id = nodes.id.astype(str)
nodes.ml_target = nodes.ml_target.astype(str)
nodes.head(10)
Рёбра (edges) — это наблюдения двух разработчиков друг за другом.
edges = pd.read_csv("github-social-network/github_edges_1.csv")
# Change datatypes
edges = edges.astype(str)
edges.head(10)
Cвязи ML и веб-разработчиков
Доля ML-разработчиков и веб-разработчиков
Начнём с определения процентного соотношения веб-разработчиков —