Красивые визуализации GitHub с помощью PyGraphistry

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!

В чёрную пятницу, пока у нас стартует флагманский курс Data Science, делимся интерактивными графами подписок веб-разработчиков и разработчиков моделей ML, а также знакомим читателей с инструментом визуализации больших графов — PyGraphistry.

Такие данные — косвенный индикатор конкуренции языков и технологий. К примеру, можно попробовать выяснить, сколько разработчиков C++ следят за разработчиками Rust и наоборот. За подробностями и кодом приглашаем под кат.


Интерактивный граф вы найдёте здесь.

Загрузка набора данных

Мы проанализируем GitHub при помощи набора данных в Kaggle. Узлы — это разработчики, которые поставили звезду не менее чем 10 репозиториям. Если человек является разработчиком машинного обучения, то ml_target=1, иначе ml_target=0.

import pandas as pd

# Download the data at https://www.kaggle.com/femikj/github-social-network
nodes = pd.read_csv("github-social-network/github_target_1.csv")

# Change datatypes
nodes.id = nodes.id.astype(str)
nodes.ml_target = nodes.ml_target.astype(str)

nodes.head(10)

Рёбра (edges) — это наблюдения двух разработчиков друг за другом.

edges = pd.read_csv("github-social-network/github_edges_1.csv")

# Change datatypes
edges = edges.astype(str)

edges.head(10)

Cвязи ML и веб-разработчиков

Доля ML-разработчиков и веб-разработчиков

Начнём с определения процентного соотношения веб-разработчиков —

Источник: https://habr.com/ru/company/skillfactory/blog/591815/


Интересные статьи

Интересные статьи

В этой статье мы изложим новую, пока ещё фантастическую, идею о том как с помощью информационных технологий можно победить рак. Быть может, полностью. Мир без рака возможен. В некой перспективе, бли...
Автор — Игорь Косенков, инженер postgres Professional Привет всем! Сегодня речь пойдет о кластере. Да, снова об отказоустойчивом кластере на базе Corosync/Pacemaker. Только настраивать...
В блоге компании PVS-Studio можно найти далеко не одну статью с результатами проверок исходного кода различных компиляторов. С другой стороны, немного обделённым внимание...
Мониторинг сложных распределенных систем может стать настоящей головной болью как с точки зрения первичной настройки метрик и поддержания их актуальности, так и с точки зрения производите...
Паттерн HOC (Higher Order Component) очень популярен у React-разработчиков. А вот Vue-разработчики его как-то обходят стороной. Очень зря. Попробуем разобраться в этом. Читать дальше &ra...