Галерея лучших блокнотов по ML и Data Science

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.
Привет, читатель.

Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

image

Итак, приступим.

Вводные курсы в Jupyter Notebook


  • Учебник по Python
  • Подборка блокнотов по командам IPython
  • Пособие по Matplotlib

Статистика, машинное обучение и наука о данных


  • Блокнот по введению в количественную оценку неопределенности и анализ чувствительности
  • Сопроводительные материалы книги Джейка Вандерпласа Python Data Science Handbook
  • Введение в статистику с Python
  • Блокноты по упражнениям онлайн-курса Эндрю Ына по ML, Spark и TensorFlow
  • Методы Монте Карло, стохастическая оптимизация
  • Введение в байесовский вывод
  • Байесовский анализ данных
  • Самоучитель по Data Science
  • Поваренная книга IPython
  • Введение в машинное обучение с Python и scikit-learn
  • Растущая подборка блокнотов по курсу машинного обучения Университета Турина
  • Кластеризация и регрессия
  • Нейронные сети
  • Введение в Pandas
  • Data Science и Big Data с Python
  • У проекта Statsmodels есть две подборки блокнотов: в официальной документации и в вики
  • Python для анализа данных
  • Статистика и анализ данных для психологов
  • Решение задания курса по анализу данных CS 109
  • Книга «Введение в статистическое обучение с приложениями на языке R» имеет две подборкиблокнотов с примерами на Python
  • Блокноты упражнений по курсу StatLearning
  • Прикладное предсказательное моделирование с помощью Python
  • Большая подборка по четырем курсам, посвященным Data Science, алгоритмам и базам данных Университета Колумбии
  • SciPy и OpenCV как интерактивная вычислительная среда для компьютерного зрения
  • Фильтры Калмана и Байеса на Python
  • Adaboost для задачи классификации цифр
  • Подборка по практическому использованию машинного обучения и анализа данных
  • Глубокое обучение с Apache SINGA
  • Подборка блокнотов по ML и Data Science
  • ETL с Python, работа с MySQL и csv файлами

Анализ данных со стеком SciPy


  • Введение в машинное обучение с sklearn
  • Интерактивный фитинг кривых с пакетом lmfit
  • Введение в машинное обучение с Python и scikit-learn
  • Распознавание лиц (датасет Wild)
  • Введение в байесовские методы многоуровневого моделирования
  • Введение в байесовские сети
  • Байесовский анализ данных с помощью PyMC3
  • Набор примеров для решения шаблонных задач классификаций
  • Вероятность, парадокс и принцип разумности
  • Определение вероятности отзыва 5 звезд
  • Модель геодемографической сегментации

Визуализация данных и построение графиков в Jupyter Notebook


image

  • Общие проблемы при визуализации больших наборов данных и как их избежать
  • Визуализация данных переписи США с использованием datashader
  • Интеграция данных и визуализации c помощью веб-ресурсов
  • 21 интерактивный график
  • Визуализация комплекснозначных функций с Matplotlib и Mayavi
  • Пример использования библиотеки bqplot
  • D3 Viewer для визуализации Matplotlib
  • Bokeh – интерактивная библиотека для веб-визуализации c Python
  • Визуализация с помощью HoloViews
  • Победитель конкурса E. Tufte Slope Graphs
  • matta – d3.js-визуализация в IPython Notebook
  • Отображение Pandas в интерактивной карте распределения значений

Обработка естественного языка


  • Программирование на Python для гуманитариев
  • Мультиноминальный наивный байесовский классификатор новостей
  • Использование рандомной кросс-валидации для категоризации новостей

Pandas для анализа данных в Jupyter Notebook


image

  • 10-минутный тур по Pandas
  • Анализ временных последовательностей с Pandas
  • Анализ финансовых данных с Pandas
  • Кластеризация данных с датчиков смартфона для анализа данных о физической активности с pandas и scipy
  • Анализ и визуализация вспышек на Солнце
  • Продвинутый анализ логов Apache
  • Статистический анализ данных в Python
  • Глубокое погружение в Pandas от .head() до .tail()

Если у вас есть, чем вы можете поделиться — пишите в комментариях. Больше информации о машинном обучении и Data Science в телеграм-канале Нейрон (@neurondata).

Всем знаний!
Источник: https://habr.com/ru/post/460321/


Интересные статьи

Интересные статьи

В этой статье вы узнаете, как МТС решает задачи по хранению и обработке больших данных. Как архитектура платформы Big Data совместно с инфраструктурой помогает их решать более эффективно....
Привет, Хабр! Давно я не писал никаких статей и, вот думаю, пришло время написать о там, как мне пригодились знания по data science, полученные по ходу обучения небезывестной специализ...
Эти устройства стояли на страже во время Холодной войны, способствовали прогрессу в физике частиц, лечили больных раком, и улучшали звук записей Beatles Кому вообще могут быть интере...
Однажды я получил оффер от Deliveroo, в этой компании я должен был стать Data Science Manager. Пока я готовился к тому, чтобы приступить к выполнению своих обязанностей, оффер отозвали....
Предлагаю ознакомиться с рашифровкой доклада Андрей Сальников из Data Egret "Инструменты создания бэкапов PostgreSQL" . В конце обновленная сводная таблица по инстрментам Данный доклад...