Заклинания для Героев машинного обучения

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!

Привет, Хабр!

Иногда хочется обсудить что-то по-настоящему серьезное. Пора закрыть jupyter, остановить gpu и поговорить о магии.

В мире машинного обучения алгоритмы и методы обработки данных могут сравниться с магическими заклинаниями.

Только прожженные циники из дата сайентистов пренебрегают фазами луны при тюнинге гиперпараметров. Оставим эти потерянные души, для настоящих профи я подготовил несколько заклинаний, такого не найдешь на курсиках.

Stone Skin

Регуляризация
Регуляризация

Регуляризация. Каменная кожа ограничит веса модели и защитит ее от переобучения. Очень желательно иметь это заклинание в своей книжке. Этот вид колдунства доступен даже не для самых продвинутых магов.

Magic Arrow

Линейная регрессия
Линейная регрессия

Линейная регрессия. Базовый метод предсказания, простой, и, конечно же, не самый сильный. Помогает с простыми задачами прогнозирования, где зависимость между переменными линейна и легко интерпретируема. Со стрелкой уже можно ходить по собесам, главное правильно рассчитать свои силы.

Blind

Dropout
Dropout

Dropout. Отключение случайных нейронов во время обучения. Тоже спасает от переобучения. Иногда магам задают каверзный вопрос: когда следует использовать dropout - на обучении или на инференсе. Не стоит вступать в дискуссии с профанами.

Bloodlust

Активационные функции
Активационные функции

Функции активации. Заклинания, которые определяют "ярость" нейронов и контролируют их активацию. Сетка может не взлететь если вы напортачили с функциями. Хотя бы изредка наведываетесь в Университет Магии. Нет ничего практичней хорошей теории.

Dispel

Очистка данных
Очистка данных

Очистка данных. Снимает чары шума и аномалий в данных. Вероятность фатальных последствий близка к единице, если своевременно не добавить его в книгу заклинаний. Иногда маг преисполняется собственной важностью и жалеет ману на очистку датки. Расплата за гордыню будет жестокой.

Precision

Метрики качества
Метрики качества

Метрики качества. Даст оценку вашей работе. Перед тем, как что-то моделировать, лучше сразу прикинуть, какую метрику кастануть. Применять надо с умом, если c умом проблемы - используйте f1.

Clone

Аугментация данных
Аугментация данных

Аугментация данных. Создание новых примеров данных на основе существующих. Когда данные полны мусора и скверны, вы только умножите скорбь в этом мире.

Meteor Shower

Случайный лес
Случайный лес

Случайный лес. Несколько "метеоритов" (деревьев решений) работают вместе для создания сильного классификатора. Работает надежно. Если не хочется заморачиваться - просто жахни рэндом форестом.

Chain Lightning

Градиентный бустинг
Градиентный бустинг

Градиентный бустинг. Начинает с первой базовой модели и ~~выигрывает~~ последовательно усиливается. Очень мощное заклинание в опытных руках. Требует продвинутой мудрости и хороший запас маны. Результат вас порадует.

Resurrection

Fine-tuning
Fine-tuning

Fine-tuning. Использование накопленных знаний для обучения на новой, связанной задаче. Если вы владеете тайнами файн-тюнинга, то практически неуязвимы. На собес можно вообще не приходить, просто скажите эйчар(у/ке), что вы шатаете берт. Требует маны и ресурсов гпу.

Armageddon

GPT-4
GPT-4

GPT-4. Просто заплатите 20$

Теперь вы почти готовы к битвам. Осталось подписаться на мой канал https://t.me/nlp_daily - где я пишу про магию NLP.

Спасибо за внимание!

Источник: https://habr.com/ru/post/726432/


Интересные статьи

Интересные статьи

Субботний вечер омрачен скандалом - сайт не работает, провайдер негодяй, админы - не специалисты, а сервера - решето. Вызов принят, или почему при всей нелюбви к 1С-Битри...
В конце есть краткое содержание. Герои – это такие сотрудники. Вы их наверняка видели. Возможно, и вы – герой. Уникальные. Сверхпродуктивные. Влюбленные в своё дело. Не просто с...
Регионы России — это не просто границы на карте. В каждом регионе есть свои культурные традиции, во многих — свои языки. Машинный перевод мог бы помочь сохранять и применять эти языки — в частнос...
Изначально хотел ограничиться темой хитовых статей, но чем дальше в лес, тем толще партизаны. В итоге мы прошлись по вопросам поиска тем, работой над текстами, развитием писательских скилов, отно...
Несколько месяцев назад я столкнулся с проблемой, моя модель построенная на алгоритмах машинного обучения просто на просто не работала. Я долго думал над тем, как решить эту проблему и в како...