Девять избранных статей с конференции NeurIPS 2021. Часть 2

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Мы продолжаем разбирать статьи с конференции NeurIPS 2021, крупнейшей конференции по машинному обучению. Первая часть разбора была посвящена около-рекомендательным статьям. Во второй части мы собрали работы, не объединенные общей тематикой: они просто показались нам интересными.

Из этой статьи вы узнаете:

  • Какие модели помогут оценить не только значение целевой переменной, но и вычислить доверительный интервал на него (читать).

  • Как модифицировать BERT, чтобы разделить музыкальный трек на отдельные дорожки, соответствующие разным музыкальным инструментам (читать).

  • Какая метрика позволит оценить качество сгенерированных машиной текстов (читать).

  • Как заставить робота исследовать новые стратегии поведения (читать).

Conformal Prediction using Conditional Histograms

ссылка 

Автор разбора: Коля Анохин, ведущий специалист по машинному обучению в ОК (@anokhinn)

В некоторых задачах важно уметь оценивать интервал, в котором находится целевая переменная Y для данных значений признаков X. Допустим, мы разрабатываем систему, которая анализирует резюме и предсказывает, какую зарплату стоит предложить соискателю. Рекрутеру будет удобнее, если система выдаст “зарплатную вилку”, а не точечную оценку. Если предложить меньше нижней границы, кандидат даже не станет общаться. Верхняя граница позволяет понять, до какой зарплаты можно торговаться.

Формально требуется оценить интервал C(X), такой что

P(Y \in C(X)) \geq 1 - \alpha \qquad(1)

Эту задачу можно решить, заложив предположения о распределении P(Y | X) в модель. Когда такие предположения сделать не получается, на помощь приходит метод conformal prediction.

В статье применяется вариация split conformal prediction, в которой обучение состоит из трех шагов:

  1. Делим данные на две части: обучающую и калибровочную.

  2. На обучающей выборке тренируем базовый алгоритм, который может строить какие-то интервалы для Y.

  3. Используем калибровочную выборку, чтобы научиться преобразовывать эти интервалы так, чтобы новые интервалы удовлетворяли условию (1).

В качестве бейзлайна авторы рассматривают Conformalized Quantile Regression (CQR). В этом методе базовым алгоритмом служат две квантильные регресии: они предсказывают верхнюю и нижнюю границы интервала на Y. Интервал, определенный этими границами, не гарантирует выполнение условия (1), особенно когда используются сложные модели (нейросети). Поэтому проводится дополнительная калибровка: выучивается дельта, на которую нужно расширить базовый интервал, чтобы в среднем выполнялось условие (1).

В статье предлагается новый метод Conformal Histogram Regression (CHR). Множество возможных значений Y разбивается на последовательные интервалы i1, …iN. Базовый алгоритм обучается предсказывать вероятность P(Y ∈ ij | X) для каждого интервала – таким образом на выходе получается гистограмма вероятности Y для данного X. С помощью этой гистограммы можно вычислить минимальную последовательность интервалов, такую чтобы Y попало в один из них с вероятностью не меньше

Источник: https://habr.com/ru/company/odnoklassniki/blog/656763/


Интересные статьи

Интересные статьи

Подключаем ReactВ предыдущих двух статьях я описал, как без особых усилий можно начать писать плагин для Figma. И для того, чтобы сделать простой плагин, этого знания вполне достаточно. Но вот если ин...
Друзья, это первая статья по фреймворку LeoECS из предстоящей серии, которая позволит вам быстрее понять, как работать с LeoECS в Unity и решить некоторые виды проблем, возникающих на практике. Все со...
Уважаемые друзья! Сегодня я расскажу вам об одном интересном случае, связанном со всеми любимыми зубами мудрости. Читать дальше →
Пост №4 для начинающих посвящен техническим приемам визуализации данных. Читать далее
Дисклеймер: эта статья носит исключительно образовательный характер. Мы не поддерживаем и осуждаем любые киберпреступления. Надеемся, что эта статья поможет вам лучше организовать...