Прогнозирование качества шампанского с помощью Mashine Learning. Опыт Bollinger

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!

Привет! Предлагаем немного отвлечься от сложных актуальных тем и поговорить о... шампанском. Точнее, о том, как его совершенствуют с помощью Mashine Learning.

Французский производитель шампанских вин Bollinger использует модель машинного обучения, чтобы предсказать годы хорошего урожая и противостоять проблемам изменения климата.

Анализ запасов винтажных вин и условий, при которых они получились, помогает Bollinger создавать новую продукцию такого же качества.
Анализ запасов винтажных вин и условий, при которых они получились, помогает Bollinger создавать новую продукцию такого же качества.

В начале 2021 года Виноделы Bollinger смогли впервые попробовать La Grande Année 2014, престижное шипучее вино, которое выдерживалось в погребах с момента его купажирования. La Grande Année производится только в те годы, когда общее качество сырья считается достаточно высоким, а перед выпуском в продажу напиток выдерживается под пробкой в течение семи лет. 

В преддверии открытия урожая 2014 года сомелье и ценители сомневались, действительно ли он будет обильным. В тот год погода была переменчивой: рекордная жара в июне, за которой последовали холодные и влажные месяцы, замедлившие созревание винограда. Более того, для шампанского дома Bollinger характерна продукция пино нуар, а в 2014 явно отдавалось предпочтение шардоне. 

Дениса Баннера, заместителя главного винодела (и фактически шеф-повара) Bollinger, эти вопросы не волновали. Он знал ответ ещё до того, как открыли первую бутылку. Потратив два года на изучение огромного количества данных, касающихся терруара, виноградников, климата и качества вина в течение сезонного цикла, он был убеждён, что 2014 год станет удачным. 

Денис Баннер
Денис Баннер

В Шампани шеф-повара несут ответственность за создание сложных купажей, которые переходят в готовое вино, а ещё наблюдают за всем циклом производства вина, от первого ростка на виноградниках до сбора урожая, отжима, ферментации и так далее. Они хранители качества и мозги творческого процесса.

Единственные параметры, которые действительно учитываются ценителями винтажного шампанского — это аромат и вкус. По вкусовым показателям La Grande Année 2014, выпущенный на рынок по цене 659 долларов США за ящик, оказался хитом: свежий, элегантный, минеральный темперированный отход от полнотелой нормы с большим потенциалом дальнейшего старения. Один из винных критиков с сайта Vinous.com поставил ему редкую оценку 98/100, назвав «одним из лучших свежих вин, которые я когда-либо пробовал».

Но это всё было после дегустаций. А уверенность Баннера базировалась на анализе данных. Он решил отойти от традиции рассматривать созревание вина как нечто таинственное и алхимическое, и заняться наукой. Ему захотелось понять возможные последствия изменения климата для выращивания винограда и сохранения качества вина. 

Банком данных, позволившим сделать это, стала винная библиотека Bollinger, уникальная коллекция, собранная из запасов, годами лежавших в дальних уголках подвалов винных домов. Десять лет назад начался проект по сбору, дегустации, оценке и восстановлению сотен покрытых пылью бутылок, которые сейчас составляют этот жидкий датасет. 

62 000 бутылок La Grande Année 2014
62 000 бутылок La Grande Année 2014

Как развивался проект

Производителям нужно было знать больше о свои винах, чтобы анализировать собранную информацию, строить прогнозы урожая и влиять на качество сырья. Разговоры об изменении климата и его последствиях натолкнули Дениса Баннера на мысль изучить некоторые жаркие годы в прошлом и проанализировать урожай тех лет, чтобы понять, что произойдёт в будущем.

Сотрудничество с дата-сайентистами и математиками помогло руководителю Bollinger построить модель, объединяющую:

  • Исторические метеорологические данные;

  • Информацию о почве и состоянии растений для каждого сорта винограда;

  • Информацию о сроках основных сезонных событий, таких как распускание бутонов, цветение, созревание и сбор урожая;

  • Результаты лабораторных анализов (на уровень сахара и кислотность) виноградного сусла и самого вина.

Работе помогало наличие собственного жидкого архива, точных метеорологических данных с местных метеостанций, а также доступ к данным от Межпрофессионального комитета вин Шампани (CIVC).

Все собранные данные, размеченные по сорока с лишним параметрам, можно было сопоставить с оценкой того, что вышло в итоге. То есть теоретические выкладки о том, каким должно получиться шампанское, сравнивали с тем, что действительно получилось. Этому помогли дегустационные заметки Дениса Баннера о шампанском за последнее столетие из Винной библиотеки, фактически окончательное суждение о качестве каждого урожая.

Виноделы наблюдали за эволюцией лоз и сезоном созревания, сегментируя каждый этап, чтобы найти корреляцию между процессом выращивания и конечным качеством сырья и купажа. Они рассчитали, каким должен быть идеальный сценарий, и чем опасен отход от этих условий. Все данные заводились в компьютер, чтобы обучить ИИ прогнозировать качество урожая.

В итоге получилась модель, способная предсказать "силу" сезона, даже когда он только начинается. За счёт этого у виноделов появилась метрика, которую можно использовать в планировании. И она очень хорошо дополняет медленную, интуитивную оценку купажа в течение нескольких месяцев дегустаций.

Да-да, несколько месяцев. В обычных условиях после первой ферментации необходимо дегустировать около 4000 бочек, прежде чем появится чёткое представление о качестве винтажа. Да, кое-какие мысли у виноделов могут появиться во время сбора урожая, но окончательный вердикт возможен только после дегустации.

ИИ-модель Bollinger пока что не может заменить традиционный, глубокий процесс дегустации. Зато способна упростить принятие ключевых решений виноделами: объявить ли год урожая; стоит ли делать ограниченную серию; какие купажи будут; и, что особенно важно, насколько хорошо стареет винтаж.

В качестве доказательства эффективности своей математической модели руководитель Bollinger приводил лето 2021 года. Виноделы восприняли его, как катастрофу, а он утверждал, что плохая погода не сильно скажется на качестве вин. Опытная дегустация подтвердила, что все вина получились выше среднего уровня.

От теории к практике

Оценить результат — это одно. Следующим важным шагом является применение накопленных знаний и теоретических выкладок к управлению самими виноградниками и борьбе с изменением климата — той самой проблемой, которая побудила Баннера заняться наукой и машинным обучением.  

Более высокие температуры приводят к более раннему сбору урожая: в период с 2015 по 2020 год урожай собирали в августе, а не в сентябре, чего не было в предыдущие 100 лет. В среднем вегетационный период сократился на 18 дней, что означает более короткий период созревания, а также более концентрированные, полнотелые фрукты и более низкую кислотность, одну из важнейших характеристик шампанского. Другими словами, потенциальное долгосрочное изменение профиля самого шампанского.

Архивы Bollinger — это не только бутылки в погребах, но и детальные записи условий выращивания
Архивы Bollinger — это не только бутылки в погребах, но и детальные записи условий выращивания

У крупных виноделов вроде Bollinger нет недостатка в инструментах, с помощью которых они могут адаптироваться под текущую ситуацию: можно снизить «дозировку» сахара, добавляемого в каждую бутылку после дегоржажа; менять сорта винограда и подвоя; даже время дня, когда собирают виноград. Смысл модели данных в том, чтобы точно определить события, которые наиболее явно влияют на качество, чтобы сделать наилучшую адаптацию. Так, датасет помог определить два элемента, которым ранее придавали мало значения. 

Во-первых, оказалось, что ночная температура гораздо важнее, чем думали виноделы. Если ночью температура превышает 13 или 14 градусов по Цельсию, вторичный метаболизм лозы неэффективен, и корреляция с качеством становится заметно отрицательной», — говорит Баннер. Обилие прохладных ночей в 2014 году (несмотря на обжигающе жаркий июнь) было одним из факторов, указывающих на более сильный год.

Во-вторых, проблема водного стресса — последствия недостатка либо переизбытка воды за короткий период более серьёзны, чем предполагалось. И этот параметр будет увеличивать своё значение по мере того, как погодные условия становятся более непредсказуемыми. 

Точно так же модель показала, что засушливые зимы, которые лишают почву достаточного количества воды в самом начале цикла, ещё до того, как на лозах распустятся бутоны (начало вегетационного периода), могут оказать явное влияние на качество в дальнейшем.

Лучшие условия для виноградников — это небольшой дождь каждый месяц, но не слишком сильный. Но в 2020 году, например, дождя не было два с половиной месяца. Если вы бежите марафон, и температура внезапно подскочила, вам нужно пить. Иначе у вас будет сильный стресс. Модель Bollinger показывает, что то же самое происходит и с виноградными лозами. Значит, можно внести изменения в уход за виноградниками, чтобы нивелировать вредное влияние климатических и иных параметров.

Источник: https://habr.com/ru/company/cloud4y/blog/694666/


Интересные статьи

Интересные статьи

Objection.js — сравнительно молодая и минималистичная ORM-библиотека для Node.js, которая сильно упрощает взаимодействие с базами данных и не перегружена дополнительными функциями, как Sequelize или T...
Сегодня я хочу рассказать про один не очень популярный но очень классный паттерн в написании React приложений - Compound components.Что это вообще такоеCompound components это подход, в котором вы объ...
В этой статье я расскажу про готовое решение для поддержки консистентности данных между растущей микросервисной и унаследованной архитектурой. Под катом код для репликации двух баз данных...
На момент написания этой статьи в компании Cardsmobile, которая разрабатывает мобильное приложение «Кошелёк», работает 195 человек: 8 аналитиков и 187 потенциальных заказчиков аналитиков....
Привет, хабражители. Меня зовут Владимир, и я работаю руководителем отдела информатизации образования в одном из московских государственных колледжей. На текущий момент у нас трудится...