Как Hasty использует автоматизацию и быструю обратную связь для обучения моделей ИИ

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

CEO Hasty Тристан Руиллар (в центре), сооснователи компании Константин Проскудин (слева) и Александр Веннман (справа)

Компьютерное зрение становится всё важнее для различных промышленных сфер, от слежения за строительными работами до реализации умного сканирования штрих-кодов на складах. Однако обучение искусственного интеллекта точному распознаванию изображений может быть медленным и затратным трудом, не гарантирующим результаты. Молодой немецкий стартап Hasty стремится помочь в решении этой задачи, обещая предоставить инструменты нового поколения, способные ускорить весь процесс аннотирования изображений для обучаемой модели.

Основанный в 2019 году в Берлине Hasty заявляет сегодня, что ему удалось получить 3,7 миллиона долларов в первом раунде финансирования, проведённом Shasta Ventures. Эта венчурная фирма из Кремниевой долины провела уже множество значимых выводов: Nest (куплен Google), Eero (куплен Amazon) и Zuora (IPO). Другими участниками раунда стали iRobot Ventures и Coparion.

Всемирный рынок компьютерного зрения достиг в 2020 году уровня в 11,4 миллиарда долларов. Согласно прогнозам, это число вырастет к 2027 году до более чем 19 миллиардов. Подготовка и обработка данных — одна из самых затратных по времени задач в сфере ИИ, она занимает в связанных с ним проектах примерно 80% времени. В области компьютерного зрения под аннотированием, или разметкой, подразумевается техника, используемая для маркировки и категоризации изображений с целью предоставления машинам значения и контекста изображения, что позволяет им находить схожие объекты. Основную часть работы по аннотированию приходится выполнять людям.

Hasty стремится решить следующую проблему: подавляющее большинство проектов data science никогда не выходит в продакшен, а в процессе их подготовки тратятся значительные ресурсы.

«Современные подходы к разметке данных слишком медленны», — сообщил нам сооснователь и CEO Hasty Тристан Руиллар. «Инженеры машинного обучения часто вынуждены ждать первых результатов по три-шесть месяцев, чтобы проверить работоспособность их стратегии и методики аннотирования. Причиной этого является задержка между разметкой и обучением моделей».

Ускоряемся


Hasty имеет 10 встроенных автоматизированных ИИ-помощников, каждый из которых предназначен для снижения объёмов работы человека. Dextr, например, позволяет пользователям нажать всего на четыре крайних точки объекта, чтобы выделить его и предложить аннотации.


ИИ-помощник Dextr из Hasty

А ИИ-помощник Hasty «instance segmentation» ускоряет аннотирование, находя несколько экземпляров объекта на изображении.


Сегментация экземпляров объектов при помощи ИИ Hasty

Помощник наблюдает за тем, как выполняют аннотирование пользователи, и достигнув определённого показателя достоверности, может предлагать метки. А пользователь может корректировать эти предложения, чтобы улучшать модель, получая обратную связь об уровне эффективности стратегии аннотирования.

«Это даёт нейросети кривую обучения — в процессе разметки проекта людьми она учится», — рассказывает Руиллар.

Уже существует множество инструментов, предназначенных для упрощения этого процесса, в том числе Amazon SageMaker, поддерживаемый Google Labelbox, V7 и Dataloop, объявивший о новом раунде финансирования на 11 миллионов долларов.

Однако Hasty заявляет, что благодаря сочетанию автоматизации, обучения моделей и аннотирования может сделать весь процесс гораздо быстрее.

Как и другие похожие платформы, Hasty использует интерфейс, через который могут взаимодействовать люди и машины. Hasty может создавать рекомендации аннотаций, изучив всего несколько аннотированных людьми изображений, а пользователь (например, инженер по машинному обучению) при этом способен принимать, отклонять или редактировать это рекомендации. Такая обратная связь в реальном времени позволяет делать модели тем совершеннее, чем чаще они используются. Такую систему называют «маховиком данных» (data flywheel).

«Все стремятся создать самосовершенствующийся маховик данных. Проблема ИИ компьютерного зрения заключается в том, как вообще раскрутить этот маховик, поскольку он очень затратен и срабатывает лишь в 50% случаев. И на этом этапе в дело вступаем мы», — делится Руиллар.

Быстрая обратная связь


По сути, нейросети Hasty обучаются в процессе построения инженерами наборов данных, то есть этапы «сборка», «развёртывание» и «оценка» происходят приблизительно параллельно. При обычном линейном процессе для создания ИИ-модели, которую можно протестировать, могут потребоваться месяцы. При этом модель может оказаться некорректной из-за ошибок в данных или слепых допущений, сделанных в начале проекта. Hasty обещает обеспечить гибкость процесса.

Такой подход не совсем нов, однако Руиллар заявляет, что его компания проводит аналогию между автоматизированной разметкой и беспилотным вождением: сходство заключается в том, что разные технологии работают на различных уровнях. В отрасли беспилотных автомобилей некоторые машины могут только тормозить или перестраиваться, другие же обеспечивают почти полную автономность. Если перенести этот принцип в сферу аннотирования, то, по словам Руиллара, Hasty обеспечивает более глубокую автоматизацию, чем многие его конкуренты, с точки зрения минимизации количества кликов, требуемых для разметки изображения или групп изображений.

«Все восхваляют автоматизирование, но не совсем понятно, что же именно автоматизируется», — объясняет Руиллар. «Почти во всех инструментах есть качественные реализации автоматизации первого уровня, но только немногие из нас озаботились созданием второго и третьего уровней, обеспечивающих значимые результаты».

Так как данные, по сути, являются топливом для машинного обучения, передача большего количества точных данных ИИ остаётся ключевым требованием.


Hasty: уровни автоматизированной разметки

Кроме инструмента для поиска ошибок вручную Hasty предлагает обнаружитель ошибок с поддержкой ИИ, автоматически идентифицирующий вероятные проблемы в данных обучения проекта. Это функция контроля качества, позволяющая обойтись без кропотливого поиска ошибок в данных.

«Это позволяет пользователям заниматься устранением ошибок, а не тратить время на их поиск, а также быстро укрепляет уверенность в данных в процессе аннотирования», — заявляет Руиллар.


Hasty: обнаружитель ошибок

Hasty заявляет, что продуктом стартапа пользуется примерно четыре тысячи пользователей, среди них корпорации, университеты, стартапы и разработчики ПО, связанные со многими сферами производства. «Нашими клиентами являются три из десятка лучших немецких компаний в сфере логистики, сельского хозяйства и розничной торговли», — добавляет Руиллар.

Типичным примером использования в сельском хозяйстве является обучение ИИ-модели для распознавания растений, вредителей и заболеваний. В логистике модель можно использовать для обучения машин автоматической сортировке посылок по типу. Также, по словам Руиллара, Hasty используется в сфере спорта, обеспечивая анализ игры в реальном времени и статистику для футбольных трансляций.

Имея 3,7 миллиона долларов в банке, компания планирует ускорить разработку продукта и расширить свою клиентскую базу в Европе и Северной Америке.
Источник: https://habr.com/ru/post/585366/


Интересные статьи

Интересные статьи

Чего уж только на Хабре не было, и DOOM на осциллографе, тесте на беременности и калькуляторе запускали, даже сервер Minecraft на зеркалке Canon 200D поднимали. Сего...
Мир, безусловно, становится лучше с каждым днем благодаря технологиям, основанным на жестах, потому что они интуитивно понятны, просты в применении и делают взаимодействие с гаджетами и...
Первые процессоры с маркировкой Core i3/i5/i7 и числовым индексом были выпущены Intel в 2008 году; сейчас, как мы знаем, имеют место десятое поколение Intel Core и модели с числом 10 вначале. При...
Следующая конференция HighLoad++ пройдет 6 и 7 апреля 2020 года в Санкт-Петербурге Подробности и билеты по ссылке. HighLoad++ Moscow 2018. Зал «Москва». 9 ноября, 15:00. Тезисы и презентация. ...
Перед тем как приступить к уроку, хочу сказать, что на нашем сайте nwking.org вы сможете найти не только информацию по изучению курса CCNA, но и множество других тем, полезных для сетевого специа...