Диагностика крови с помощью Deep Learning: Как превратить проект с хакатона в стартап и поднять $20,5 млн

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

image


Слева — Танай Тандон, в 17 лет в 2014 году основал стартап Athelas для диагностики малярии при помощи смартфона. Справа — соосновательница Athelas Дипика Бодопати.

Несколько лет назад Athelas (YC S16) за одну ночь разработала свой прототип на хакатоне YC Hacks 2014. В этом месяце мы начали поставки устройства в больницы и пациентам по всей стране. За это время мы многому научились и хотим поделиться некоторыми мыслями.

image

Athelas — недорогой формирователь изображений, который обеспечивает моментальный анализ крови с помощью компьютерного зрения вместо традиционных лабораторных тестов. Путь от собранного на коленке прототипа до готового к поставке прибора (в медицине особенно) на каждом своем этапе был изменением размерности, и сейчас интересно вспоминать самый первый день.

В варианте, который собрали на хакатоне, был использован кусок поролона и сферическая лупа, прикрепленная к камере смартфона. Образец крови удерживался под ними (в рулоне туалетной бумаги), камера делала несколько снимков, и затем с помощью компьютерного зрения производился подсчет малярийных клеток. Конструкция прибора очень похожа на микроскоп ван Левенгука (считается одним из самых первых микроскопов), который впервые в истории человечества был использован для наблюдения за микроорганизмами. Было несколько попыток собрать все вместе, и я потратил пару часов хакатона, чтобы устройство устойчиво работало с моим телефоном.


image

image

image

Фрагменты заметок, которые я сделал спустя несколько месяцев после хакатона.

Настоящий хак заключался в сегментировании и шаблонном согласовании в сочетании с реализацией модели Fast Random Forest (ускоренный алгоритм случайного леса), обученной классифицировать извлеченные признаки красных кровяных телец (RBC). Границы клеток распознаются, а затем подаются в классификатор, чтобы определить, наличие паразитарных клеток (например, малярии или трипаносомы).

image

Прототип был сделан для прикольной презентации, когда стекла с образцом крови будут показывать малярийного паразита, а кровь нормального человека нет. Во время демонстрации кто-то физически должен был удерживать камеру на одном месте, ловким трюком стекла с образцами подменялись, а свет надо было еще поймать. К концу дня прототип стал веселой игрушкой для экспериментов, возможно вы видели видео в Facebook.

Но были уверены, что это нечто большее. Ключевой идеей было — если мы сделаем широко применимый и достаточно простой в использовании прибор, почему бы не делать простой анализ крови в каждом врачебном кабинете, смотровой или даже дома? По возвращению домой эта идея нас полностью поглотила, и мы решили ее развивать — но как продукт, а не просто прототип. Это означало создание автоматизированного механизма анализа мазков периферической крови, более надежного подхода компьютерного зрения для различных типов клеток, автоматизированных механизмов формирования изображения всего образца без хранения предметных стекол и, что более важно, — проведение клинических валидационных исследований.

image

Дипика (мой со-основатель) работала над усовершенствованием метода быстрого окрашивания клеток и придумала способ нанесения красителя на пластиковые полоски, которые можно использовать прямо из коробки. Она работала в основном в лаборатории, синтезируя десятки вариантов красителя и проводя эмпирические исследования качества отображения клеток. Другой частью проблемы была необходимость легкого сжатия полоски для создания «монослоя» или одного слоя клеток, который позволяет получать статистически репрезентативные изображения.

image

image

Фрагменты работы «The marching velocity of the capillary meniscus in a microchannel», пример, на который мы ссылаемся при моделировать потока в канале для создания «монослоя». Этот капиллярная разработка в конечном итоге была отложена на будущее.

Тем временем я сосредоточился на создании оптики с высоким разрешением для все еще недорогого, но автономного устройства. Таким образом, мы могли бы сосредоточиться на мониторинге превалирующих типов клеток, таких как лейкоциты и тромбоциты (помимо малярии). Сердцем всего этого была система срабатывания, сочетающая гауссовские алгоритмы фокусировки изображений, гарантирующая устойчивое распознавание клеток. Вот прототип на полпути:

image

Кроме того, мы приступили к формированию обучающей выборки общедоступных изображений (Centers for Disease Control and Prevention, CDC) и мазков крови, собранных исследователями из Стэнфорда и Калифорнийского университета — зачастую вручную помеченных мной или патологом. С этого момента мы смогли использовать традиционные подходы компьютерного зрения и глубокого обучения для распознавания и классификации типов клеток на основе предшествующих примеров, верифицированных человеком.

image

Изображение извлеченных тел клеток после преобразования Хафа, первого прохода, предварительной сегментации и классификации

Первые шаги давались тяжело. Рабочая нагрузка на колледж в Стэнфорде + растущие затраты на оборудование снижали скорость итераций, необходимую для нормального развития продукта. Финалы часто означали дни, проходящие без какого-либо заметного прогресса. Но мы собрали осязаемую, пригодную к использованию v1, которая может захватывать и обрабатывать изображение окрашенного образца крови. Смотрите демо:




Этим летом в этом оранжевом здании в Маунтин-Вью все вернулось на круги своя, когда мы присоединились к летнем батче Y Combinator. Все наши усилия (а теперь у нас полная занятость на проекте) были сосредоточены на клинической валидации результатов в семейной клинике FEMAP, чтобы запустить первую серию применения в рамках системы здравоохранения. Целью было проверить систему только по одному аспекту: подсчету лейкоцитов. Получив изображения образцов крови на нашей полосе, а затем запустив алгоритмы, мы показали, как наш подсчет клеток для 350 пациентов с высокой корреляцией соответствует результатам золотого стандарта счетчиков клеток Бекмана Коултера, в сочетании с рядом лабораторных проверок точности.

image

Интересный аспект заключался в том, что показанная нами точность капля к капле (что вызывает повышенный интерес в последнее время) была клинически подтверждена в сравнении с другими системами, использующими капли крови. Счетчики Coulter (традиционные системы подсчета клеток) работают, пропуская частицы через драгоценную апертуру диаметром несколько микрон и фиксируя характеристический импеданс для регистрации размера частиц и, как следствие, ее классификации. По сути, чем больше импеданс, тем больший размер частиц.

image

Схема принципа счетчика Коултера, источник: cyto.purdue.edu.

Однако подход Athelas к компьютерному зрению полностью сосредоточен на изображении и моделях нуклеации. Поэтому твердые частицы или лимфа, которые часто могут сбить с толку систему Коултера (особенно в разбавленном количестве), компьютерным зрением просто классифицируются как не-лейкоцитарное клеточное тело — не лейкоцит, а какой-то другой неклассифицированный артефакт в образце крови.

image

Испытание показало высокую степень согласованности между экспертами (100% согласие между экспертами по 5 классам) между двумя системами, мы подали в FDA (Food and Drug Administration) документы для регистрации системы по Классу 2 510(k), сейчас мы продаем по Класса 1 версию системы для быстрого мониторинга лейкоцитов. Подробнее на сайте athelas.com.

image

В ближайшие месяцы мы интегрируем в систему новые виды анализов крови (мониторинг сотрясения мозга, отслеживание воспаления, инфекции мочевыводящих путей, тромбоциты, увеличение количества клеток), нашей ключевой задачей будет взаимодействие с профессиональным медицинским сообществом в целях принятия и внедрения нашей системы.

image

В тоже время мы сосредоточимся на поставках наших устройств по 250 долл. в как можно большее количество точек оказания медпомощи, медучреждений и домохозяйств.

Мы постоянно ищем выдающихся людей, чтобы познакомится и хакеров, чтобы присоединились к нашей команде, так что пишите мне, если есть желание пообщаться: tanay [at] getathelas.com

Перевод: Илья Ланкевич

Если вы хотите помочь с переводами полезных материалов библиотеки YC — пишите в личку, телегу @jethacker или почту alexey.stacenko@gmail.com

Следите за новостями YC Startup Library на русском в телеграм-канале или в фейсбуке.

Полезные материалы


  • 75 лекций на русском от Y Combinator (из 172)
  • Y Combinator: русскоговорящие основатели
  • Какие стартапы ищет Y Combinator в 2020 году
  • Подборка 143 переводов эссе Пола Грэма (из 184)
  • Чат Y Combinator in Russian
  • Паблик в фейсбуке YCombinator in Russian
Источник: https://habr.com/ru/post/531322/

Интересные статьи

Интересные статьи

Всем привет. Если вы когда-либо работали с универсальными списками в Битрикс24, то, наверное, в курсе, что страница детального просмотра элемента полностью идентична странице редак...
На вопросы отвечал Павел Зыков, СТО DomClick.ru ДомКлику скоро 5 лет. Давайте немного вспомним историю и заодно познакомимся. Компания была основана в 2015 году. Ты помнишь день, с которого вс...
В данной статье речь пойдет об использовании открытой платформы Apache Flink для обнаружения цепочки последовательности событий. Статья подойдет как для начинающих разработчиков в области обработ...
Вы наверняка слышали это знаменитое высказывание от GoF: «Предпочитайте композицию наследованию класса». И дальше, как правило, шли длинные размышления на тему того, как статически определяемое н...
Что такое Roslyn? Roslyn – это набор компиляторов с открытым исходным кодом и API для анализа кода для языков C# и VisualBasic .NET от Microsoft. Анализатор Roslyn – мощный инструмент для анали...