Machine Learning по-казански, или как готовят специалистов машинного обучения в Татарстане

Татарстан давно проявляет амбициозность в развитии высоких технологий. Недавно 10-летие отметил казанский IT-парк — тот самый, где стартапы и небольшие компании рвутся на международный уровень. Город Иннополис тоже демонстрирует мощь вопреки скептическим прогнозам: если верить статистике, в 2019-м число жителей увеличилось на треть, а в технопарке открылись новые офисы мировых корпораций. Окей, а как здесь обстоят дела с общемировыми IT-трендами — машинным обучением и технологиями искусственного интеллекта?

Главный первопроходец этого направления в Казани — Евгений Разинков, кандидат физико-математических наук, преподаватель Казанского федерального университета, руководитель отдела машинного обучения и компьютерного зрения Группы компаний FIX и директор по науке компании Pr3vision. Когда-то он был обычным студентом ВМК, а год назад запустил в родном вузе магистерскую программу «Машинное обучение и компьютерное зрение». Самых талантливых коллег и студентов Евгений забирает в свою команду, которая занимается научными разработками и сотрудничает с крупными IT-компаниями. Разузнали у него всё про Machine Learning по-казански.

— В какой момент ты понял, что пора развивать направление машинного обучения в Казани?

— Всё произошло как-то естественно. В 2014-м заинтересовался машинным обучением сам, а в мае того же года познакомился с чешским профессором Иржи Матосом, который стал моим научным руководителем. В декабре 2014-го впервые съездил к нему на стажировку в Прагу, а с февраля начал проводить семинары по машинному обучению в КФУ. Это было примерно так: прихожу я на свой первый семинар, собираю студентов и говорю: «Ребят, сейчас будет семинар о машинном обучении. Я пока и сам многого не понимаю, так что давайте разбираться вместе».

В течение семестра я читал эти семинары и учился вместе со студентами, а потом это переросло в учебный курс, который вошел в учебный план и читался мной уже бакалаврам как обязательный предмет. Я самостоятельно разработал и начал преподавать курс по компьютерному зрению. Читал Data Mining. Потом разработал свой курс по Deep Learning. Думаю, это был первый такой курс, который на тот момент можно было найти в России. Например, в Чехии его разрабатывают только сейчас, и я даже немного горжусь тем, что читаю его достаточно давно. А пару лет назад заметил, что студенты стали проявлять больше интереса к моим лекциям. Приходят ко мне не по расписанию, спрашивают, как попасть на мои занятия.

— Какие площадки сейчас готовят спецов МО в Казани, и какие из них ты считаешь наиболее эффективными?

— Дисклеймер: тут история про мой явный конфликт интересов :) Конечно же, в первую очередь я назову КФУ, Институт вычислительной математики и информационных технологий (бывший факультет ВМК), кафедра системного анализа.

Это прозвучит нескромно, но я очень верю, что мы готовим действительно классных специалистов. Сейчас у нас семь преподавателей — все ребята из моей команды, и у большинства как минимум 3 года опыта в этом направлении. По моей информации, кроме нас специалистов в таким опытом в Казани почти нет. Я читаю лекции по машинному обучению на 2-м и 3-м курсах бакалавриата, на четвертом курсе бакалавриата и в магистратуре — компьютерное зрение. А ещё у магистрантов веду лекционный курс по глубокому обучению.

Плюс на нашей кафедре системного анализа в 2019 появился новый профиль магистратуры – «Машинное обучение и компьютерное зрение», который я открыл вместе с со своей командой. В этой магистратуре я читаю курсы по глубокому обучению, компьютерному зрению, в следующем семестре буду читать лекции по обучению с подкреплением, обработке естественного языка. Мой коллега Руслан Нигматуллин читает лекции по цифровой обработке изображений и цифровой обработке сигналов. Всего у нас 9 лекционно-практических курсов, связанных с искусственным интеллектом. Ребята, которые когда-то писали у меня дипломные работы, сейчас ведут в нашей магистратуре практические занятия. На этот профиль в прошлом году получился хороший конкурс, что меня очень радует.

Мои лекции открыты для всех желающих (тех, кто имеет доступ в корпуса КФУ). Сейчас я выкладываю смонтированные видео с лекциями на YouTube-канал. В ближайшем будущем планирую стримить лекции онлайн в связи с пандемией COVID-19 — все это будет в открытом доступе.

Насколько я знаю, также в Казани таких специалистов готовят в КНИТУ-КАИ и университете Иннополис.

— Куда идут работать ваши выпускники? Хотят развиваться в Казани или стремятся в Москву, за границу?

— Мне кажется, такому небольшому количеству выпускников — сильных ребят вполне хватит работы и здесь. Казань довольно динамично развивается в сфере IT. Некоторые мои ученики уезжают в Москву. В целом, конечно же, хороших спецов в этом направлении ждут везде.

— Ты руководишь отделом машинного обучения и компьютерного зрения в крупном холдинге. Как оцениваешь роль такого отдела в масштабах компании? Считаются ли такие компании круче/престижнее/перспективнее других?

— Сейчас тема искусственного интеллекта и машинного обучения на подъёме, большая часть инноваций в мире связана с ними. Мне трудно думать иначе, но на мой взгляд, эти технологии суперважны для каждой компании, которая планирует развивать инновационный бизнес. Потому что актуальные инновации в бизнесе сейчас очень часто завязаны на наших алгоритмах, и без отделов машинного обучения таким компаниям обойтись сложно.

Даже если корпорация с виду крупная, но в ней нет экспертизы по машинному обучению, компьютерному зрению и ИИ, появляется ощущение, что такой бизнес смотрит в прошлое. Есть вероятность, что пройдёт несколько лет и они проиграют своим более мелким конкурентам, которые сейчас уделяют больше внимания нашим технологиям и алгоритмам.

— Что считаешь наибольшим достижением твоей команды?

— У нас есть две большие причины для гордости. Первая — то, что мы действительно успешно закрываем многие проекты. Большинство наших разработок коммерчески реализуются и радуют наших заказчиков. Многие проекты защищены NDA и являются коммерческой тайной компаний, с которыми мы сотрудничаем, поэтому конкретики будет мало.

Из открытых проектов, которые мы реализовали — инструмент для кэшбэк-сервиса Backit Группы компаний FIX в Казани. Мы создали систему, которая позволяет найти нужный товар с кэшбэком по фотографии. Допустим, пользователь хочет купить определённую модель кроссовок с кэшбэком. Он загружает фото товара в приложение сервиса, а специально обученный инструмент выдаёт ему ссылку на эту покупку с кэшбэком. Сейчас к кэшбэк-сервису Backit подключено более 1000 интернет-магазинов с самым разным ассортиментом — от косметики до строительных материалов. Наш алгоритм ищет одежду и аксессуары.

Второе наше достижение — качественная подготовка специалистов, которая у нас полностью выстроена. Многие люди из моей команды преподают студентам, эти ребята пишут у нас диплом, потом — магистерскую диссертацию. И уже в середине магистратуры мы имеем достаточно сильных ребят, которые потом приходят работать с нами уже в коммерческих компаниях.

— Какие принципы, на твой взгляд, наиболее важны в подготовке специалистов этого направления?

— Здесь можно много говорить про математику. Я считаю, что человек, у которого нет хорошего математического бэкграунда, сильно ограничен в своем развитии и не может претендовать на быстрое развитие в машинном обучении.

Ещё один важный момент. Когда специалисты машинного обучения разрабатывают систему, в конце всегда измеряется точность. Часто возникает вопрос — понятны ли эти способы измерения заказчику? Чаще всего — нет. Метрики, которые мы используем, сложны, и людям без специального технического образования могут быть непонятны. Бизнес обычно заинтересован в KPI, завязанных на бизнес-задачах, а machine learning работает с совершенно другими метриками. Это возлагает на наших специалистов ответственность — суметь перейти на язык заказчика и грамотно донести результаты работы.

Тут же остро встаёт вопрос профессиональной этики. Можно легко держать заказчика в заблуждении и «радовать» красивыми цифрами, которые будут иметь довольно слабую связь с применением системы в реальных условиях — к сожалению, некоторые специалисты так и делают. Однажды мы работали с заказчиком, который рассказал о том, что предлагали ему другие специалисты. Конкуренты пообещали ему определенные показатели точности, но не объяснили, как именно эта метрика вычисляется. Этот подход не кажется этичным с профессиональной точки зрения.

Поэтому важный принцип в подготовке специалистов машинного обучения — прокачивать их готовность говорить на языке заказчика. Честно переводить математические метрики в бизнес-логику, на бизнес-язык. И ты должен быть тем человеком, который в случае чего может честно сказать заказчику: «Машинное обучение здесь неприменимо, не нанимайте меня».

А ещё есть такая вещь — эффект Даннинга-Крюгера. Это психологическое явление, когда люди с низкой квалификацией считают себя крутыми спецами, а действительно крутые спецы считают себя не особо-то и крутыми. Если загуглить график Даннинга-Крюгера, всё станет понятно.

Машинное обучение сейчас — настолько хайповая область, что соблазн посчитать себя хорошим специалистом велик. Тем более, когда онлайн-курсы обещают «сделать профессионалом за три месяца, а то и за месяц». Всё усугубляется тем, что многие компании пока не умеют объективно оценивать уровень подготовки специалиста этого направления. Если в компании такой компетенции не было и её только-только создают, кандидаты на это место могут пытаться продавать себя любым образом. И тут снова актуален вопрос честности.

Как бы ни хотел специалист получить работу в этой сфере,, он не должен обещать заказчику то, с чем он не сможет справиться, даже если заказчик «сам обманываться рад». Это очень вредно для области — у заказчиков появляются завышенные ожидания. К чему это приводит в плане развития технологий? К тому, что в один день вера в наши методы и алгоритмы ослабевает.

Заказчику кажется, что с помощью машинного обучения он сразу начнёт делать крутые вещи, нанимает специалистов, которые, скажем так, неоправданно оптимистичны. В итоге всё это ни к чему не приводит, и заказчик говорит: «Я разочаровался в МО. Это не работает».

Для меня, как специалиста, который на этом зарабатывает, это большая проблема и боль. Я хотел бы, чтобы другие специалисты по машинному обучению ответственно относились к тому, что мы делаем. Чтобы каждый трезво оценивал свои скиллы и то, насколько решаема задача, умел возвращать заказчика «на землю». Чтобы не было разочарований в технологии и все могли нормально, продуктивно работать.

— Когда казанское сообщество специалистов машинного обучения прославит Казань на весь мир?

— Здесь наверное можно только отшутиться :) А вообще, что прославляет на весь мир? Ситуация, когда у компании есть большие деньги и она готова вкладываться в сторонние вещи — не в то, на чем она зарабатывает. А когда речь идет о том, на чем она зарабатывает — как правило, это коммерческая тайна, и ты не прославляешь Казань на весь мир.

Да, есть такие компании, как DeepMind, OpenAI — там огромные деньги, люди учат ботов играть в варкрафт, доту. Непосредственного применения вроде бы нет, но шумиха есть, потому что всем это интересно. Такие вещи и прославляют на весь мир. Еще, конечно, такой эффект имеют научные достижения. Есть университеты Оксфорд, Стэнфорд, MIT — у них тоже есть такие ресурсы.

Основная вещь, которой можем прославиться мы — это образовательная деятельность. Наибольшее, на что можем рассчитывать — стать известными на всю Россию как некий центр подготовки крутых специалистов. Чтобы в один прекрасный день люди заметили нашу работу и сказали: «О, в Казани сильная ML-школа!». К нам подтянулись бы талантливые студенты из соседних городов, вместе мы бы создавали ещё более интересные вещи.

Так что разумный потолок — популярность в качестве сильной школы по machine learning в России. В масштабах мира пока не представляю. Наверное, ситуация в высшей школе и коммерческих компаниях пока не та. Возможно, когда мы обретём большее преимущество в коммерческом плане, в наши технологии начнут инвестировать охотнее. Сейчас бизнес ждёт быстрого эффекта, но в машинном обучении нужен другой подход, более фундаментальный и стратегический — только в этом случае может получиться что-то хорошее. Пока так.

Контакты Евгения:

Телеграм-канал (анонсы лекций и семинаров, важные статьи по машинному обучению): t.me/razinkov_ai

YouTube-канал (видеозаписи лекций): video.razinkov.ai

Паблик в VK (расписание, анонсы семинаров): vk.com/razinkov_ai

Источник: https://habr.com/ru/post/493392/

Вернуться к списку

Интересные статьи

Меняем страницу просмотра элемента универсальных списков в коробочном Битрикс24

Всем привет. Если вы когда-либо работали с универсальными списками в Битрикс24, то, наверное, в курсе, что страница детального просмотра элемента полностью идентична странице редак...

Популярные ошибки в английском среди IT-специалистов. Часть 2: Произношение

Моя статья «Популярные ошибки в английском среди IT-специалистов» собрала много комментариев с полезными дополнениями. И я решила выпустить вторую часть, теперь посвященную Произношению. ...

Дайджест новостей машинного обучения и искусственного интеллекта за ноябрь

Привет, Хабр! Отфильтровав для вас большое количество источников и подписок, сегодня собрал все наиболее значимые новости из мира будущего, машинного обучения, роботов и искусственного интеллекта...

Минусы для пользователя при использовании 1С-Битрикс

Есть статьи о недостатках Битрикса, которые написаны программистами. Недостатки, описанные в них рядовому пользователю безразличны, ведь он не собирается ничего программировать.

Сайт на бесплатной CMS или купить готовое решение на 1С-Битрикс?

Периодически мне в разных вариантах задают вопрос, который «в среднем» звучит так: «что лучше: заказать интернет-магазин на бесплатной CMS или купить готовое решение на 1С-Битрикс и сделать магазин на...