Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Привет, это Smart Engines. Десант из 28 разработчиков систем распознавания на основе искусственного интеллекта только что вернулся из Амстердама, где мы принимали участие в международной научной конференции по компьютерному зрению ICMV. В статье мы постараемся объяснить, почему мы так много времени уделяем науке и ездим на научные конференции.
Сегодня в мире развития науки и высоких технологий произошла катастрофическая подмена понятий: за науку выдается то, что наукой не является ни в каком приближении, учеными называют программистов и инженеров, наукой называют решение простейших инженерных задач. В информационном пространстве роль фундаментальной науки в развитии технологий явно занижена. Многие забывают, что сенсорный экран айфона — это не сам по себе сенсорный экран айфона, а воплощение в жизнь идей фундаментальных исследований полупроводниковых гетероструктур нашего соотечественника нобелевского лауреата Ж.И. Алферова. Карты Google (или Яндекcа) — это не просто карты в мобильнике, а воплощение фундаментальных исследований в области вычислительной геометрии. И кстати фильм “Аватар” — это тоже на 99% вычислительная геометрия. Машинное зрение, нейросети и искусственный интеллект не исключение: весь этот комплекс работает хорошо и правильно только потому, что в основе лежат фундаментальные исследования. Фундаментальный подход к разработкам с одной стороны, является залогом правильного вектора развития отрасли, а с другой — демонстрирует наводнившим рынок различным стартапам гаражного типа, что фундаментальная наука всегда дает явное преимущество.
Мы — ученые. Мы — ученые и совершенно этого не стесняемся. Наш стартап (который на самом деле уже давно не стартап, а вполне хорошо работающий бизнес, известный как в России так и за рубежом, развившийся исключительно за счет разрабатываемых технологий без каких-либо инвестиций со стороны государства или фондов) — это про тот самый хайп, который сегодня у всех на слуху: компьютерное зрение, машинное обучение, искусственный интеллект, нейросети — в общем, весь набор слов bullshit bingo, употребление которых, по мнению многих стартаперов, делает проект заведомо успешным. Это, разумеется, не так. Важно, разбираетесь ли вы в существе вопроса. Именно поэтому многие старты из положения up очень быстро оказываются в положении down, а потом в положении out. Потому что не ученые.
Мы очень редко ходим на собрания стартаперов, визионеров и евангелистов в области искусственного интеллекта. Дело в том, что делать красивые презентации сейчас научились все. Кто не научился — нашел подрядчика. Огромные ресурсы вкладываются в раскрутку и продвижение технологических решений (сначала с целью привлечения инвестиций, а потом с целью оправдания деятельности слабого коллектива), за которыми нет ни новизны, ни эффективности. В красивой обертке презентации, инфографики и анимации, особенно когда в них вплетаются модные и непонятные научные и технологические термины, всегда можно скрыть отсутствие реального смысла деятельности. За многими презентациями нет науки. Это пустота, обернутая в красивую оболочку. Это приманка для инвесторов, которые клюют (или делают вид, что клюют) на блестящие стекляшки и дают деньги непонятно под какие задачи. В реальности в научной составляющей мало кто хочет разбираться, большинство предпочитает обращать внимание на внешнюю сторону «питчинга». Что поделать — презентационная экономика в действии. А мы не про это. Мы про науку.
Мы ездим на научные конференции. Например, недавно были в Австралии на конференции по распознаванию документов. Россия — и не только она — страна с повышенным уровнем развития бюрократии. Одни, страдая, собирают бумажки, другие с не меньшими страданиями работают с ними. Министерства объявляют конкурсы по цифровизации и автоматизации рутинных процессов, появляются вполне серьезные компании-исполнители, предлагающие свои подходы в этой области. С высоких трибун объясняется, что на этот раз пора заменять не только глаз и руку, что речь идет об искусственном интеллекте, способном разобраться в документах содержательно. И в этом контексте очень странно, что на ведущей профильной конференции из России были только мы и Abbyy. Представителей флагманов цифровой трансформации и участников госпрограммы развития искусственного интеллекта мы там не увидели. Получается, в области понимания документов в России больше ученых нет?
Только что мы вернулись из Амстердама, где проводилась ICMV — научная конференция по компьютерному зрению. Там мы совершенно не ставили целью продвигать успехи нашей компании как бизнес-структуры. Мы рассказали сообществу профессионалов, над какими фундаментальными проблемами работает наш научный коллектив. Для наших молодых ученых (в качестве основных докладчиков на конференции выступают именно молодые сотрудники, предлагающие и развивающие смелые идеи в нашей области) это возможность погружения в научную деятельность, собственного развития в научном и профессиональном плане.
Мы уверены: чтобы стартап “взлетел” и превратился в развивающийся бизнес, в его основе должна лежать наука, из которой вырастет работающая технология, являющаяся “двигателем” сервиса или продукта, востребованного рынком и отвечающего его требованиям.
В нашей области — области распознавания (это документы, удостоверяющие личность, различные анкеты, банковские карты, таблицы, штрих-коды, образы) — технология и наука, лежащая в основе — это фундамент. Цена ошибки очень высока, и именно поэтому у нас очень высокие требования к алгоритмам. Это как самолет — он либо летит, либо не летит, третьего не дано. Если летит плохо — значит, не летит совсем. И точно так же, как и в самолетостроении, — в основе алгоритма лежит наука, серьезная фундаментальная наука, которая выросла из задела наших соотечественников, стоявших у истоков нашего, домашнего, искусственного интеллекта. Распознаванием сейчас занимаются очень многие, создавая рынок этих услуг, который пока находится в зачаточном состоянии. Он не сформирован в полной мере, несмотря на то, что аналитики прогнозируют мировой объем этого рынка до 16-17 млрд долларов к 2024 году. Но очень мало коллег мы видим на научных конференциях. Еще меньше тех, кто публикуется в научных журналах. Вот мы уже слышим, как в нас полетели тапки возмущенных стартаперов, которые наверняка уверены в бесполезности проведения исследований и написания статей. “Мы делом занимаемся, а не какой-то теоретической наукой!” Вот именно поэтому многие системы распознавания на рынке работают откровенно плохо (несмотря на красивые презентационные ролики и рекламные слоганы), ошибаются, требуют участия человека-оператора (или целой фабрики этих операторов), который будет разглядывать нечеткий образ и корректировать решение машины собственными усталыми ручками. А ведь задача — сделать так, чтобы полностью автоматизировать процесс распознавания. В нашем случае это не означает устранить ошибку полностью, а сделать так, чтобы машина ошибалась в разы, в десятки и сотни раз реже человека.
Мы постоянно работаем над улучшением собственной технологии. Это процесс, связанный с большой теоретической работой и серьезными исследованиями. В технологии мы улучшаем точность, скорость, гибкость, делаем технологию более “легкой”, менее требовательной к “железу”, менее энергоемкой. Это наш “зеленый AI” (зеленый не в смысле “незрелый”, а в смысле “экологичный”). Мы понимаем, что экологичность технологии — это тренд. И за этот тренд будут цепляться потенциальные заказчики в мире. И понимание этого тренда мы получили именно из участия в научных конференциях. Как говорится в скандинавской пословице, “когда валишь лес, не забывай вовремя точить топор”. Участие в научных конференциях для нас — это как раз процесс заточки топора. Технология не может вырасти на пустом месте, понимание того, как ее можно улучшить, появляется не сразу. Ученое сообщество устроено принципиально иначе, чем сообщество стартаперов, инвесторов, блокчейн-аналитиков и технологических визионеров. Здесь мало показать красивую презентацию. Если в ней нет мысли и новизны — заклюют. Съедят и закопают. Да и устроено на научных конференциях все немного по-другому. Мы показываем там не конечный результат, а то, что к нему приводит, описываем методы и подходы, вытаптываем себе поляну, предъявляя миру результаты собственных исследований. Мало показать, что ты сделал, необходимо объяснить, как это работает.
Сейчас многие стартапы в области ИИ — это такие своеобразные автомастерские, где производят не починку автомобиля, а замену неисправных узлов. Что-то не работает — мы не чиним, мы сразу меняем модуль. Это проще, особенно когда не знаешь, как это все устроено, и что нужно делать, чтобы починить.
Мы ученые, и достаточно уверенно показываем: технология в основе которой лежит глубокая фундаментальная наука работает лучше, быстрее, увереннее, надежнее той, где из всех технологий только красивая презентация. Она меньше ломается, потребляет меньше энергии, работает в снег, в жару, ночью и утром, так как мы знаем, какая неонка у нее “унутре”, в каком месте надо “дергануть за пимпочку” и ударить в бубен.
У нас в компании работают более 50 разработчиков, каждый из которых разрушает тезис о невостребованности научного труда. В нашем коллективе есть как сложившихся учёные, так и те, кто только начинает путь в научной карьере. Особо подчеркнём — это не просто программисты, которые занимаются исключительно кодом. Каждый из них — самостоятельная научная единица, из которых формируется научный коллектив, обеспечивается гибкость и вариативность применяемых решений.
А все потому, что мы ездим на научные конференции.
На международной конференции по компьютерному зрению (ICMV) в Амстердаме, мы предложили свои принципиально новые подходы к развитию нейросетей и технологий распознавания, которые направлены на снижение углеродного следа и минимизацию ущерба окружающей среде от использования новых технологий. Основной упор был сделан на оптимизации применяемых в программно-аппаратных комплексах вычислительных алгоритмах, которые должны снизить энергозатраты на обучение и функционирование нейросетей в глобальном масштабе.
Сегодня устойчивое развитие нашей планеты становится основной повесткой в докладах мировых организаций, беспокоящихся о будущем Земли. И это не только Грета Тунберг. Место человека на планете во многом зависит от того, насколько мы сможем соблюдать баланс между развитием технологий, связанными с ними растущими аппетитами глобальных корпораций и ответственным отношением к окружающей среде. Возможные пути минимизации вреда от бурно развивающихся технологий последнего десятилетия во многом связаны со снижением энергопотребления и нахождением наиболее оптимальных и энергоэффективных инструментов для решения современных технологических задач.
В нашем арсенале есть нейросети и это наша, ученых, ответственность — заставить их работать быстро, эффективно, правильно решать возложенные на них задачи. С точки зрения “зеленого искусственного интеллекта”, вопрос прорыва заключается не в том, чтобы создать большую, мощную, огромную нейросеть — этакого синего кита с его удивительно большой нейросетью, а муху, с ее очень скромными “вычислительными” возможностями, но способностью быстро и энергетически эффективно решать необходимые задачи. Такая нейросеть должна обладать совершенно заоблачной удельной производительностью. Правильный выбор алгоритмов позволяют тратить на задачи распознавания образов в 1000 раз меньше ресурсов, чем заявляют сегодня отдельные производители оборудования.
Сегодня мы понимаем, что в нашей области увеличение мощностей устройств для выполнения операций — это билет в один конец. И в задаче ученых сегодня (при ответственном отношении к разработкам) — сделать технологию такой, чтобы она как можно меньше нагружала устройства, не заставляла процессор греться до температуры кипятильника, не жрала энергию, как “кадавр желудочно неудовлетворенный”. И тогда эта технология становится user friendly и при этом высокотехнологичной.
Для того, чтобы это стало реальностью, требуются совсем неочевидные “связки” совсем разных областей науки. Многим ли ясно, что переложение технологий глубинного обучения на тропическую алгебру позволяет резко сократить число транзисторов в нейропроцессорах при сохранении выразительной силы? Или что наличие радоновских слоев в нейросети позволяют ей экономно описывать проективные инварианты, которые, в свою очередь, определяют внутреннюю структуру изображений реального мира?
Участие в научных конференциях это, прежде всего, возможность сверить часы с мировыми лидерами, увидеть своих реальных конкурентов (да, реальные конкуренты тоже ездят на научные конференции, потому что они тоже ученые), увидеть то, куда движутся технологии, из первых рук, а не в пересказе визионеров и евангелистов, которые в большинстве своём к реальной науке отношения не имеют, а только научились складывать модные слова в относительно грамотные предложения. Без этого понимания тенденций и трендов в фундаментальной науке невозможно никакое движение вперед. Технология без науки “не взлетит”, либо уже заранее окажется устаревшей.
Сегодня в мире развития науки и высоких технологий произошла катастрофическая подмена понятий: за науку выдается то, что наукой не является ни в каком приближении, учеными называют программистов и инженеров, наукой называют решение простейших инженерных задач. В информационном пространстве роль фундаментальной науки в развитии технологий явно занижена. Многие забывают, что сенсорный экран айфона — это не сам по себе сенсорный экран айфона, а воплощение в жизнь идей фундаментальных исследований полупроводниковых гетероструктур нашего соотечественника нобелевского лауреата Ж.И. Алферова. Карты Google (или Яндекcа) — это не просто карты в мобильнике, а воплощение фундаментальных исследований в области вычислительной геометрии. И кстати фильм “Аватар” — это тоже на 99% вычислительная геометрия. Машинное зрение, нейросети и искусственный интеллект не исключение: весь этот комплекс работает хорошо и правильно только потому, что в основе лежат фундаментальные исследования. Фундаментальный подход к разработкам с одной стороны, является залогом правильного вектора развития отрасли, а с другой — демонстрирует наводнившим рынок различным стартапам гаражного типа, что фундаментальная наука всегда дает явное преимущество.
Мы — ученые. Мы — ученые и совершенно этого не стесняемся. Наш стартап (который на самом деле уже давно не стартап, а вполне хорошо работающий бизнес, известный как в России так и за рубежом, развившийся исключительно за счет разрабатываемых технологий без каких-либо инвестиций со стороны государства или фондов) — это про тот самый хайп, который сегодня у всех на слуху: компьютерное зрение, машинное обучение, искусственный интеллект, нейросети — в общем, весь набор слов bullshit bingo, употребление которых, по мнению многих стартаперов, делает проект заведомо успешным. Это, разумеется, не так. Важно, разбираетесь ли вы в существе вопроса. Именно поэтому многие старты из положения up очень быстро оказываются в положении down, а потом в положении out. Потому что не ученые.
Мы очень редко ходим на собрания стартаперов, визионеров и евангелистов в области искусственного интеллекта. Дело в том, что делать красивые презентации сейчас научились все. Кто не научился — нашел подрядчика. Огромные ресурсы вкладываются в раскрутку и продвижение технологических решений (сначала с целью привлечения инвестиций, а потом с целью оправдания деятельности слабого коллектива), за которыми нет ни новизны, ни эффективности. В красивой обертке презентации, инфографики и анимации, особенно когда в них вплетаются модные и непонятные научные и технологические термины, всегда можно скрыть отсутствие реального смысла деятельности. За многими презентациями нет науки. Это пустота, обернутая в красивую оболочку. Это приманка для инвесторов, которые клюют (или делают вид, что клюют) на блестящие стекляшки и дают деньги непонятно под какие задачи. В реальности в научной составляющей мало кто хочет разбираться, большинство предпочитает обращать внимание на внешнюю сторону «питчинга». Что поделать — презентационная экономика в действии. А мы не про это. Мы про науку.
Мы ездим на научные конференции. Например, недавно были в Австралии на конференции по распознаванию документов. Россия — и не только она — страна с повышенным уровнем развития бюрократии. Одни, страдая, собирают бумажки, другие с не меньшими страданиями работают с ними. Министерства объявляют конкурсы по цифровизации и автоматизации рутинных процессов, появляются вполне серьезные компании-исполнители, предлагающие свои подходы в этой области. С высоких трибун объясняется, что на этот раз пора заменять не только глаз и руку, что речь идет об искусственном интеллекте, способном разобраться в документах содержательно. И в этом контексте очень странно, что на ведущей профильной конференции из России были только мы и Abbyy. Представителей флагманов цифровой трансформации и участников госпрограммы развития искусственного интеллекта мы там не увидели. Получается, в области понимания документов в России больше ученых нет?
Только что мы вернулись из Амстердама, где проводилась ICMV — научная конференция по компьютерному зрению. Там мы совершенно не ставили целью продвигать успехи нашей компании как бизнес-структуры. Мы рассказали сообществу профессионалов, над какими фундаментальными проблемами работает наш научный коллектив. Для наших молодых ученых (в качестве основных докладчиков на конференции выступают именно молодые сотрудники, предлагающие и развивающие смелые идеи в нашей области) это возможность погружения в научную деятельность, собственного развития в научном и профессиональном плане.
Мы уверены: чтобы стартап “взлетел” и превратился в развивающийся бизнес, в его основе должна лежать наука, из которой вырастет работающая технология, являющаяся “двигателем” сервиса или продукта, востребованного рынком и отвечающего его требованиям.
В нашей области — области распознавания (это документы, удостоверяющие личность, различные анкеты, банковские карты, таблицы, штрих-коды, образы) — технология и наука, лежащая в основе — это фундамент. Цена ошибки очень высока, и именно поэтому у нас очень высокие требования к алгоритмам. Это как самолет — он либо летит, либо не летит, третьего не дано. Если летит плохо — значит, не летит совсем. И точно так же, как и в самолетостроении, — в основе алгоритма лежит наука, серьезная фундаментальная наука, которая выросла из задела наших соотечественников, стоявших у истоков нашего, домашнего, искусственного интеллекта. Распознаванием сейчас занимаются очень многие, создавая рынок этих услуг, который пока находится в зачаточном состоянии. Он не сформирован в полной мере, несмотря на то, что аналитики прогнозируют мировой объем этого рынка до 16-17 млрд долларов к 2024 году. Но очень мало коллег мы видим на научных конференциях. Еще меньше тех, кто публикуется в научных журналах. Вот мы уже слышим, как в нас полетели тапки возмущенных стартаперов, которые наверняка уверены в бесполезности проведения исследований и написания статей. “Мы делом занимаемся, а не какой-то теоретической наукой!” Вот именно поэтому многие системы распознавания на рынке работают откровенно плохо (несмотря на красивые презентационные ролики и рекламные слоганы), ошибаются, требуют участия человека-оператора (или целой фабрики этих операторов), который будет разглядывать нечеткий образ и корректировать решение машины собственными усталыми ручками. А ведь задача — сделать так, чтобы полностью автоматизировать процесс распознавания. В нашем случае это не означает устранить ошибку полностью, а сделать так, чтобы машина ошибалась в разы, в десятки и сотни раз реже человека.
Мы постоянно работаем над улучшением собственной технологии. Это процесс, связанный с большой теоретической работой и серьезными исследованиями. В технологии мы улучшаем точность, скорость, гибкость, делаем технологию более “легкой”, менее требовательной к “железу”, менее энергоемкой. Это наш “зеленый AI” (зеленый не в смысле “незрелый”, а в смысле “экологичный”). Мы понимаем, что экологичность технологии — это тренд. И за этот тренд будут цепляться потенциальные заказчики в мире. И понимание этого тренда мы получили именно из участия в научных конференциях. Как говорится в скандинавской пословице, “когда валишь лес, не забывай вовремя точить топор”. Участие в научных конференциях для нас — это как раз процесс заточки топора. Технология не может вырасти на пустом месте, понимание того, как ее можно улучшить, появляется не сразу. Ученое сообщество устроено принципиально иначе, чем сообщество стартаперов, инвесторов, блокчейн-аналитиков и технологических визионеров. Здесь мало показать красивую презентацию. Если в ней нет мысли и новизны — заклюют. Съедят и закопают. Да и устроено на научных конференциях все немного по-другому. Мы показываем там не конечный результат, а то, что к нему приводит, описываем методы и подходы, вытаптываем себе поляну, предъявляя миру результаты собственных исследований. Мало показать, что ты сделал, необходимо объяснить, как это работает.
Сейчас многие стартапы в области ИИ — это такие своеобразные автомастерские, где производят не починку автомобиля, а замену неисправных узлов. Что-то не работает — мы не чиним, мы сразу меняем модуль. Это проще, особенно когда не знаешь, как это все устроено, и что нужно делать, чтобы починить.
Мы ученые, и достаточно уверенно показываем: технология в основе которой лежит глубокая фундаментальная наука работает лучше, быстрее, увереннее, надежнее той, где из всех технологий только красивая презентация. Она меньше ломается, потребляет меньше энергии, работает в снег, в жару, ночью и утром, так как мы знаем, какая неонка у нее “унутре”, в каком месте надо “дергануть за пимпочку” и ударить в бубен.
У нас в компании работают более 50 разработчиков, каждый из которых разрушает тезис о невостребованности научного труда. В нашем коллективе есть как сложившихся учёные, так и те, кто только начинает путь в научной карьере. Особо подчеркнём — это не просто программисты, которые занимаются исключительно кодом. Каждый из них — самостоятельная научная единица, из которых формируется научный коллектив, обеспечивается гибкость и вариативность применяемых решений.
А все потому, что мы ездим на научные конференции.
На международной конференции по компьютерному зрению (ICMV) в Амстердаме, мы предложили свои принципиально новые подходы к развитию нейросетей и технологий распознавания, которые направлены на снижение углеродного следа и минимизацию ущерба окружающей среде от использования новых технологий. Основной упор был сделан на оптимизации применяемых в программно-аппаратных комплексах вычислительных алгоритмах, которые должны снизить энергозатраты на обучение и функционирование нейросетей в глобальном масштабе.
Сегодня устойчивое развитие нашей планеты становится основной повесткой в докладах мировых организаций, беспокоящихся о будущем Земли. И это не только Грета Тунберг. Место человека на планете во многом зависит от того, насколько мы сможем соблюдать баланс между развитием технологий, связанными с ними растущими аппетитами глобальных корпораций и ответственным отношением к окружающей среде. Возможные пути минимизации вреда от бурно развивающихся технологий последнего десятилетия во многом связаны со снижением энергопотребления и нахождением наиболее оптимальных и энергоэффективных инструментов для решения современных технологических задач.
В нашем арсенале есть нейросети и это наша, ученых, ответственность — заставить их работать быстро, эффективно, правильно решать возложенные на них задачи. С точки зрения “зеленого искусственного интеллекта”, вопрос прорыва заключается не в том, чтобы создать большую, мощную, огромную нейросеть — этакого синего кита с его удивительно большой нейросетью, а муху, с ее очень скромными “вычислительными” возможностями, но способностью быстро и энергетически эффективно решать необходимые задачи. Такая нейросеть должна обладать совершенно заоблачной удельной производительностью. Правильный выбор алгоритмов позволяют тратить на задачи распознавания образов в 1000 раз меньше ресурсов, чем заявляют сегодня отдельные производители оборудования.
Сегодня мы понимаем, что в нашей области увеличение мощностей устройств для выполнения операций — это билет в один конец. И в задаче ученых сегодня (при ответственном отношении к разработкам) — сделать технологию такой, чтобы она как можно меньше нагружала устройства, не заставляла процессор греться до температуры кипятильника, не жрала энергию, как “кадавр желудочно неудовлетворенный”. И тогда эта технология становится user friendly и при этом высокотехнологичной.
Для того, чтобы это стало реальностью, требуются совсем неочевидные “связки” совсем разных областей науки. Многим ли ясно, что переложение технологий глубинного обучения на тропическую алгебру позволяет резко сократить число транзисторов в нейропроцессорах при сохранении выразительной силы? Или что наличие радоновских слоев в нейросети позволяют ей экономно описывать проективные инварианты, которые, в свою очередь, определяют внутреннюю структуру изображений реального мира?
Участие в научных конференциях это, прежде всего, возможность сверить часы с мировыми лидерами, увидеть своих реальных конкурентов (да, реальные конкуренты тоже ездят на научные конференции, потому что они тоже ученые), увидеть то, куда движутся технологии, из первых рук, а не в пересказе визионеров и евангелистов, которые в большинстве своём к реальной науке отношения не имеют, а только научились складывать модные слова в относительно грамотные предложения. Без этого понимания тенденций и трендов в фундаментальной науке невозможно никакое движение вперед. Технология без науки “не взлетит”, либо уже заранее окажется устаревшей.