Как написать научную работу про AI/ML: советы для начинающих

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Сбер организовал международный конкурс статей по Al и ML. Что получат авторы? Шанс рассказать о своих исследованиях на международной конференции «AI Journey 2023», а лучшая статья получит приз — миллион рублей. Статью принимают до 31 июля.

Ключевые статьи опубликуют в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии «Doklady Mathematics». Журнал индексируется в базах научного цитирования РИНЦ, Scopus, Web of Science, входит в квартиль Q2 в категории «Прикладная математика» Scopus.

Организаторы принимают к участию:

  • Научную статью, содержащую оригинальные, ранее не опубликованные научные результаты или результаты исследований.

  • Обзорную научную статью.

Машинное обучение и искусственный интеллект не требуют специального лабораторного оборудования и опыта больших научных школ, поэтому сейчас любой разработчик, который создаёт или адаптирует решения на основе ИИ в рамках своей работы, может попробовать написать научную статью. Собрали руководство, как написать свою первую научную статью.

Шаг 1: Выбор формата и темы статьи, формулировка вопроса исследования

Определите, какую задачу в машинном обучении или искусственном интеллекте вы хотите решить.

Ответьте на вопросы: 

  • Какова научная новизна вашей работы?

  • Как коррелируются результаты статьи с другими исследованиями в данной теме?

  • Публиковались похожие исследования раньше или нет?

Не стоит пугаться этих вопросов: если вы когда-нибудь писали исследовательскую курсовую или диплом, или регулярно читаете научные статьи, то легко вспомните принципы, по которым пишутся подобные работы.

Не обязательно быть Стивеном Хокингом, чтобы делать вклад в науку. В академической среде вклад в науку — это количество публикаций, грантов, участие в конференциях, полученные награды. Если вы не ученый, то попробуйте оценить такой параметр: насколько полезна ваша работа может быть для других исследователей, к каким новым идеям она может их подтолкнуть.

Сформулируйте вопрос исследования, который будет определять направление вашей работы. Определите основную гипотезу: предположение, которое вы делаете на основе предварительных данных и затем проверяете в исследовании.

В хорошей статье должен быть один вопрос и содержаться такой объём информации, который позволяет дать исчерпывающий ответ. Оцените, могут ли после прочтения статьи появиться дополнительные вопросы, и в статье дайте на них ответы. Здесь как в презентации стартапера: потренируйтесь, чтобы за 30 секунд незнакомому человеку объяснить, о чём ваша работа и какие выводы вы планируете сделать.

Примеры научных статей на тему AI/ML: раз, два, три. А вот более прикладные примеры: один, два, три, четыре, пять, шесть.

Полезный совет: найдите хорошую статью по вашей теме и возьмите её структуру за образец. Работы участников будут опубликованы в научном журнале «Доклады Российской академии наук. Математика, информатика, процессы управления», поэтому можно изучить архивы статей.

Шаг 2: Сбор данных и проведение экспериментов

  • Соберите данные, необходимые для решения поставленной задачи.

  • Определитесь с типом поставленной задачи — классификация, регрессия, кластеризация. Выберите конкретные методы и модели машинного обучения или искусственного интеллекта для решения выбранной задачи.

  • Проведите эксперименты, используя выбранные методы машинного обучения или искусственного интеллекта.

Чтобы провести эксперимент, нужно использовать традиционный подход с обучением, сравнением и проверкой моделей машинного обучения.

Шаг 3: Анализ результатов

Проанализируйте полученные результаты экспериментов: точность, полноту, F1-меру, ROC-кривую. В зависимости от задачи и выбранной модели могут использоваться и другие метрики. Оцените эффективность выбранных методов и сравните их с другими подходами. Также для анализа результатов можно провести сравнение с другими подходами из научных статей последних двух-трёх лет. Стоит выбирать свежие статьи с большим числом цитирований, работы из конференций уровня A*  или журналов первого квартиля.

Как найти квартиль журнала?

Квартиль (Q) — это категория научных журналов, отражающая уровень цитируемости и востребованности журнала научным сообществом.

В SCImago JR (Scopus)

  1. Зайти с любого компьютера на страницу http://www.scimagojr.com/journalsearch.php

  2. Ввести в «Search Query» полное название журнала / часть названия / номер ISSN / название издательства, нажать кнопку Search.

  3. Выбрать из числа найденных журналов нужный, кликнуть на него.

  4. В появившемся профиле журнала указаны все его тематические категории (Subject Category), таблица с квартилями (при наведении мышки на нужную ячейку высвечивается квартиль Q).

Оценка результатов эксперимента может также включать анализ причин возможных ошибок модели. Например, если модель допускает ошибки при классификации объектов определенного класса, можно проанализировать, какие признаки влияют на такие ошибки и попытаться улучшить модель, добавив новые признаки или изменяя параметры модели.

Поскольку результаты эксперимента могут быть зависимы от выбора данных для обучения и тестирования модели, а также от параметров модели, необходимо анализировать результаты с учетом этих факторов. Проведите ablation study (оценку качества каждого этапа предложенного подхода).

Шаг 4: Написание статьи

Можно действовать по такому алгоритму: 

  1. Выберите одну из последних работ по выбранной теме, которая была опубликована в одном из ведущих изданий и используйте ее структуру как образец для написания  собственной статьи.

  2. Добавьте тезисы для каждой части статьи (введение, методы, результаты, выводы).

  3. Напишите введение, в котором представите тему исследования и поставленную задачу. Иногда введение писать сложнее, чем описывать методы и эксперименты,  особенно для прикладных ML-специалистов. Поэтому можно введение и заключение  оставить «на потом».

  4. Опишите методы исследования и проведенные эксперименты.

  5. Проанализируйте полученные результаты.

  6. Сделайте выводы и предложите направления для дальнейших исследований.

Иностранные и российские научные журналы выставляют похожие требования к структуре научной статьи. 

Кратко пройдёмся по структуре научной работы:

Заголовок — название статьи должно вызывать интерес у читателей и четко отражать содержание статьи. Добавьте в название статьи ключевые слова. Не используйте абстракции, обобщения и кликбейт: «Исследование вопроса…», «Проблемы…», «Способен ли ИИ стать личностью…».

Аннотация — краткое содержание статьи на пять предложений (не больше 500 символов). В аннотации дайте информацию о решаемой задаче и цели статьи, опишите предложенный подход и дайте краткий вывод. Не должно быть цитирования литературы, общеизвестных фактов.

Ключевые слова — нужны для поиска работы в электронных базах научных статей. Список ключей состоит из основных терминов и словосочетаний, которые передают суть работы.  

Введение — обозначить предмет, объект, методы и гипотезы исследовательской работы. Необходимо кратко рассказать об основной идее статьи и научном вкладе, дать ссылки на предыдущие исследования. Объясните на верхнем уровне связь со всеми близкими направлениями.

Обзор литературы — теоретическая база или ядро исследования. Нужно изучить статьи, которые по этой теме уже опубликовали, систематизировать их результаты, указать недостатки, избавлению от которых посвящена новая статья. 

Методология — здесь следует поэтапно раскрыть весь процесс исследования. Если статья научно-практическая, нужно рассказать про опыты и эксперименты, этапы и промежуточные итоги. Неудачные опыты тоже стоит включить (привести причины, по которым опыт не удался, и способы исключения ошибок).

Результаты — в этом блоке статьи автор описывает результаты, которые получил в исследованиях. Результаты для прикладных работ должны быть в виде собственных аналитических, систематизированных статистических тезисов. А для теоретических работ важно доказательство теорем. По объему этот раздел занимает ключевое место в статье. Результаты нужно описывать полно и точно, чтобы читатель смог проследить за процессом исследования и оценить насколько выводы автора обоснованы. 

Цель раздела — с помощью анализа, обобщения и пояснения приведенных данных доказать гипотезу. 

Заключение — содержит краткие выводы результатов исследования, в сжатой форме повторяются все ключевые мысли основной части статьи. Тут нужно обобщить и суммировать результаты работы, сделать выводы и привести рекомендации. 

Список литературы — ссылки на материалы, которые цитируются или упоминаются в статье.

Статья должна соответствовать требованиям журнала «Доклады Российской академии наук. Математика, информатика, процессы управления», тогда редколлегия примет статью и опубликует в журнале. 

Шаг 5: Редактирование и публикация

  • Статью нужно написать объективно, логично и точно, нельзя допускать личные оценки и эмоциональные высказывания. 

  • Проверьте статью на наличие ошибок и опечаток. Можно использовать сервисы вроде Орфограммки или Главреда, но лучше обратиться в редакторское бюро или отдать корректору. Корректоры помогут сделать текст четким, последовательным и логичным, уберут словесный мусор и приведут статью к научному стилю.

  • Подайте научную статью на сайте AI Journey до 31 июля 2023 года (на сайте есть подробности участия). Участие бесплатное. Статью можно подавать на русском или английском, издательство делает перевод самостоятельно. 

Следуйте этому пошаговому руководству, чтобы написать научную статью по машинному обучению и искусственному интеллекту. Не забывайте, что важным элементом любой научной работы является оригинальность исследования и новизна результатов. Удачи, ученые!

Если остались вопросы, дополнительно можно изучить:

  • Видео: Разбор научной статьи

  • Рекомендации, как подготовить и написать диссертацию. Научная статья — более простой формат, но принцип подготовки тот же.

  • Моя первая научная статья: курс В.В.Стрижова в МФТИ.

Поиск и анализ литературы

На каждом шаге важно анализировать существующие научные статьи по выбранной теме. Можно использовать следующие базы научных статей:

  • Академия Google — ищет научные статьи во всех отраслях.

  • Scopus

  • Web of science

  • КиберЛенинка 

  • Научные журналы РАН

  • Elibrary

Проанализируйте полученную информацию и сделайте выводы. Оцените информацию на актуальность и отбросьте ненужные данные.

Источник: https://habr.com/ru/companies/sberbank/articles/748752/


Интересные статьи

Интересные статьи

Программирование является необходимым навыком для инженеров по автоматизации тестирования. Однако важно писать чистый код, который понятен и удобен в обслуживании. В этом посте я расскажу, что такое ч...
Привет всем, кто интересуется Канбан-методом, и кто хочет познакомиться поближе с одним из его инструментов – S.T.A.T.I.K.Задумка этой статьи появилась тогда, когда в очередной раз ко мне кто-то подош...
Всем доброго времени суток!Публикую обзор книги "Изучаем Python" от автора Марка Лутца.Стоит читать? Да! Почему? Опишу в статье.Python - хороший первый язык программирования, а это хорошая первая...
Этот материал рассчитан на людей, будущих программистов, которые только начинают разбираться в программировании под ОС Linux, или может быть долго были пользователями ОС Windows. Я попробую здесь пока...
Доброго времени суток. Сегодня хочу поговорить об интерфейсах в рамках языка C#. Обсудим, что они из себя представляют и для чего они нужны. Читать далее ...