Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
13 февраля 2024 года «Сбер» сообщил, что его нейросетевая GigaChat сдала экзамен по направлению подготовки «лечебное дело», необходимый для получения квалификации «врач-лечебник» в РФ, как и любой студент, окончивший 6 курсов медицинского вуза по федеральному государственному образовательному стандарту.
Нейросеть прошла тестирование и получила оценку 4, набрав 82% при пороге прохождения 70%. Экзамен принимала комиссия из профессоров терапии, хирургии, акушерства и гинекологии Института медицинского образования НМИЦ им. В.А. Алмазова.
Стандартный билет к устному экзамену содержал три ситуационные задачи по терапии, хирургии, акушерству и гинекологии, а также по 3–5 вопросов к ним («укажите предполагаемый диагноз», «составьте план лечения», «назначьте дополнительные обследования» и так далее). Также GigaChat прошёл тестирование, ответив на анкету из 100 вопросов.
«Нейросетевая модель GigaChat развивается очень быстро, осваивая всё новые области знаний. Мы с партнёрами по всей стране продолжим развивать цифровые решения и технологии для медицины и здоровья. Сегодня хотелось бы отметить роль и поблагодарить сотрудников Центра Алмазова, которые обеспечивают контроль за обучением модели и её валидацию. Первый этап — сдача экзамена на врача — пройден. Впереди новые задачи и открытие новых прикладных решений на базе существующих возможностей. В перспективе модель может стать основой для создания помощника врача и пациента, обеспечить новые условия для заботы и знания о своём здоровье для каждого человека и стать существенным подспорьем для клинициста в его повседневной практике. Применение больших языковых моделей и их последователей станет одной из ключевых технологий для развития человекоцентричного здравоохранения», — пояснил директор Центра индустрии здоровья «Сбера» Сергей Жданов.
«Проект по обучению большой языковой модели GigaChat медицинским знаниям на уровне выпускника медицинского вуза стал для Центра Алмазова большим вызовом. В проекте принимают участие несколько сотен преподавателей и научных сотрудников. Активно присоединились к работе ординаторы и студенты. Мы удовлетворены текущими результатами, и обучение модели будет продолжаться. Уже сейчас совместно со "Сбером" мы запланировали целую линейку прикладных решений для медицинских учреждений, пациентов и врачей на базе GigaChat, разработка которых начнётся уже в этом году», — рассказал генеральный директор ФГБУ «Национальный медицинский исследовательский центр имени В. А. Алмазова» Минздрава России, президент Российского кардиологического общества Евгений Шляхто.
Разработчики нейросети пояснили, что сдача экзамена моделью GigaChat — это результат эффективной совместной работы специалистов Центра индустрии здоровья «Сбера», НМИЦ им. В. А. Алмазова и команды GigaChat. Обучение алгоритма нейросети медицинским знаниям заняло полгода. В рамках подготовки к медэкзамену использовался датасет из 42 ГБ специализированной информации, в том числе учебно-методические материалы, рекомендованные для обучения студентов в медицинских вузах России, монографии, методические руководства, научные статьи и обезличенные медицинские данные. При этом модель не является врачом, полученные от неё рекомендации необходимо утвердить с лечащим врачом.
10 февраля 2023 года СМИ сообщили, что ChatGPT сдал медицинский экзамен United States Medical Licensing Examination (USMLE) на право работать врачом в США. Чат-бот успешно ответил на 88,9% вопросов и заданий теста из 350 медицинских задач при проходном пороге в 60%. В рамках научного исследования два практикующих доктора оценивали ответы ChatGPT, а расхождения в результатах теста рассматривались отдельно третьим экспертом. USMLE — это экзамен, который необходимо сдать, чтобы иметь право работать лечащим врачом в США и ряде других стран (Израиль, Новая Зеландия, Катар). Этот тест считается одним из самых сложных медицинских экзаменов в мире, а его сдача подтверждает высокий уровень знаний и компетенций начинающего врача, например для студентов высших курсов педиатрического направления или специалистов общей практики из других стран. Во время проверки ChatGPT выяснилось, что нейросеть предоставила «по крайней мере одно важное открытие» при установке диагноза, которое было «новым, неочевидным и клинически достоверным» в рамках своих правильных ответов.