Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Во многих больницах, работающих по ДМС и просто оказывающих платные услуги населению напрямую, существует своеобразный «план продаж» на каждого практикующего врача. Выполнение этого плана зачастую достигается недобросовестными путями за счёт застрахованных по ДМС. К примеру:
- Комплексные услуги разбиваются на составляющие врачебные манипуляции так, чтобы чек был больше.
- Назначаются избыточные процедуры и исследования при лечении диагнозов — особенно, если в больнице совсем недавно закупили новое оборудование.
Такие злоупотребления — огромная статья убытков для страховых компаний в секторе добровольного медицинского страхования (ДМС), которые и так находятся в условиях жёсткой конкуренции и вынуждены всё больше расширять программу страхования для привлечения клиентов. Поэтому с их стороны есть врачи-эксперты, занимающиеся регулярной проверкой счетов. А в случае выявления нарушений — проведением так называемой «профилактики» в лечебно-профилактических учреждениях.
Все это — долгая и рутинная работа, требующая от эксперта предельной концентрации. Ведь на правомерность оказания услуги влияет целый ряд факторов, связанных как с историей лечения пациента и его программой страхования, так и с особенностями прайс-листа в больнице. Естественно, везде, где вы видите слово «рутина» можно применить автоматизацию. Что мы и сделали. Не без сложностей.
Что такое неправомерные услуги
Недавно я в очередной раз пришла в поликлинику по соседству с офисом, чтобы получить услуги по полису ДМС. Воспалённая родинка — это почти всегда не страшно, но наблюдение дерматолога не помешает (а то мало ли что).
Всё оказалось в порядке, но сделать профилактический осмотр остальных родимых пятен, которые являются бессменным источником моей ипохондрии, врач отказалась. Сослалась на то, что такие услуги не входят в полис и при следующей проверке эксперта со стороны страховой компании её оштрафуют. Врач была права: страховым случаем по программам ДМС, как правило, является острое заболевание или обострение хронического заболевания. Все эти случаи не предусматривают осмотра в целях профилактики, как бы мне этого ни хотелось.
Но далеко не всегда врачи из лечебно-профилактических учреждений (или сокращенно ЛПУ) хорошо знают правила оказания услуг по ДМС и ещё реже сознательно их соблюдают. В итоге врач-эксперт, проверяющий счета после лечения застрахованных, может увидеть, к примеру, что-то подобное:
Счёт из ЛПУ |
|||
Наименование услуги |
Стоимость |
Пациент |
Дата |
Массаж шейного отдела позвоночника |
700 руб. |
Иванов И. И. |
01.01.2019 |
Массаж грудного отдела позвоночника |
700 руб. |
Иванов И. И. |
01.01.2019 |
Прайс-лист ЛПУ |
|
Наименование услуги |
Стоимость |
Массаж шейного отдела позвоночника |
700 руб. |
Массаж грудного отдела позвоночника |
700 руб. |
Массаж шейно-грудного отдела позвоночника |
1 000 руб. |
Кстати, обязательно проверьте, что происходит в вашем счете, если вы сами пользуетесь платной медициной. Возможно, комплексы набираются примерно похожим образом.
Счёт из ЛПУ |
|||
Наименование услуги |
Стоимость |
Пациент |
Дата |
Снятие твёрдых зубных отложений с помощью ультразвука |
3 000 руб. |
Иванов И. И. |
01.01.2019 |
Снятие мягких зубных отложений аппаратом Air-flow |
2 000 руб. |
Иванов И. И. |
01.01.2019 |
Полирование зубов фтористой пастой |
500 руб. |
Иванов И. И. |
01.01.2019 |
Почти всегда в ЛПУ есть услуга «Комплексная гигиена полости рта», в которую по технической карте уже входят все манипуляции с вашими зубами. По правилам именно её и должны указать в счёте. Но если комплекс окажется дешевле, чем полный перечень, то в ЛПУ, скорее всего, сделают всё наоборот в надежде, что страховщик ничего не заметит.
И это ещё простые случаи. Разбираемся дальше.
Предположим, у вас есть ребёнок, и вы привели его к врачу с подозрением на вирусный конъюнктивит. Как и при лечении любого другого заболевания, врач должен руководствоваться клинической практикой и нормативной документацией. К примеру, Стандартом медицинской помощи — это что-то вроде таблицы с перечнем обязательных услуг для диагностики и лечения определённого заболевания. Спойлеры к лечению вашего предполагаемого чада можно почитать прямо на сайте Минздрава.
Тем не менее, помимо обычного набора услуг на оплату, в страховую может попасть это:
Счёт из ЛПУ |
|||
Наименование услуги |
Стоимость |
Пациент |
Дата |
Пневмотонометрия глаза |
500 руб. |
Иванов И. И. |
01.01.2019 |
С чего мы начали
Мы задались целью автоматизировать этап проверки счетов от ЛПУ для врачей-экспертов в одной страховой компании (все имена, пароли и явки нам не позволяет разглашать NDA). План был таков: с помощью моделей машинного обучения найти и «подсветить» в реестре счетов услуги, похожие на ранее выявленные неправомерные.
Чтобы научить машину отличать «плохие» услуги от «хороших», нужны данные о том, как лечат застрахованных и какие услуги эксперт убрал или заменил в счёте после проверки. Открыв реальные счета, мы вдруг столкнулись с тем, что получить внятную статистику оказания услуг каждого типа почти невозможно. Оказалось, что в ДМС нет определённого стандарта для наименования медицинских услуг в отличие от ОМС, где всем услугам будет строго соответствовать код по Номенклатуре работ и услуг в здравоохранении.
К примеру, один из методов профессиональной гигиены в ДМС могут писать так:
- Бикарбонатная чистка.
- Снятие налёта аппаратом Air-flow.
- Процедура пескоструйной очистки зубов.
Эти услуги тоже по своей сути ничем не отличаются:
- RG лёгких.
- Р-графия грудной клетки.
- Диагностическая рентгенография ОГК.
Ситуация усугубляется тем, что счета нередко заполняются вручную, а это только увеличивает вариативность написания услуг за счёт опечаток, лишних пометок и сокращений. Вот некоторые примеры таких «ребусов»:
механическая и медикаментозная обработка одного корневого канала.
внутривенная капельница.
В итоге понять, как оказывали одну и ту же, по своей сути, услугу в разных регионах или даже в разных ЛПУ вашего города, почти невозможно без классификации наименований (и применения технологий текстовой аналитики).
Мы вооружились инструментом SAS Visual Text Analytics и для начала провели тематический анализ текстов с помощью машинного обучения и технологий NLP. Это помогло автоматически выделить в большом и разнообразном массиве услуг так называемые «тематики» — небольшие группы текстов, которые система посчитала схожими на основе сочетаний ключевых слов. Все результаты мы просмотрели вместе с экспертами и наметили структуру будущего классификатора, объединив получившиеся «тематики» в большие классы по медицинской логике (например, в «Диагностику», «Приёмы врачей» и т. п.). Чтобы соотнести наименования услуг из обучающей выборки с получившимися классами, для каждого из них мы написали правила в нашем инструменте.
Эту последовательность шагов мы повторяли для каждого последующего класса ровно до тех пор, пока не пришли к уровню детализации до конкретных услуг. Так, например, выглядит упрощённое правило для метода профессиональной гигиены из примеров выше:
(OR,
"*бикарбонат*",
"*пескоструйн*", "*порошкоструйн*",
(ORDDIST_1, "a", "f"),
(DIST_2, "air*", "*flow"),
(DIST_2, (OR, "аэр*", "аер*", "эйр*"), "*фло*"),
(DIST_3, "метод*", "возд*", "полир*"),
(DIST_2, (OR, "струйн*", "воздушн*"), "*абразив*")
)
Зачем всё это нужно? И почему мы пошли таким сложным путем, вместо того чтобы просто засунуть все в нейронную сеть?
Естественно, никакой размеченной выборки для обучения у нас не было. Но ещё большим препятствием является сама специфика предметной области: из-за отсутствия жёстких требований к составу услуг в ДМС регулярно возникают исключения и сложные пограничные случаи, которые врачи-эксперты из разных страховых трактуют по-своему. Все эти тонкости правила позволяют описать гораздо точнее.
К примеру, здесь ключевые слова одинаковые, но в зависимости от их порядка суть услуги меняется целиком:
тут подразумевается пломбирование зуба.
а это дорогостоящая ортопедическая манипуляция (которая, к слову, редко оказывается по программам ДМС).
Как мы обучали модели
В машинном обучении отлично действует правило «ты то, что ты ешь». Если «скормить» в модель некачественные данные, то результат будет таким же. На наших проектах мы уделяем большое внимание этапу подготовки данных. Особенно это актуально в области ДМС: страховщик получает информацию о лечении пациентов от многочисленных ЛПУ, в каждом из которых ведётся собственная база. Соответственно ошибка может закрасться как при заполнении счёта на стороне лечебного учреждения, так и при его загрузке в БД страховой компании. В итоге при исследовании данных нам встретились и полторы услуги в счёте, и отрицательные цены, и внезапная смена пола пациента.
Продумав подход к исправлению ошибок, мы приступили к сбору показателей для моделирования. Нас интересовала самая разная информация, описывающая контекст оказания услуги: параметры самой услуги, её суть, история взаимодействия с ЛПУ, история лечения застрахованного и многое другое. Всего мы насчитали более 20 тыс. показателей. Их мы и использовали для обучения модели, которая автоматически выявила закономерности, характерные для «плохих» услуг.
Затем применили модель к новым счетам и напротив каждой медицинской услуги проставили балл от 0 до 1. Он показывает, насколько данная услуга похожа на ранее выявленную неправомерную: чем ближе балл к 1, тем это сходство больше. На самом деле за этой цифрой стоит сложный и не всегда очевидный для человека процесс принятия решений (как это чаще всего бывает в машинном обучении). Если попытаться интерпретировать логику работы машины, то в упрощенном виде она выглядит так:
- Услуга относится к классу «Комплексная гигиена полости рта» (+ 0.01 балла).
- Предыдущая услуга относится к классу «Снятие зубных отложений» (+ 0.25 балла).
- Стоимость текущей услуги — более 3 000 рублей (+ 0.1 балла).
- Услуга оказана в филиале г. Краснодара (+ 0.05 балла).
- ….
Если в результате балл оказался выше определённого порогового значения, то это сигнал для эксперта, что услуга данного пациента требует особого контроля при проверке. С этого момента начинается детальное расследование инцидента, в конце которого врач-эксперт выносит свой окончательный вердикт — «казнить» или «помиловать». Не пациента, конечно, а услугу в счёте.
Итоги проекта
Методология стандартизации наименований с помощью технологий текстовой аналитики SAS помогла собрать единый классификатор услуг (что было огромной проблемой до этого для автоматизации), а определение услуг, похожих на ранее выявленные неправомерные, было реализовано с помощью моделей машинного обучения. По итогам внутреннего тестирования системы мы убедились в том, нам удалось выявить наиболее частые виды ошибок в счетах, а именно: включение дополнительных услуг, отступление от страховой программы или стандартных схем лечения.
Но всё это — только первый шаг к автоматизации в ДМС. Если у вас остались вопросы или вы очень хотите знать, что ещё мы умеем делать, — ищите нас здесь.