Нейросеть выносит судебные решения: американский и немецкий подходы

Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!

«Судья удалился в свой кабинет и сел в кресло за письменным столом. Там он с помощью штепселя под мышкой подключился к компьютеру…»

Ф. Чиландер, рассказ «Судебный процесс»

Технологии больших данных и их анализа сейчас интегрируются практически во все сферы деятельности: от таргетированной рекламы и алгоритмов предложки Netflix, до умных систем снижения потребления энергии дата-центрами и сокращения выбросов вредных отходов в атмосферу. Добрался тренд и до такой консервативной и традиционно человеко-бумажной сферы как правосудие. Министерства юстиции всех стран начали активно думать над тем, как использовать новые технологии для оптимизации судебной системы и решения извечной проблемы загруженности судов (проблема общая для всех стран — достаточно почитать научную аналитику или простые отзывы в Google.Maps и Яндекс.Карты).

Особое внимание Фемида обращает на прогнозную аналитику, которая образовала костяк новой концепции предиктивного правосудия. Полицейским такие алгоритмы позволят выделить в режиме реального времени места наиболее вероятного совершения преступлений и улучшить модель патрулирования.

А вот для судей предполагается еще больший спектр возможностей. Алгоритм может дать прогноз относительно того, с какой вероятностью подсудимый совершит в будущем новое преступление (рецидив) — на основе этой информации судья сможет точнее определить стоимость выпуска его под залог или размер назначаемого ему наказания. ИИ также сможет посчитать, какое в среднем наказание назначается преступникам при аналогичных обстоятельствах — и дать соответствующую рекомендацию судье, чтобы тот видел «золотую середину».

Воплощение этих идей требует вдумчивого подхода к подготовке и выборке данных. На вопрос о том, чем кормить судебные нейросети, США и Германия дают разные ответы.

США: используем данные об уже осужденных

Американцы предлагают обучать нейросети на выборках статистических данных об уже осужденных лицах. Уже двадцать лет в США все осужденные заполняют многостраничные анкеты с вопросами об их прошлом, окружении, образовании и семейной жизни. Все эти анкеты собираются и обрабатываются в рамках проекта «Переработанная оценка уголовно-исполнительной инспекции» (Level of Service Inventory-Revised, сокр. LSI-R).

Далее эти данные структурируются в две группы. Первая группа – криминальная история. В нее входят собранные сведения о предыдущих арестах осужденных, их судимостях, неявках в суд, преступлениях, совершенных после отсидки и т.д. Вторая группа – социально-демографические характеристики: возраст, пол, занятость, резидентство и гражданство осужденных.

Нейросеть ищет как внутригрупповые, так и межгрупповые корреляции. На основе этих корреляций впоследствии делается прогноз совершения конкретным лицом преступления в будущем (рецидива). Отсюда и название таких алгоритмов — recidivism models. Представим знакомую сцену из американских сериалов-процедуралов: перед судьей предстает белый мужчина средних лет, одинокий бухгалтер, обвиняемый в мошенничестве. Пропустив его данные через программу, судья видит результат: риск того, что такой человек совершит преступление повторно очень низок, соответственно, ему можно назначить наказание «по нижней планке». Конечно, это грубый пример — предполагается, что алгоритмы смогут сориентировать судей и в более сложных ситуациях, когда по человеку и преступлению оценить риск очень сложно.

Иными словами, при разрешении конкретного дела алгоритм будет рекомендовать применять такой размер наказания, при котором у людей, обладающих сходными характеристиками с подсудимым, был зафиксирован минимальный риск совершения рецидива.

Recidivism models уже применяются в 24 штатах США. Их рекомендации, однако не носят для судей обязательного характера, они вправе использовать их как дополнительного помощника, принимая решение самостоятельно.

С одной стороны, американский подход выглядит логичным: алгоритм может учесть больше факторов, чем судья, да и опирается только на статистический данные. Судья же может подсознательно симпатизировать парню, напоминающего его самого в юности, или, наоборот, чувствовать антипатию к женщине-подсудимой, похожей на ненавистную ему тещу.

С другой стороны, существуют и очевидные минусы. Так как первоначальная выборка данных ограничивается только осужденными, анализ не будет учитывать показатели нераскрытых преступлений и преступлений, которые хоть и были совершены, но не были известны полиции (т. н. латентные). Более того, по одним категориям преступлений полиция может более активно упекать за решетку определенную группу людей (например, афроамериканцев за наркоторговлю), чаще игнорируя совершение этих же преступлений другими лицами. Согласитесь, это уже серьезно отражается на точности прогноза.

Еще одна проблема заключается в том, что при определении критериев выборки и обработки данных необходимо находить баланс между прагматизмом программиста и высокими моральными требованиями правосудия. Главным образом это касается темы дискриминации. Так, в результате независимого анализа программы прогноза криминального рецидива «COMPAS» (Correctional Offender Management Profiling for Alternative Sanctions) было установлено, что программа в качестве входных параметров учитывает расу: осужденным афроамериканского происхождения она рекомендует назначить более длительные сроки наказания.

Можно справедливо отметить: что поделаешь, если афроамериканцы статистически совершают преступления чаще? Неужели нейросеть должна просто игнорировать такой параметр? Зачем тогда она нужна, если мы заранее ограничиваем таким образом ее точность? Однако обратная сторона монеты означает согласие ровнять всех под одну гребенку: алгоритм всегда будет оценивать человека через призму поступков похожих на него людей. Справедливо ли это? Возможно, лучше отказаться вообще от идеи recidivism models?

Германия: судебные акты как источник Big Data

Пока американские системы берут за основу статистические данные об уже осужденных людях, немцы рассматривают решения своих судов в роли обучающего материала для нейросетей. Немецкие суды очень скрупулезно и точно описывают все свои выводы в приговорах, поэтому идея проста — извлечь все параметры/выводы из судебных актов, сформировав массивы больших данных, сделать выборки и приступить к обучению ИИ.

Именно в таком ключе реализуется проект Smart Sentencing Лаборатории Legal Tech Кёльнского университета, осуществляемый при технической поддержке Института интегральных схем общества Фраунгофера.

Основная идея немцев заключается в том, чтобы унифицировать размеры наказания, применяемые разными судами. То есть алгоритм на выходе должен давать судье среднее значение наказания, которое назначили его коллеги человеку со схожими характеристиками за аналогичное преступление. В большинстве случаев речь идет о штрафе, который в Германии применяется как наказание в 70-80% процентов случаев.

Плюс такого подхода также очевиден: никто не останется доволен юстицией, узнав, что парень, укравший у него велосипед получил 2 000 евро штрафа, а его подельник, укравший велосипед соседа, — всего 1 600 евро.

Однако технически такое решение реализовать сложнее: если у американцев данные уже преподносятся в почти готовом виде по проекту LSI-R, то немцам приходится создавать трудоемкую систему экстракции данных из судебных приговоров. Более того, такая система будет зависима не от более-менее объективной статистики, а целиком от самих судей: наметится тренд на ужесточение наказания – он тут же отразится на работе алгоритма. Это, кстати, делает немецкий подход «сугубо немецким»: если применить такие системы в странах с низким количеством оправдательных приговоров и высокими сроками наказания, то оправданий и послаблений в наказаниях не произойдет — алгоритм будет поддерживать состояние системы, полностью зависимый от нее. Да и гарантии того, что ИИ не станет дублировать те же предрассудки судей, также отсутствуют.

Американский прагматизм и немецкое качество

Подходы к прогнозному анализу данных в юстиции сильно отличаются. Американцы прагматично строят свои модели на основе статистических данных, собираемых с тюрем. Немцы уповают на качество своих приговоров и непогрешимость судей. Обе концепции не идеальны и порождают множество вопросов, главный из которых: применим ли вообще анализ больших данных к реальным людям в рамках рассмотрения уголовных дел?

Сколько пройдет времени от более длительных сроков латентным рецидивистам до предотвращения преступлений в стиле «Особого мнения»? Скотт Гэллоуэй в книге «Большая четверка» считает, что не так много, если Google обяжут передавать данные поисковых запросов правительству.

Источник: https://habr.com/ru/company/timeweb/blog/652963/

Вернуться к списку

Интересные статьи

Британский и американский английский – какой язык учить? Увлекательные истории из жизни слов

Какой английский учить – британский или американский? Если назвать брюки trousers, поймут ли американцы, что я имею в виду? Елена Рабинович преподает английский язык разработчикам в ЕРАМ уже 5 лет и ч...

Нейросеть GPT-3 вела мотивационный блог на английском и всем понравилось. Чем это грозит копирайтерам и писателям

Компания OpenAI, которую несколько лет назад основал Илон Маск, в июне выпустила новый алгоритм нейросети GPT-3. На сегодня это самая совершенная система, которая умеет работать с...

Как понять, что нейросеть решит вашу проблему. Прагматичное руководство

Haystacks at Sunset Reimagined by AshnoAlice Инженер по машинному обучению Джордж Хосу задает вопрос: «Какие проблемы решает машинное обучение?». Или конкретнее, с учетом современн...

История пленочных форматов: немецкий ответ компакт-кассетам

Мы уже рассказывали о Fidelipac, Stereo-Pak, Stereo 8 и RCA Sound Tape. Все они были разработаны в Америке. Но аналогичными проектами занимались и европейские компании. Сегодня мы расскажем ...

Автокэширование в 1с-Битрикс — сложно о простом

Автокэширование в 1с-Битрикс — хорошо развитая и довольно сложная система, позволяющая в разы уменьшить число обращений к базе данных и ускорить выполнение страниц.