Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
У меня тут возникло несколько смешных юридических коллизий с результатам работы нейросети. Я пошёл к юристу задавать тупые вопросы и получил традиционные ответы «кажется, что вот так, но это не точно».
Тупые вопросы вот:
- Кому принадлежат права на вывод LLM вроде ChatGPT? Оператору, модели, материнской компании?
- Если в выводе попадается кусок обучающей выборки, получается, модель меня конкретно подставляет и я внезапно становлюсь обладателем плагиата (привет, Озон, Copilot беспокоится, когда вы таску закроете). Что с этим делать?
- Если модель обучена на сценариях одного сценариста (статьях одного автора), идеально копирует стиль и форму, учитываются ли его права как-то?
- Когда Битлы спели новую песню полным составом, Пол Маккартни не возражал против такого обучения? Что делать с дипфеками в кино?
- Что делать с образом гражданки Скарлетт Йохансен, которая «снялась в порно» с использованием Stable Diffusion?
- Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя. Что делать в случае страйка от Ютуба?
- Как всё это работает в российском законодательстве и вообще по миру, какие практики есть?
Начнём с того, что в России чтобы использовать в деловых целях музыку или картинку для фильма, нужно исключительное право на эту музыку или картинку. Можно по неисключительной лицензии, что рождает неисключительное исключительное право. Я сейчас ужасно серьёзен, оно реально так называется. Примерно такая же логичность сейчас царит во всей отрасли после появления LLM и генеративок для звука и изображений.
Кто тут юрист
Дима Гриц юрист. Он не только лютый тролль и Джек Воробей для бизнеса, но ещё и грамотный специалист по авторским правам, входящий в консультационный совет Яндекса. Он сейчас в середине всей этой истории с правами на результаты работы моделей, и дальше я во многом опираюсь на его советы. Как всегда в случае юридических советов надо помнить две важные вещи:
- Во-первых, не бывает на 100% правильных, неправильных или однозначных мнений, всё решает конкретный суд в конкретном случае и в конкретной юрисдикции, и это вопрос вероятностей. Ещё FPR/FRR юриста зависят от того, насколько много есть правоприменительной практики. За генеративные сети пока толком не судились по вопросам исключительного права на результаты. Сейчас мы на берегу, и дальше по мере появления новых ситуаций будет всё понятнее, куда идёт дело в какой юрисдикции.
- Во-вторых, ни один в достаточной степени профессиональный юрист никогда ничего не скажет определённо, это всегда будет в обёртке из «моё оценочное суждение», «кажется, что», «…аргументируя тем, что …» и так далее. Они оперируют только вероятностями, потому что конечная инстанция — суд. В общем, это относится ко всему посту сразу. Кажется. По крайней мере, таково моё личное оценочное суждение.
Что такое авторское право и чем оно отличается от имущественного
Это дофига разные права, которые мало кто отличает.
Например, право авторства никак не даёт вам право использовать ваше же произведение.
Авторское право — это право авторства (вы можете подписывать, что вы это сотворили), право автора на имя (вы можете подписываться своим именем или псевдонимом), право на неприкосновенность произведения (чтобы его цитировали, а не переделывали), исключительное право на произведение и ещё всякие разные права. Оно возникает в момент окончания произведения, то есть когда вы уже закончили его создавать и начали любоваться.
Его не надо никак регистрировать или специальным образом обязательно депонировать. Вы закончили произведение в объективной форме (на бумаге, в файле) — право просто внезапно появилось. Другое дело, что четкий срок возникновения такого права может быть затруднительно доказать. Депонирование или отправка электронного письма самому себе нужно, если вы предвидите необходимость доказывать что-то, это просто гигиена. В России суды примерно одинаково воспринимают и то, и другое.
Право авторства в принципе невозможно передать или как-то забрать у автора, но можно передать исключительное право. Автором в России может быть только человек, поэтому никогда и никак авторское право (целиком) не может принадлежать компании.
Работает на практике так: сначала автор получает все права на использование своего произведения. Затем часть из них могут быть последовательно переданы — например, если трудовой договор, должностная инструкция и другие документы подразумевают, что вы пилите код для компании. В этой ситуации вы автор кода, в момент создания приобретаете исключительное право (это как раз право использовать) и тут же передаёте его компании. После этого вы можете всем говорить, что это ваш код и требовать указания авторства (по праву авторства и праву автора на имя, это неотчуждаемо в принципе), но не можете его использовать без разрешения правообладателя (вы передали исключительное, то есть у вас уже нет права на использование кодом). Исключительное право означает не только само использование, но и возможность запрещать использование другим. Это если исключительное исключительное, а не неисключительное исключительное.
Правообладатель уже имущественно распоряжается кодом как хочет, но обязан соблюдать ваши неотчуждаемые авторские права (на имя, например).
И даже тут на ровном месте без всяких LLM можно накосорезить только в путь. Например:
- В авторском праве никак не участвуют те, кто выполнял техническую работу, например, редактор или корректор. Потому что суды считают, что в этой работе мало «творческого труда». Соответственно, у редакторов с корректорами и не возникает исключительного права.
- В авторском праве никак не участвует тот, кто разработал и создал инструменты для реализации произведения. Например, фотоаппарат, печатную машинку или софт для вашей работы. Аналогично, у них не возникает исключительное право.
- Если произведение не имеет чёткой точки окончания, то возникает масса странностей. Самое лютое — код бекэнда с кучей патчей и версий: кто-то считает моментом возникновения промежуточный релиз, кто-то мажорный, кто-то коммит, кто-то — локальное сохранение кода, кто-то — написание осмысленной строки.
- Если произведение сложное с кучей авторов, то в зависимости от архитектуры это либо одно большое произведение с коллективом авторов, либо куча маленьких, на базе которых делали производные, а на базе их ещё производные, которые привели к итоговому производному. Это, например, про написание книг, статей и ту же разработку софта группой ограниченных лиц.
- Авторское право не касается животных, божественных сущностей и механизмов, действующих случайным образом (независимо от художественной задумки). Если вас сфотографировала свинья, это либо ваша картинка, либо случайным образом созданная (общественное достояние), но не свиньи.
Чья художественная задумка?
Следующий важный тезис, который не все понимают — авторское право защищает не сам контент (содержание) произведения, а форму, в которое оно создано.
То есть если вы сфотографировали гору, гражданку Скарлетт Йохансен или Спасскую башню Казанского кремля, авторское право покроет не что вы сфотографировали, а как. Две разных фотографии фотографов одного и того же объекта реализуют две разных творческих идеи и возникает два разных объекта авторского права, что создать два исключительных права на два произведения – по одному для каждого автора и его фотографии.
Вот лютейший пример: два фотографа с разных точек (один сидел далеко с длинным объективом, второй ближе) сняли один и тот же момент, а потом весело разбирались, почему один стырил фотографию другого. На деле — это два разных объекта права.
В целом важна художественная реализация, а не содержимое. В России вообще не охраняются авторским правом идеи, концепции, принципы, методы, открытия, системы, способы и прочее. Если вы написали сценарий фильма или статью, а их кто-то глубоко отрерайтил другими словами — это новый объект авторского, в том числе исключительного права. Да, в этом есть некоторая несправедливость, потому что именно так и воруют сценарии. По этому поводу возникают регулярные суды на тему «у нас такая же структура, такие же персонажи и такие же последовательности», но они заканчиваются обычно ничем в России — и чууууть чаще признаются похожими до степени смешения в США, где мощное лобби гильдии сценаристов.
Ещё крутой пример: фотограф-урбанист для своей книги идёт снимать здание в Москве с дрона. У него нет своего дрона, он просит его у друга. Друг говорит, что дрон дорогой, летать страшно, он его будет технически пилотировать, а урбанист будет командиром воздушного судна, он будет направлять камеру и выстраивать композицию. Джойстик в руках у пилота, видеовывод на планшет — у урбаниста. Урбанист отдаёт команды по тому, как повернуться, сдвинуться и выстраивает кадр. Кнопку на пульте нажимает пилот. Внимание, вопрос: кто автор произведения?
Ну и ещё важен случай селфи павиана. Мужик по имени Дэвид Слейтер поставил в лесу свой фотоаппарат на штативе с пультом. К нему подошла обезьяна и сделала несколько прекрасных селфи. Слейтер считает, что художественная задумка фотографии принадлежит ему, потому что он создал все условия для фото.
«Это было моё мастерство и моя идея оставить их, чтобы они поиграли с камерой, и это всё было в моём поле зрения. Я знал, что обезьяны с большой степенью вероятности это сделают, и я это прогнозировал. Я знал, что есть вероятность того, что будут сделаны фотографии»
Вот подробности этой истории. Холивары не утихают до сих пор. Коротко — автор тут обезьяна, но авторство на животных в той юрисдикции (как и в России) не распространяется, поэтому фотография без автора появилась сама и сразу переходит в общественное достояние.
Интересная практика есть, например, в Великобритании, где произведения созданные компьютером без человека-создателя. Автором CGW становится лицо, предпринявшие меры, необходимые для создания произведения.
Возвращаемся к LLM и генеративкам
Исходя из логики выше, базово можно считать софт для создания чего-то инструментом. Например, права на произведения фотографов не принадлежат Adobe из-за их Фотошопа, а права на фотографии, снятые на айфон, не принадлежат Apple. Хотя, конечно, многие компании бы хотели. Это достаточно базовая концепция, принятая во многих юрисдикциях, и в том числе в России.
Автором в случае того же ChatGPT является оператор.
Одна из версий, что объектом авторского права можно считать промпт, созданный при создании произведения. Потому что «творческий труд», отличающий значимое произведение от обычной генерации на основе бреда отличает именно промт. А, значит, умение этот самый промт правильным образом писать помогает авторам создать более точное произведение.
То есть если вы задали промпт и получили вывод, то в результате работы инструмента у вас возникает авторское право на вывод. При этом вы не можете сходу брать и полноценно использовать сгенерированный результат, потому что давайте разбираться с исключительным правом.
Мы не считаем ChatGPT физлицом, несмотря на все заявления про то, что он интеллект.
При этом дополнительные ограничения может накладывать лицензионное соглашение с этим инструментом. И они, чаще всего, и накладывают такие ограничения. В EULA никто не мешает прописать передачу имущественных прав владельцам инструмента; не нравится — не акцептируйте EULA. И это очень важный момент: что сейчас ранняя эра пользования генеративными сетями, поэтому чаще всего конкретный инструмент в своем пользовательском соглашении может сказать «для некоммерческого использования и обязательным указанием, что это сгенерировано таким-то сервисом». Это будто мы в 1998 году и на фотографии автоматически пишется оранжевое KODAK.
Потом рынок поправит ситуацию и производители фотоаппаратов перестанут иметь наглость получать бесплатную дополнительную рекламу. Так, скорее всего, будет и с инструментами генеративных сетей.
Сейчас ситуация такая: каждый может использовать сгенерированный объект интеллектуального права любым незапрещенным способом, если использующий будет соблюдать пользовательское сообщение сервиса.
Как доказывать возникновение права? Ну, пока практика — скриншот соглашения на момент генерации. То есть как права обрабатывались в момент создания произведения, так оно и должно в итоге работать. Например, если вы генерируете музыку, и на момент её окончания её генерации в EULA написано, что обычные пользователи передают произведения в общественное достояние или могут использовать некоммерчески, а платные пользователи могут использовать как хотят и права принадлежат им — это значимо. Скриншот с понятной датой платного тарифа, документ про оплату и скриншот или документ в вебархиве лицензионного соглашения делает вас более-менее уверенным правообладателем. Хотя на практике, конечно, нифига подобного.
Вот небольшая сводка на самое начало года, как это выглядело у разных сервисов.
Что тогда с порно с образами, натренированными на чьих-то фото? А если ваших?
Опять же, базовая идея такая: авторским правом защищается форма. Идея, концепция, инструкция и так далее — не защищается.
Что вы можете сделать — уйти из области авторского права и защититься иначе. Например, адекватно защищается товарный знак, запатентованное изобретение или промышленный образец.
Если вы изобрели иммерсивное шоу «Комната страха», то не сможете защитить идею, любой другой сможет делать похожее иммерсивное шоу. Но вы можете защитить конкретные визуальные образы, конкретные промышленные образцы реализации разных декораций и костюмов но, если там был какой-то удивительно интересный сценарий, то защитить его сущностно не получится. Сразу скажу, в случае иммерсивного шоу практического смысла ничего из перечисленного кроме защиты названия товарным знаком обычно не имеет.
Этот рынок работает так: создается сценарий, как можно быстрее ставится постановка: репетиции, подготовка костюмов, сезон организаторы дают это иммерсивное шоу, а на следующий сезон та же самая гонка, но уже с другим сценарием.
Теперь про изображения людей. Если вы сфотографировали гражданку Скарлетт Йохансен как основной объект изображения, то авторское право на фотографию может и ваше. Но сам факт изображения человека на фотографии может быть проблемой. Есть конфликт по 152.1 ГК РФ.
- Если вы сначала спросили гражданку, можно ли её сфотографировать и объяснили цель использования, а она подписала вам согласие на использование её изображения — её мнение после письменного согласия уже никого не волнует, у вас с правами всё в порядке.
- Если вы заплатили гражданке за съёмку или она подписала договор модели — аналогично.
- Если гражданка согласилась на фото для соцсетей, а вы вывесили баннер с ней на Павелецкой — это неправомерное использование, но нарушается тут не авторское право, а право на изображение гражданина.
- Если гражданка зарегистрировала свой образ как товарный знак, вы стремительно влетаете в другую область права, где нельзя просто так повторять визуальные образы. Ярчайший российский пример — фото со Ждуном, образ которого правообладатель зарегистрировал именно так – в качестве товарного знака. В итоге одна клиника провела конкурс для рожениц про фотографии с этим прекрасным персонажем, а потом пришли юристы и знатно накрячили всех этих самых рожениц. Точнее, в итоге всё же клинику.
То же самое касается случаев, когда вы не сфотографировали эту самую гражданку, а нарисовали. То есть, очень грубо, обсуждается не то, насколько точно вы повторили её образ, а то, насколько делали именно её. Не важно, как у вас получилось, важно, какой у вас был мотив.
Это значит, что если вы нашли её двойника, сфотографировали для рекламы бургерной и разместили на здании, а гражданка Йохансен обратилась с претензией, то проблемы не будет. Вот двойник, вот её письменное согласие, ну и что, что изображение полностью совпадает — это другой человек. Аналогично выглядит логичным, что если вы создали промпт, опирающийся на образ граждански Йохансен — вы рисовали её. Если промпт визуально описывает её по принципу фоторобота, но не содержит упоминания, что это она, то, в теории, вы должны отмахаться в суде. В теории.
Пропмт: Completely not Scarlett Johansen
Дипфейк — это использование чьего-то образа. Художественное произведение ваше, автор вы, а вот само право использовать образ — под вопросом.
Относительно кода: если вы скопировали выдачу ChatGPT, то добросовестно использовать, в теории, можно, но важно — по правилам, установленным сервисом и локальными актами.
То есть выдавать за написанный собственноручно (при том, что вы всё ещё остаётесь автором) нельзя. Если в компании есть правила труда, касающиеся использования LLM — надо следовать и им. Кстати, если нет, то стоит написать. Из того, что я знаю, 3 из 4 компаний обычно разрешают использование, но хотят знать, что, когда и как было сгенерировано.
Теперь про нарушение исключительного права. В российской практике если вы добросовестны, вам с высокой вероятностью присудят минимальный штраф. Диапазон там за нарушения исключительного права от 10 тысяч рублей до 5 миллионов рублей по 1301 ГК РФ.
…в случаях нарушения исключительного права на произведение автор или иной правообладатель наряду с использованием других применимых способов защиты и мер ответственности, установленных настоящим Кодексом (статьи 1250, 1252 и 1253), вправе в соответствии с пунктом 3 статьи 1252 настоящего Кодекса требовать по своему выбору от нарушителя вместо возмещения убытков выплаты компенсации:
1) в размере от десяти тысяч рублей до пяти миллионов рублей, определяемом по усмотрению суда исходя из характера нарушения;
2) в двукратном размере стоимости контрафактных экземпляров произведения;
3) в двукратном размере стоимости права использования произведения, определяемой исходя из цены, которая при сравнимых обстоятельствах обычно взимается за правомерное использование произведения тем способом, который использовал нарушитель.
Сумма компенсации устанавливается по усмотрению суда исходя из характера нарушения. Там очень важна добросовестность и прочие сопутствующие обстоятельства. Всякие аспекты типа того, что в промпте, знали вы или нет, что это похоже на помянутую гражданку, писала ли вам гражданка до судебного иска, послали ли вы её на три буквы в ответ или вежливо ответили и так далее.
Что с узкими обучающими выборками?
Можно взять сценарии конкретного сценариста и натренировать модель писать точно такие же, только другие. Можно взять фотографии фотографа или рисунки художника и натренировать модель генерировать такие же, только другие. И так далее. Вот тут пост, как половину рассказов в книге написал автор, а половину — модель, обученная на его текстах.
Авторский стиль не защищается, увы. Если документы размещены в общем доступе (а сценарии и фотографии часто размещены), то владельцы моделей говорят, что нет ничего страшного в обучении, а сценаристы воют. В этом, коротко, суть недавнего конфликта.
Сценаристы хотят получать отчисления с LLM на всех за то, что модель сделала сценарий. Потому что она училась на них всех. Это примерный аналог «налога на болванки».
На стороне датасатанистов довод о том, что вообще-то человеческая нейросеть (которая в мясном мозге) способна прочитать все сценарии конкретного человека и написать, мимикрируя под него. Что есть художники, специализирующиеся на подделках: они обучаются на работах художника и создают точно такие же, только другие.
То есть сейчас всё то же самое можно сделать без инструмента — почему это должно быть недопустимо с инструментом?
На стороне творческих людей тот факт, что всё наступило слишком внезапно, и если бы они знали, то ставили бы флаг «нельзя использовать для обучения нейронных сетей» на свои произведения. Но слишком поздно. В итоге по их версии должен вмешаться регулятор, сказать, что изменения действительно очень значимые и задним числом запретить обучение, а все имеющиеся результаты заставить удалить. Ну или хотя бы запретить учиться в будущем.
Альтернативное требование — чтобы все результаты генерации передавались сразу в общественное достояние.
Сильнее всего это коснулось на текущий момент актёров и сценаристов. Актёры выкладывали свои фотографии в общий доступ, их можно использовать для обучения нейросети и делать дипфейки — а через пару лет и полные цифровые копии. То есть если вы хотите, чтобы у вас играл кто-то с внешностью известного актёра, не проблема.
Вот почему сейчас те, кто успел хоть как-то оприходовать датасеты, будут на коне — есть шансы, что дальше доставать данные для обучения будет всё сложнее и сложнее.
Что делать с регулированием?
Пока вообще непонятно.
С одной стороны, когда по открытым данным для других целей бродят роботы и, по сути, изощрённо пиратят контент (ну или могут это делать) — это может кого-то напрячь. С другой стороны, новой устоявшейся этики про такое ещё нет.
Вероятно, нужна лицензия, аналогичная «свободное некоммерческое использование» — «свободное использование без права обучения».
А на сегодня это всё. Если что, канал Димы Грица вот, а наш, где мы занимаемся всякой фигнёй вот такого типа — ряды Фурье. Вступайте в ряды Фурье!