Художница нашла фотографии на сайте под названием Have I Been Trained, позволяющим художникам увидеть, есть ли их работы в наборе данных искусственного интеллекта LAION-5B. Однако вместо того, чтобы производить текстовый поиск на сайте, женщина загрузила свою недавнюю фотографию, воспользовавшись функцией обратного поиска изображений на сайте. Она была удивлена, когда обнаружила набор из двух снимков своего лица, которые были разрешены для использования только врачом. Это подтверждает форма разрешения, которую Лапин опубликовала в Твиттере.

Интересно Искусственный интеллект принес Франции 10 миллионов евро, следя за частными бассейнами

Что известно

Лапин страдает генетическим заболеванием, из-за которого в 2013 году должна была пройти через несколько операций на лице, полости рта и челюсти.

Эти фотографии – из моей последней процедуры у этого хирурга,
– говорит женщина.

По словам Лапин, хирург, владевший медицинскими фотографиями, умер от рака в 2018 году, и она подозревает, что после этого они каким-то образом покинули его кабинет. Художница называет эту ситуацию "цифровым эквивалентом получения украденного имущества".

Кто-то украл изображения из файлов моего умершего врача, и они оказались где-то в интернете, а затем были добавлены в этот набор данных,
– добавляет пострадавшая.

Издание Ars провело собственные эксперименты по поиску изображений и смогло выявить как ее фотографии, так и тысячи подобных снимков, каждый из которых, вероятно, имеет такой же сомнительный этический и правовой статус.

Как это произошло и что с этим можно сделать

Искусственный интеллект работает не случайным образом. Чтоб он выполнял возложенные на него задачки, создатели должны сначала научить алгоритм на большом наборе данных. Поэтому таким разработкам обычно "скармливают" огромные архивы информации – текстов, фотографий, видео, аудио. Однако по утверждениям LAION, в их случае все работает несколько иначе.

LAION описывает себя как некоммерческую организацию с участниками по всему миру, "стремящаяся сделать крупномасштабные модели машинного обучения, наборы данных и соответствующий код доступными для широкой общественности". Ее данные могут быть использованы в разных проектах, от распознавания лиц до компьютерного зрения и синтеза изображений. К примеру, технология может генерировать изображения из текстовых описаний. Однако сам ИИ – это набор URL-адресов, указывающих на изображения в интернете, LAION не размещает сами изображения.

Изображения, созданные искусственным интеллектом, обученным на наборе фотографий реальных женщин
Изображения, сгенерированные искусственным интеллектом, обученным на наборе фотографий реальных женщин / ArsTechnica

В таких условиях ответственность за включение того или иного изображения в набор LAION превращается в причудливую игру в перекладывание этой ответственности. Подруга Лапин задала открытый вопрос на канале #safety-and-privacy на сервере Discord LAION, спрашивая, как удалить ее изображение. Инженер LAION Ромен Бомонт ответил: "Лучший способ удалить изображение из интернета – это попросить веб-сайт прекратить его размещение. Мы не размещаем ни одно из этих изображений".