Художниця знайшла фотографії на сайті під назвою Have I Been Trained, який дозволяє митцям побачити, чи є їхні роботи в наборі даних штучного інтелекту LAION-5B. Однак замість того, щоб здійснювати текстовий пошук на сайті, жінка завантажила свою нещодавню фотографію, скориставшись функцією зворотного пошуку зображень на сайті. Вона була здивована, коли виявила набір з двох знімків свого обличчя, які були дозволені для використання лише її лікарем. Це підтверджує форма дозволу, яку Лапін опублікувала в Твіттері.

Цікаво Штучний інтелект приніс Франції 10 мільйонів євро, слідкуючи за приватними басейнами

Що відомо

Лапін страждає генетичним захворюванням, через яке у 2013 році мусила пройти через кілька операцій на обличчі, ротовій порожнині та щелепі.

Ці фотографії – з моєї останньої процедури у цього хірурга,
– каже жінка.

За словами Лапін, хірург, який володів медичними фотографіями, помер від раку у 2018 році, і вона підозрює, що після цього вони якимось чином покинули його кабінет. Художниця називає цю ситуацію "цифровим еквівалентом отримання вкраденого майна".

Хтось вкрав зображення з файлів мого померлого лікаря, і воно опинилося десь в інтернеті, а потім було вилучене в цей набір даних,
– додає постраждала.

Видання Ars провело власні експерименти з пошуку зображень і змогло виявити як її фотографії, так і "тисячі подібних знімків", кожен з яких, імовірно, має такий же сумнівний етичний та правовий статус.

Як так сталося і що з цим можна зробити

Штучний інтелект працює не випадковим чином. Щоб він виконував покладені на нього завдання, творці мусять спочатку навчити алгоритм на величезному наборі даних. Тому таким розробкам зазвичай "згодовують" величезні архіви інформації – текстів, фотографій, відео, аудіо. Однак, за твердженнями LAION, у їхньому випадку все працює дещо інакше.

LAION описує себе як некомерційну організацію з учасниками по всьому світу, "яка прагне зробити великомасштабні моделі машинного навчання, набори даних і відповідний код доступними для широкої громадськості". Її дані можуть бути використані в різних проєктах, від розпізнавання облич до комп'ютерного зору і синтезу зображень. Наприклад, технологія може генерувати зображення з текстових описів. Однак сам ШІ – це набір URL-адрес, які вказують на зображення в інтернеті, LAION не розміщує самі зображення.


Зображення, згенеровані штучним інтелектом, навченим на наборі фотографій реальних жінок / Фото ArsTechnica

За таких умов відповідальність за включення того чи іншого зображення в набір LAION перетворюється на химерну гру в перекладання цієї відповідальності. Подруга Лапін поставила відкрите запитання на каналі #safety-and-privacy на сервері Discord LAION, запитуючи, як видалити її зображення. Інженер LAION Ромен Бомонт відповів: "Найкращий спосіб видалити зображення з Інтернету — це попросити вебсайт припинити його розміщення. Ми не розміщуємо жодне з цих зображень".