OpenAI признала, что невозможно обучить ИИ без материалов, защищённых авторским правом

Коэн (NoW)

08:00, 10 января 2024

OpenAI признала, что невозможно обучить ИИ без материалов, защищённых авторским правом

OpenAI и её крупнейший спонсор Microsoft столкнулись с несколькими исками, обвиняющими их в использовании чужих материалов с защищённым авторским правом без разрешения для обучения языковых моделей компании (LLM). И судя по тому, что OpenAI сообщила комитету Палаты лордов по вопросам коммуникаций и цифровых технологий, мы можем увидеть ещё больше исков против этих компаний в будущем — OpenAI признала, что "невозможно обучить ведущие модели ИИ сегодня без использования материалов с защищённым авторским правом".

Компания объяснила, что это потому, что авторское право сейчас "распространяется практически на любой вид человеческого самовыражения, включая блог-посты, фотографии, сообщения на форумах, обрывки программного кода и правительственные документы".

Компания добавила:

Ограничение обучающих данных общественным достоянием, книгами и рисунками, созданными более века назад, возможно, дало бы интересный эксперимент, но не создало бы ИИ-системы, отвечающие потребностям сегодняшних пользователей.

OpenAI также настаивала, что соблюдает законы об авторском праве при обучении своих моделей. В новом посте у себя в блоге, в ответ на иск The New York Times, она заявила, что использование общедоступных материалов из Интернета для обучения ИИ подпадает под доктрину добросовестного использования.

Тем не менее компания признала, что "всё ещё предстоит работа по поддержке и расширению прав создателей". Она рассказала о способах, с помощью которых позволяет издателям запретить веб-кроулеру GPTBot получать доступ к их сайтам. Также компания заявила, что разрабатывает дополнительные механизмы, позволяющие правообладателям отказаться от использования их материалов в обучении, а также ведёт с ними переговоры о взаимовыгодных соглашениях.

В некоторых исках, поданных против OpenAI и Microsoft, истцы обвиняют компании в отказе платить авторам за их труд в то время как сами строят миллиардную индустрию и получают огромную финансовую выгоду от материалов с защищённым авторским правом. Недавний иск, поданный парой авторов нехудожественной литературы, утверждал, что компании могли бы изучить альтернативные варианты финансирования, такие как совместное использование прибыли, однако они "выбрали воровство".

OpenAI не комментировала эти конкретные судебные дела, но дала прямой ответ на жалобу The New York Times, обвиняющую её в использовании опубликованных новостных статей без разрешения. Однако OpenAI заявила, что издание не рассказывает всю историю. Она уже вела с The Times переговоры о "партнёрстве", которое дало бы доступ к материалам издания. Две стороны, видимо, продолжали общаться вплоть до 19 декабря, а OpenAI узнала об иске только в декабре, прочитав в The Times.

В иске, поданном газетой, приводились примеры предоставления ChatGPT пользователям "почти дословных выдержек" из материалов за платной подпиской. OpenAI обвинила издание в преднамеренном манипулировании запросами, например включением в своё взаимодействие с чат-ботом пространных цитат из статей, чтобы заставить его "отрыгнуть" контент. Компания также обвиняет The Times в отборе примеров из многочисленных попыток. OpenAI заявила, что иск The Times не имеет законных оснований, но она всё равно надеется на "конструктивное партнёрство" с изданием.

Больше статей на Shazoo