Internet

OpenAI는 콘텐츠 제작자들이 AI 교육에서 '거절'할 수 있는 도구를 만들고 있다고 전합니다

마시스북유럽 Sunday, May 26 2024

오픈AI는 생성 AI의 교육에서 어떻게 자신들의 콘텐츠가 사용되는지 더 잘 제어할 수 있는 도구를 개발 중이라고 전합니다.

미디어 매니저라고 불리는 이 도구는 창작자들과 콘텐츠 소유자들이 작품을 오픈AI에 식별하고 그 작품이 어떻게 포함되거나 제외되어야 하는지 지정할 수 있게 해줍니다.

오픈AI는 '2025년까지 이 도구를 완성하기 위해 창작자, 콘텐츠 소유자 및 규제 당국과 협력하면서 '업계 스티어링 위원회'를 통해 표준을 정해 나갈 것이라고 말했습니다.

오픈AI는 블로그 글에서 '이렇게 하려면 저작권 보호된 텍스트, 이미지, 오디오 및 비디오를 다수의 소스에서 식별하고 창작자 기호를 반영할 수 있는 첫 번째 도구를 개발하기 위해 최첨단 기계 학습 연구가 필요하다'고 썼습니다. '시간이 지남에 따라 우리는 추가적인 선택과 기능을 도입할 계획입니다.')

미디어 매니저는 최종 형태가 무엇이 될지 모르더라도, 오픈AI의 AI 개발 방식에 대한 증가하는 비판에 응답하는 것으로 보여집니다. 이 방식은 대개 웹에서 공개 데이터를 크롤링하는 것에 크게 의존합니다. 최근 미국의 시카고 트리뷴 등 8개의 유명 신문이 오픈AI를 상대로 제네레이티브 AI를 교육하고 상품화한 경향이 있으며 이를 보상하거나 출처 출처를 인정하지 않은 지적재산 침해와 관련해 소송을 걸었습니다.

오픈AI를 비롯한 다른 제네레이티브 AI 벤더들은 공개 데이터와 데이터셋에서 도출된 엄청난 수의 예시에 기반을 둔 모델 교육. 오픈AI와 기타 제네레이티브 AI 판매업체는 공공 데이터를 크롤링하고 모델 교육에 사용하는 것을 허용하는 법적 표현, 저작자의 작품을 이용하여 변형적인 이창을 만들어내는 것을 허용하는 법적 원칙인 합리적 사용 이견을 주장합니다. 그러나 모두가 동의하지는 않습니다.

오픈AI는 실제로 최근에 유용한 AI 모델을 만들기 불가능할 것이라고 주장했습니다.

하지만 비판자들을 달래고 미래 소송에 대비하기 위해 오픈AI는 콘텐츠 제작자들을 중간에서 만나기 위한 조치를 취해 왔습니다.

지난해 오픈AI는 그림을 생성하는 모델을 교육하는 데 사용하는 데이터셋에서 아티스트들이 '거절'하고 작품을 제거할 수 있게 했습니다. 또한 회사는 웹 크롤링 봇에 웹사이트 소유자들이 사이트의 콘텐츠가 AI 모델을 교육하는 데 사용될 수 있는지 지시하는 robots.txt 표준을 통해 알릴 수 있게 했습니다. 그리고 오픈AI는 여전히 라이선싱 거래를 체결하고 있으며, 그 중에는 뉴스 기관, 주식 미디어 라이브러리 및 Stack Overflow와 같은 Q&A 사이트가 포함됩니다.

그러나 일부 콘텐츠 제작자들은 오픈AI가 충분한 조치를 취하지 않았다고 말합니다.

아티스트들은 개별 이미지의 사본을 제출하여 삭제해야 하는 '거절' 작업 흐름을 귀찮다고 설명했습니다. 오픈AI는 상대적으로 콘텐츠에 대한 라이선스 요금을 상대적으로 적게 지불한다고 보고됐습니다. 그리고 오픈AI 자체가 블로그 글에서 인정했다시피 회사의 현재 솔루션은 제어할 수 없는 플랫폼에 창작자의 작품이 인용되거나 다시 게시되는 시나리오를 다루지 않습니다.

오픈AI를 넘어서 제네레이티브 AI를 위한 보편적 소유 권한 및 거절 도구를 만들려는 많은 제3자들이 노력하고 있습니다.

스파닝 AI라는 스타트업은 Stability AI와 Hugging Face를 포함한 파트너와 함께 봇의 IP 주소를 식별하고 추적하여 스크래핑 시도를 차단하며, 아티스트가 자신의 작품을 등록하여 존중하는 벤더에 대한 교육을 허용하는 데이터베이스를 제공합니다. Steg.AI와 Imatag는 인간 눈에 알아채지 못하는 워터마크를 적용하여 아티스트가 그들의 이미지 소유권을 설립하도록 돕습니다. 그리고 시카고 대학의 프로젝트인 Nightshade는 이미지 데이터를 무용하거나 AI 모델 교육에 방해가 되도록 '독하는' 작업을 수행합니다.

마시스북유럽