Mustafa Soliman, director ejecutivo de Microsoft AI, dijo esta semana que las empresas de aprendizaje automático pueden extraer la mayor parte del contenido publicado en línea y utilizarlo para entrenar redes neuronales porque son esencialmente «software libre».
Poco después se creó el Centro de Periodismo de Investigación. Presentar una demanda contra OpenAI Su mayor inversor, Microsoft, “por utilizar el contenido de la organización de noticias sin fines de lucro sin permiso ni ofrecer compensación”.
Esto sigue los pasos de ocho periódicos Presentó una demanda contra OpenAI y Microsoft En abril, The New York Times acusó a Facebook de presunta apropiación indebida de contenidos, algo que el mismo periódico había hecho cuatro meses antes.
Luego están los dos brillantes autores. Presentó una demanda contra OpenAI y Microsoft En enero afirmaron que habían entrenado modelos de IA en las obras de los autores sin permiso. Además, en 2022, varios desarrolladores anónimos presentaron una demanda contra OpenAI y GitHub basándose en acusaciones de que las organizaciones utilizaron código publicado públicamente para entrenar modelos generativos en violación de los términos de su licencia de software.
preguntado en Entrevista En una entrevista con Andrew Ross Sorkin de CNBC en el Festival de Ideas de Aspen sobre si las empresas de inteligencia artificial han robado efectivamente la propiedad intelectual del mundo, Solomon reconoció la controversia y trató de distinguir entre el contenido que la gente publica en línea y el contenido respaldado por titulares corporativos de derechos de autor.
«Creo que en términos de contenido que ya existe en la web abierta, el contrato social para ese contenido desde la década de 1990 ha sido el uso legítimo», dijo. «Cualquiera podía copiarlo, recrearlo, reproducirlo. Era gratis, por así decirlo. Ese es el entendimiento».
Solomon permitió otra categoría de contenido, que es material publicado por empresas que tienen abogados.
«Existe una categoría separada en la que un sitio web, editor u organización de noticias declara explícitamente: ‘No escanee ni rastree mi contenido por ningún motivo que no sea el de indexarlo’, para que otras personas puedan encontrar ese contenido», explicó. «Pero ésta es una zona gris. Creo que esto llegará a los tribunales».
Esto es por decirlo suavemente. Si bien parece seguro que las declaraciones de Soliman ofenderán a los creadores de contenido, no está del todo equivocado: no está claro dónde se encuentran las líneas legales con respecto al entrenamiento y la producción de modelos de IA.
La mayoría de las personas que publican contenido en línea como individuos pueden estar comprometiendo sus derechos de alguna manera al aceptar acuerdos de términos de servicio ofrecidos por las principales plataformas de redes sociales. La decisión de Reddit de otorgar licencias a OpenAI para las publicaciones de sus usuarios no sucedería si el gigante de las redes sociales creyera que sus usuarios tienen un derecho válido sobre sus memes y datos.
El hecho de que OpenAI y otras empresas que fabrican modelos de IA estén logrando acuerdos de contenido con los principales editores muestra que una marca fuerte, mucho dinero y un equipo legal pueden traer grandes operaciones tecnológicas a la mesa.
En otras palabras, quienes crean contenido y lo publican en línea están creando software libre a menos que contraten, o puedan atraer, abogados dispuestos a desafiar a Microsoft y sus semejantes.
en papel En un estudio publicado por SSRN el mes pasado, Frank Pasquale, profesor de derecho en Cornell Tech y Cornell Law School en los EE. UU., y Haochen Sun, profesor asociado de derecho en la Universidad de Hong Kong, exploran la incertidumbre legal que rodea el uso de datos protegidos por derechos de autor para entrenar inteligencia artificial y si los tribunales considerarían que dicho uso es justo. Concluyen que la IA debe abordarse a nivel de políticas, porque las leyes actuales son inadecuadas para responder las preguntas que ahora es necesario abordar.
“Debido a que existe tanta incertidumbre sobre la legalidad del uso de obras protegidas por derechos de autor por parte de los proveedores de servicios de IA, los legisladores necesitarán articular una nueva visión audaz para reequilibrar los derechos y responsabilidades, tal como lo hicieron a raíz del desarrollo de Internet (liderando a la Ley de Derechos de Autor del Milenio y Publicación de Materiales Digitales de 1998), argumentan.
Los autores señalan que la actual cosecha no compensada de obras creativas amenaza no sólo a escritores, compositores, periodistas, actores y otros profesionales creativos, sino también a la propia inteligencia artificial, que acabará privada de datos de entrenamiento. Los autores predicen que la gente dejará de publicar su trabajo en línea si solo se utiliza para impulsar modelos de inteligencia artificial que reduzcan el costo marginal de la creación de contenido a cero y nieguen a los creadores la posibilidad de recibir alguna recompensa.
Este es el futuro que prevé Salomón. “La economía de la información está a punto de cambiar radicalmente porque somos capaces de reducir a cero los costos de producción de conocimiento en términos de costo marginal”, afirma.
Todo el software gratuito que haya ayudado a crear puede ser suyo por una pequeña tarifa de suscripción mensual. ®
«Gurú del alcohol. Analista. Defensor de la comida. Aficionado extremo al tocino. Experto total en Internet. Adicto a la cultura pop. Pionero de viajes sutilmente encantador».