En el marco del proceso legal Kadrey contra Meta, se han presentado acusaciones serias contra la compañÃa de Mark Zuckerberg, señalando la utilización de obras con derechos de autor para el entrenamiento de sus modelos de inteligencia artificial. Aunque previamente se habÃa difundido que Zuckerberg habÃa aprobado el uso de libros pirateados, ahora surgen nuevas evidencias contundentes de estas acciones.
Correos reveladores. En el «apéndice A» del caso se incluyen correos electrónicos de empleados de Meta que confirman la descarga masiva de libros protegidos. Entre ellos, Melanie Kambadur manifestó su desacuerdo con esta recolección de datos en octubre de 2022.
«Descargar torrents desde un portátil de empresa no parece buena idea». En abril de 2023, Nikolay Bashlykov, encargado de esta recolección, en tono jocoso y con emojis, sugirió que la empresa deberÃa ser cautelosa con la IP utilizada para las descargas.
Conciencia sobre los riesgos. En septiembre del mismo año, Bashlykov advirtió que usar torrents podrÃa convertirnos en «semillas» para otros y añadió que «eso podrÃa no estar bien legalmente». Estos intercambios evidencian que Meta era consciente de la ilegalidad de sus acciones, según los demandantes.
Encubrimiento de rastros. Frank Zhang, investigador de Meta, explicó en un mensaje interno cómo evitaron usar sus servidores al descargar datos para «evitar» que la semilla fuera rastreada.
Descarga masiva de 81,7 TB. Ars Technica señala que Meta descargó al menos 81,7 terabytes de datos de bibliotecas con libros protegidos. Documentos del caso revelan que 35,7 TB provinieron de sitios como Z-Library y LibGen.
Meta busca desestimar las acusaciones. La compañÃa ha solicitado desestimar los cargos, alegando falta de evidencia sobre la descarga de libros por sus empleados y su distribución ulterior. En Xataka hemos contactado a Meta, y actualizaremos la noticia con cualquier comentario.
Las prácticas cuestionables de la IA. Estas revelaciones destacan las prácticas discutibles de las empresas de IA para entrenar sus modelos. Google y OpenAI también enfrentan crÃticas por utilizar textos protegidos por copyright.
Normalización del «saqueo» en internet. La tendencia de estas empresas a ignorar reglas y derechos de autor parece estar normalizando un «saqueo» de internet. La indignación parece ya parte del pasado ante una polÃtica de hechos consumados.
¿Es esto realmente «uso justo»? Las compañÃas se respaldan en el «uso justo» del derecho anglosajón para justificar el uso limitado de material protegido sin autorización. Sin embargo, las demandas por violación de copyright en la IA generativa siguen en aumento, aunque parecen ser ignoradas mientras estos gigantes continúan creciendo.
Deja una respuesta