Operai afirma haber encontrado evidencia de que Depseek, una startup de inteligencia artificial china, usó modelos de la compañía estadounidense para capacitar a su propio competidor de código abierto, lo que aumenta la preocupación por una posible violación de la propiedad intelectual.
La compañía con sede en San Francisco, creador de ChatGPT, dijo a The Financial Times que ha visto indicaciones de “destilación”, una técnica que sospecha que proviene de Deepseek. La destilación es un método utilizado por los desarrolladores para obtener un mejor rendimiento en modelos más pequeños que utilizan modelos más grandes y más capaces, lo que permite resultados similares para tareas específicas a un costo mucho más bajo.
La destilación es una práctica habitual en la industria, pero la preocupación es que Deepseek podría estar utilizándola para crear su propio modelo de competidor, lo que violaría los términos de OpenAI.
“El problema surge cuando (toma los resultados de la plataforma y) para crear su propio modelo con sus propios fines”, dijo una persona cercana a OpenAI.
Operai se negó a comentar más al respecto o proporcionar detalles sobre las pruebas. Sus términos de servicio establecen que los usuarios no pueden “copiar” ninguno de sus servicios o “usar el producción Desarrollar modelos que compitan con OpenAI. “
El lanzamiento del modelo de razonamiento Deepseek R1 ha sorprendido a los mercados, así como a los inversores y compañías de tecnología en Silicon Valley. Sus modelos, desarrollados con recursos mínimos, han alcanzado puntajes y resultados altos comparables a los principales modelos estadounidenses.
Las acciones de Nvidia cayeron un 17% el lunes, lo que redujo su valor de mercado en US $ 589,000 millonesDado el temor de que las grandes inversiones en su costoso hardware de IA puedan no ser necesarias. El 9% se recuperó el martes, así como otras acciones tecnológicas.
Operai y su socio Microsoft investigaron el año pasado las cuentas que se creían que pertenecían a Deepseek, que utilizó la API (interfaz de programación de aplicaciones) de OpenAI y el acceso bloqueado por sospechas de destilación que violaron los términos de servicioSegún otra persona con conocimiento directo. Bloomberg informó inicialmente estas investigaciones.
Microsoft se negó a comentar y OpenAI no respondió de inmediato a una solicitud de comentarios sobre este detalle. Depseek no respondió a una solicitud de comentarios durante las vacaciones del Año Nuevo Lunar.
Anteriormente, David Sacks, Zar de AI y las criptomonedas del presidente Donald Trump, dijeron que “es posible” que haya ocurrido un robo de propiedad intelectual.
“Hay una técnica en la destilación de SO, cuando un modelo aprende de otro modelo (y) extrae conocimiento del modelo padre”, dijo Sacks a Fox News el martes.
“Y hay evidencia sustancial de que lo que Depseek hizo aquí fue destilar el conocimiento de los modelos Operai, y no creo que Operai esté muy contento con esto”, agregó Sacks, sin proporcionar evidencia.
Deepseek dijo que usó solo 2,048 tarjetas gráficas NVIDIA H800 y gastó US $ 5.6 millones para capacitar a su modelo V3 con 671,000 millones de parámetros, una fracción de lo que OpenAi y Google habrían invertido para entrenar modelos de tamaño comparables. Algunos expertos argumentan que las respuestas generadas por el modelo indican que fue entrenada con el Salidas de Openai GPT-4, que violaría sus términos de servicio.
Aquellos que conocen la industria señalan que es común que los laboratorios de IA en China y en los Estados Unidos usan los resultados de empresas como OpenAI, que han invertido en contratar personas para enseñar a sus modelos a producir más respuestas humanas. Esto requiere muchos recursos y trabajo, y los actores más pequeños a menudo aprovechan este esfuerzo.Según estos expertos.
“Es muy común que las nuevas empresas y los académicos usen los resultados de Commercial LLM alineados con humanos, como ChatGPT, para entrenar a otro modelo”, explica Ritwik Gupta, estudiante de doctorado en la Universidad de California, Berkeley.
“Eso significa que obtienes esa etapa de retroalimentación humana gratis. No me sorprende que Deepseek supuestamente esté haciendo lo mismo. Si lo hacen, puede ser difícil detener esta práctica con precisión “Añadió.
La práctica destaca la dificultad que enfrenta las empresas que buscan proteger su ventaja técnica. “Sabemos que las empresas con sede en (China), y otras están constantemente tratando de destilar los modelos de las principales empresas estadounidenses de IA”, dijo OpenAI en su declaración más reciente.
Agregó: “Tomamos contramedidas para proteger nuestra propiedad intelectual, que incluye un proceso cuidadoso para decidir qué capacidades principales incluimos en los modelos que lanzamos. Y creemos … que es de importancia crítica trabajar estrechamente con el gobierno de los Estados Unidos para proteger los modelos más capaces de adversarios y competidores que buscan apropiarse de la tecnología estadounidense. “
Operai enfrenta sus propias acusaciones de violación de derechos de autor por parte de los periódicos y los creadores de contenido, Incluyendo demandas del New York Times y autores reconocidos, que acusan a la compañía de haber capacitado a sus modelos con artículos y libros sin permiso.