El equipo de la Universidad de Stanford se disculpa por las afirmaciones de que copiaron un proyecto chino para un modelo de IA

4 de junio de 2024

914

- Anuncio -

Un equipo de la Universidad de Stanford se disculpó tras ser acusado de plagiar el trabajo de código abierto de científicos chinos para crear un nuevo modelo de inteligencia artificial.
El modelo de IA, llamado Llama 3-V, atrajo la atención mundial por su potente rendimiento cuando se lanzó el miércoles de la semana pasada.

Pero el domingo, dos estudiantes de Stanford involucrados en el proyecto admitieron que “nuestra arquitectura es muy similar” a otro modelo, MiniCPM-Llama3-V 2.5.

‘Queremos disculparnos sinceramente con los autores originales’, dijeron los estudiantes de informática de Stanford Aksh Garg y Siddharth Sharma en un comunicado publicado en X el lunes.

Dijeron que el modelo original había sido retirado.

Llama 3-V fue desarrollado por Garg, Sharma y otro investigador, Mustafa Aljadery, que no es de Stanford. Los tres investigadores no respondieron de inmediato a las solicitudes de comentarios.

Al lanzar Llama 3-V la semana pasada, afirmaron que podría entrenarse para rivalizar con el rendimiento de modelos de IA de vanguardia como GPT4-V, Gemini Ultra y Claude Opus a un costo de poco menos de 500 dólares.

Poco después de su lanzamiento, Llama 3-V llegó a la lista de las cinco tendencias principales en Hugging Face, una popular plataforma de inteligencia artificial.

Pero dentro de la comunidad de IA surgieron dudas sobre si una gran parte del nuevo modelo podría haber sido robado de MiniCPM-Llama3-V 2.5. Ese modelo fue desarrollado conjuntamente por el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Tsinghua y ModelBest, una nueva empresa de inteligencia artificial con sede en Beijing fundada en 2022.

El contenido publicado por un denunciante en la plataforma de código abierto GitHub sugiere que la estructura del modelo y el código de los dos proyectos son casi idénticos.
Liu Zhiyuan, cofundador de ModelBest, dijo en una publicación de WeChat el lunes que estaba “relativamente seguro” de que el nuevo modelo había robado su proyecto.

Dijo que MiniCPM-Llama3-V2.5 tenía una característica integrada: puede identificar tiras de bambú del Período de los Reinos Combatientes (alrededor de 475-221 a. C.).

En 2008, la Universidad de Tsinghua adquirió 2.500 tiras de bambú (textos chinos escritos en tiras de bambú) de este período.

El equipo de Liu escaneó y anotó los textos palabra por palabra para crear un conjunto de datos para el entrenamiento. Ese conjunto de datos no está disponible públicamente, pero el modelo Llama3-V mostró la misma capacidad de reconocimiento, según Liu.

‘Incluso los casos equivocados son los mismos’, afirmó.

Liu dijo que el rápido desarrollo de la IA no podría lograrse sin el intercambio global de algoritmos, datos y modelos de código abierto. Señaló que su modelo había utilizado el último Llama 3 de código abierto de Meta como base.

Pero dijo que las piedras angulares del intercambio de código abierto eran adherirse a los protocolos, confiar en otros contribuyentes y respetar y reconocer el trabajo de los pioneros, que el equipo de Stanford había ‘seriamente socavado’.

En la declaración del lunes, Garg y Sharma, los dos estudiantes de Stanford, dijeron que el tercer miembro del equipo, Aljadery, había escrito todo el código del proyecto.

“Pedimos disculpas a los autores y asumimos toda la responsabilidad por no haber hecho la diligencia para verificar la originalidad de este trabajo”, dijeron.

En una publicación en X el martes, Christopher Manning, profesor de informática y lingüística en la Universidad de Stanford y director del Laboratorio de Inteligencia Artificial de Stanford, dijo que no tenía ningún conocimiento del caso. »Fingir antes de lograrlo’ es un producto innoble de Silicon Valley’, añadió.

El caso ha causado revuelo en las redes sociales, particularmente en China, donde el martes encabezó la lista de temas más candentes en Weibo. También ha provocado un debate más amplio sobre el progreso de China en inteligencia artificial.

Lucas Beyer, investigador del laboratorio de investigación de inteligencia artificial Google DeepMind, comentó en una publicación en X que ya existía “un modelo tan bueno” – MiniCPM-Llama3-V 2.5 – pero había recibido mucha menos atención porque no era de una Ivy League. Universidad, pero de un laboratorio chino.

En su publicación en WeChat, Liu de ModelBest reconoció la brecha “significativa” entre los modelos de IA generativa de China y proyectos occidentales de primer nivel como Sora y GPT-4. Pero dijo que China había pasado rápidamente “de ser un don nadie hace más de una década a ser un impulsor clave de la innovación en tecnología de inteligencia artificial”.

Fuente: https://www.scmp.com/news/china/science/article/3265377/stanford-university-team-apologises-over-claims-they-copied-chinese-project-ai-model