El dinero no es un problema ya que los inversores grandes y pequeños se precipitan hacia la tecnología de chatbot
HONG KONG — En febrero, poco después de que ChatGPT de OpenAI arrasara en el mundo de la tecnología, una serie de publicaciones del destacado empresario chino Wang Huiwen se volvieron virales en las redes sociales.
“Estoy invirtiendo $50 millones. Forme un equipo conmigo para abrazar la nueva era y crear OpenAI de China. Actualmente no entiendo la tecnología de IA, pero estoy trabajando duro para aprender”, Wang, cofundador de la plataforma de entrega de alimentos Meituan, dijo en una de las publicaciones.
Algunos analistas se mostraron escépticos y señalaron que 50 millones de dólares son solo una gota en el océano cuando se trata de los fondos necesarios para entrenar chatbots como ChatGPT.
Wang, sin embargo, es solo uno de los muchos inversores chinos que se apresuran a entrar en la IA generativa, y muchos se centran en un área en particular: modelos de lenguaje grandes.
Los modelos de lenguaje grande son la tecnología que sustenta a los chatbots como ChatGPT y Bard de Google. Usando algoritmos y potencia informática avanzada, estos modelos se entrenan en grandes cantidades de conjuntos de datos para generar respuestas similares a las humanas.
En los últimos tres meses, más de 30 entidades chinas han anunciado que están desarrollando sus propios modelos de lenguaje grande. Estos incluyen gigantes tecnológicos como Alibaba, Tencent, Baidu y Huawei Technologies, que ya habían comenzado antes de que ChatGPT irrumpiera en escena, así como universidades, instituciones respaldadas por el estado y empresarios nuevos en IA, como Wang.
“Docenas de empresas chinas que se apresuran a construir modelos básicos son típicos de cualquier nueva tecnología con gran potencial. La explosión de nuevos jugadores y productos generalmente será seguida por la consolidación a medida que la tecnología madure y surjan ganadores claros”, dijo Andy Chun, vicepresidente de Sociedad de Informática de Hong Kong.
El umbral para invertir en modelos de idiomas grandes en China ya ha aumentado de $ 50 millones a $ 100 millones desde el comienzo del año, dijeron los inversores a Nikkei Asia.
Una de las razones de la avalancha de intereses e inversiones es el enorme potencial comercial. Se prevé que el mercado chino de software y aplicaciones de IA se cuadruplique en valor entre 2021 y 2026 a más de 21.000 millones de dólares, según la firma de investigación de mercado IDC.
Otra razón es el atractivo del enfoque del modelo de lenguaje grande en sí mismo.
“Los expertos de la industria creen que hemos entrado en una nueva era de modelos de lenguajes grandes, y muchos sienten que vale la pena revisar y volver a trabajar todos los productos desde cero. En lugar de usar interfaces de programación de aplicaciones (API) o integrar sistemas existentes, planeamos reconstruir por completo y reconfigurar cada producto”, dijo el cofundador y director ejecutivo de Baidu, Robin Li, en un discurso la semana pasada.
“Los grandes modelos de lenguaje han transformado la inteligencia artificial y pronto transformarán el mundo”, dijo.
Las empresas no son las únicas que tienen el ojo puesto en la IA. Dada su importancia para la seguridad nacional y la competitividad global, el gobierno de China ha introducido políticas para apoyar la industria de la IA y está tratando de convertir al país en un líder mundial en el campo. A principios de este año, el gobierno municipal de Beijing se comprometió a ayudar a las empresas a construir grandes modelos de lenguaje para competir contra ChatGPT.
El Partido Comunista Chino ha dicho que el país fomentará la investigación científica centrándose en campos que incluyen IA, información cuántica y microchips, aunque también ha señalado restricciones en el desarrollo. El principal organismo de control del ciberespacio de la nación emitió una regla propuesta que establece que el contenido creado con IA generativa debe reflejar los “valores fundamentales socialistas” y el presidente chino, Xi Jinping, también instó a mejorar la “gobernanza de seguridad de la inteligencia artificial”.
Todo este entusiasmo, sin embargo, no cambia el hecho de que construir grandes modelos de lenguaje es costoso, tanto en términos financieros como ambientales. Las emisiones de carbono del entrenamiento de un solo modelo pueden llegar a cientos de toneladas, según un informe de la Universidad de Stanford.
En los EE. UU., solo los principales actores tecnológicos pueden permitirse el lujo de desarrollar grandes modelos lingüísticos. OpenAI, por ejemplo, cuenta con un respaldo financiero considerable de Microsoft, lo que le ha permitido seguir desarrollando ChatGPT.
Xiao Yanghua, profesor de ciencias de la computación en la Universidad de Fudan en Shanghái, dijo en una publicación en línea que, por ahora, muchas instituciones chinas solo están ajustando los modelos básicos de código abierto y utilizando API relativamente baratas como ChatGPT para generar datos con el fin de “desarrollar sus propios modelos.
“Es por eso que cuando le preguntas a algunos modelos domésticos de lenguaje grande ‘¿Quién eres?’ la respuesta es ‘Soy ChatGPT'”, dijo Xiao.
También criticó el dinero que se invierte en AI, comparándolo con la desastrosa política económica de Mao Zedong. “El desarrollo actual de modelos de lenguajes grandes se parece mucho al Gran Salto Adelante de la década de 1950, que provocó un gran desperdicio de recursos humanos, materiales y financieros”, dijo.
Juzgar cuánto ha valido la pena esta ráfaga de inversión hasta ahora no es fácil.
“El desafío ha sido que estos modelos chinos no se han lanzado a un amplio segmento de la población, por lo que ha sido difícil evaluar cómo se comparan con modelos de última generación como los que están detrás de ChatGPT y Bard”, dijo Paul. Triolo, experto en China y tecnología de la consultora Albright Stonebridge.
Según Triolo, las empresas chinas tienden a conectar sus modelos de IA generativa en verticales estrechamente enfocados, o en su mercado objetivo, y usan sus propios conjuntos de datos para desarrollar más rápidamente aplicaciones que generarán ingresos.
Las restricciones estadounidenses a las exportaciones de unidades de procesamiento gráfico de última generación, o GPU, no serán un obstáculo importante a corto plazo, agregó, pero con el tiempo podría resultar difícil para las empresas chinas sortear estas limitaciones de hardware.
Otro desafío más inmediato para las empresas chinas tiene que ver con los conjuntos de datos, según Qing Wei, director de tecnología de Microsoft China.
“Para las grandes empresas de tecnología en China, es difícil dar datos a los competidores o conectarse con las API de los rivales, por eso quieren construir sus propios modelos si están listos para adoptar la nueva era de la IA”, dijo.
Si bien los datos de idioma que ChatGPT puede extraer son abiertos, compartidos y gratuitos, la mayoría de los datos de idioma chino de alta calidad necesarios para crear una “versión china de ChatGPT” están en manos de empresas o instituciones y no se pueden compartir, dijo Wei en marzo.
Zeren Bai, director sénior de Linear Capital, con sede en Shanghai, que se enfoca en invertir en aplicaciones de datos e infraestructura de datos en China, dijo que la mayoría de los gigantes chinos de Internet están desarrollando sus propios modelos de lenguaje grande, ya que tienen la ventaja de aprovechar sus propios datos.
“Para las grandes empresas de tecnología en China, es difícil para ellas dar datos a los competidores o conectarse con las API de los rivales, por eso quieren construir sus propios modelos si están listos para adoptar la nueva era de la IA”, dijo.
A pesar de los obstáculos, Bai dijo que el consenso de la industria desde la llegada de ChatGPT es que vale la pena rehacer todas las aplicaciones.
“Las aplicaciones construidas sobre modelos básicos serán una oportunidad relativamente segura, por lo que nos estamos enfocando en aplicaciones generativas de inteligencia artificial en verticales de la industria, en lugar de en plataformas generales enfocadas en chat”, dijo. Ejemplos de esto podrían incluir el uso de IA para generar fotos o videos para marketing.
Y los modelos de idiomas grandes chinos están evolucionando y mejorando. Por ejemplo, Ernie Bot de Baidu, la primera respuesta china a ChatGPT. El bot aún se está probando y aún no está abierto al público, pero Baidu dijo recientemente que las consultas por segundo de Ernie, una medida de la cantidad de tráfico que puede manejar, se han multiplicado por 10 desde su lanzamiento limitado en marzo.
Mientras tanto, Alibaba Cloud presentó el jueves su asistente inteligente, Tingwu, que se basa en su gran modelo de lenguaje Tongyi Qianwen. Tingwu puede convertir voz y videos en texto en tiempo real y está disponible para pruebas beta públicas.
Pero Tencent y Alibaba tienen vastos recursos financieros y ejércitos de ingenieros a su disposición. ¿Dónde deja esto a los aspirantes, como el empresario Wang?
“Solo unos pocos gigantes tecnológicos finalmente ganarán en la gran guerra de los modelos lingüísticos, al igual que miles de empresas chinas estaban quemando efectivo por participación de mercado en el campo de batalla de las compras grupales a principios de la década de 2010 y solo unas pocas sobrevivieron”, dijo James Chou, el director gerente de Microsoft para Startups North Asia.
“Creo que puede haber desarrollos más innovadores en industrias verticales estrechas y especializadas, ya que algunas empresas podrían aprovechar su experiencia en un campo en particular y los datos exclusivos que poseen para crear nuevos modelos”.
Por: CISSY ZHOU, redactora Nikkei
Fuente: https://asia.nikkei.com/Business/Business-Spotlight/AI-frenzy-sweeps-China-as-companies-search-for-their-own-ChatGPT?utm_campaign=GL_asia_daily&utm_medium=email&utm_source=NA_newsletter&utm_content=article_link&del_type=1&pub_date=20230602190000&seq_num=3&si=13636