- La compañía china ha puesto a disposición gratuitamente dos de sus modelos de lenguaje grande, Qwen-7B y Qwen-7B-Chat, para uso comercial y de investigación.
- Alibaba Cloud, que se escindirá de su matriz el próximo año, se ha duplicado en la IA generativa en medio de un frenesí global en torno a ChatGPT.
Alibaba Cloud, la columna vertebral de la tecnología digital de Alibaba Group Holding , ha compartido públicamente dos de sus modelos de lenguaje grande (LLM), a medida que el gigante tecnológico chino se mueve para expandir su influencia en el campo de la inteligencia artificial generativa (IA) .
Los dos modelos de código abierto, Qwen-7B y Qwen-7B-Chat, han sido entrenados cada uno en 7 mil millones de parámetros. Qwen-7B-Chat es una versión mejorada de Qwen-7B capaz de realizar conversaciones similares a las de los humanos. Representan formas más simples de Tongyi Qianwen , el LLM que la unidad de servicio de computación en la nube de Alibaba lanzó en abril.
Los mecanismos internos de estos modelos, incluidos sus códigos y documentación, serán de libre acceso para académicos, investigadores e instituciones comerciales de todo el mundo a través del repositorio de modelos de IA de Alibaba Cloud ModelScope y la plataforma colaborativa de IA de EE. UU. Hugging Face, dijo la firma con sede en Hangzhou.
Las empresas con menos de 100 millones de usuarios activos mensuales podrán implementar los modelos de código abierto para uso comercial de forma gratuita, mientras que aquellas con más usuarios deberán solicitar una licencia de Alibaba Cloud.
Alibaba es propietaria del South China Morning Post.
Los LLM son algoritmos de inteligencia artificial de aprendizaje profundo que pueden reconocer, resumir, traducir y generar contenido utilizando conjuntos de datos muy grandes. La tecnología se utiliza para entrenar chatbots altamente inteligentes como ChatGPT de OpenAI, que ha generado un gran interés mundial desde su lanzamiento en noviembre.
Los LLM de código abierto son parte de los esfuerzos más amplios de Alibaba para “democratizar” la tecnología de inteligencia artificial y ofrecer apoyo para las empresas emergentes de LLM, dijo la compañía.
“Nuestro objetivo es promover tecnologías inclusivas y permitir que más desarrolladores y pequeñas y medianas empresas aprovechen los beneficios de la IA generativa”, dijo Zhou Jingren, director de tecnología de Alibaba Cloud Intelligence.
Alibaba se une a sus pares en Occidente que han abierto sus LLM para usar de forma gratuita. Llama 2, el LLM de código abierto de próxima generación creado por Meta Platforms, propietario de Facebook, se agregó a la plataforma ModelScope de Alibaba el mes pasado, lo que lo hace accesible para los desarrolladores en China.
ModelScope, una plataforma llamada “modelo como servicio” lanzada en noviembre, actualmente presenta más de 1,000 modelos de IA listos para usar aportados por 20 instituciones líderes de IA, que cubren áreas desde la visión por computadora hasta el procesamiento del lenguaje natural.
Alibaba Cloud, que se escindirá de su matriz el próximo año para convertirse en una empresa que cotiza en bolsa, se ha duplicado en el desarrollo y la comercialización de IA generativa en medio del frenesí global en torno a ChatGPT.
En la Conferencia Mundial de Inteligencia Artificial en Shanghái en julio, presentó Tongyi Wanxiang, un modelo de generación de imágenes estilo Midjourney que fue diseñado para ayudar a desarrolladores y empresas más pequeñas.
Los ingresos en la nube de Alibaba en el trimestre de marzo cayeron un 2 por ciento respecto al año anterior, contribuyendo con el 9 por ciento de los ingresos totales del grupo, según mostró su último estado financiero. La compañía informará sus resultados del trimestre de junio la próxima semana.
Fuente: https://www.scmp.com/tech/big-tech/article/3229907/alibaba-cloud-open-sources-its-two-generative-ai-models-based-chatgpt-style-tongyi-qianwen