Un modelo de lenguaje grande de nueva generación, capaz de aceptar y procesar alrededor de 300 mil caracteres chinos a la vez, se lanzó en la municipalidad de Shanghai, en el este de China.
Sin embargo, la limitada longitud de contexto de los modelos grandes es un problema significativo en la inteligencia artificial.
l nuevo modelo, InternLM2, se desarrolló entre el Laboratorio de Inteligencia Artificial de Shanghai, SenseTime, la Universidad China de Hong Kong y la Universidad Fudan. En un experimento, los investigadores alimentaron al modelo con la transcripción de una reunión pública de tres horas de duración. Además le pidieron extraer información prominente.
Lanzan modelo de lenguaje grande de nueva generación en Shanghai
Los resultados de la prueba mostraron que, aunque había muchos errores tipográficos en el texto no corregido. InternLM2 puede extraer con precisión la información clave y resumir los puntos principales del orador.
Los desarrolladores tienen como objetivo avanzar en la capacidad de modelado del lenguaje de la base del modelo mediante la mejora de la calidad del corpus y la densidad de la información. Asimismo, el Laboratorio de Inteligencia Artificial de Shanghai informó que continúa otorgando licencias de InternLM2 para su uso comercial gratuito.