La computadora cuántica superconductora de fabricación china completa el primer ajuste fino del mundo de un modelo de IA de mil millones de parámetros

(GLOBAL TIMES)

Científicos chinos llevaron a cabo con éxito la primera tarea de ajuste fino del mundo de un gran modelo de inteligencia artificial (IA) de mil millones de parámetros en el ordenador cuántico superconductor de tercera generación, desarrollado independientemente por China, denominado Origin Wukong, según informó el lunes el Global Times desde el Centro de Investigación de Ingeniería de Computación Cuántica de Anhui.

El ordenador cuántico está impulsado por Wukong, un chip cuántico superconductor autóctono de 72 cúbits. Es uno de los ordenadores cuánticos superconductores programables y entregables más avanzados del país.

En el chip cuántico de Origin Wukong, un solo lote de datos puede generar cientos de tareas cuánticas para procesamiento en paralelo. Los datos experimentales mostraron que el modelo optimizado logró una reducción del 15 % en la pérdida de entrenamiento en un conjunto de datos de diálogo de asesoramiento psicológico, y la tasa de precisión en la tarea de razonamiento matemático aumentó del 68 % al 82 %, señaló el centro de investigación.

Analistas del sector afirmaron que este experimento no solo ha validado la viabilidad del uso de la computación cuántica para aligerar los grandes modelos de lenguaje (LLM), sino que también ha abierto un nuevo camino para abordar la “ansiedad por la potencia de cálculo”. “Es como equipar un modelo clásico con un ‘motor cuántico’, permitiendo que ambos trabajen en sinergia”, declaró Dou Menghan, vicepresidente de Origin Quantum Computing Technology Co. y subdirector del Centro de Investigación de Ingeniería de Computación Cuántica de Anhui, al Global Times el lunes.

Según el centro de investigación, el experimento demostró que, incluso con una reducción del 76 % en los parámetros, la efectividad del entrenamiento mejoró un 8,4 %. “Este es un gran avance en el campo de la computación cuántica”, afirmó Chen Zhaoyun, investigador adjunto del Instituto de Inteligencia Artificial del Centro Nacional Integral de Ciencias de Hefei.

Añadió que es la primera vez que la computación cuántica se utiliza en operaciones con máquinas reales para tareas de modelos de gran envergadura, lo que demuestra que el hardware existente es capaz de soportar el ajuste fino de los LLM.

El ajuste fino consiste en tomar un modelo preentrenado, a menudo un LLM o un modelo base, y adaptarlo para aplicaciones específicas como el diagnóstico médico o la gestión de riesgos financieros. Este proceso operativo puede ayudar a lograr una mayor precisión y relevancia al abordar las necesidades específicas de las empresas.

Origin Wukong ha completado más de 350.000 tareas de computación cuántica desde su inicio el 6 de enero de 2024, abarcando una amplia gama de industrias, como la dinámica de fluidos computacional, las finanzas y la biomedicina. Usuarios de 139 países o regiones han accedido a Origin Wukong de forma remota, según la compañía.

Trabajadores calibran e instalan la computadora cuántica superconductora de tercera generación, desarrollada independientemente por China. Foto: Cortesía del Centro de Investigación de Ingeniería de Computación Cuántica de Anhui