El lenguaje del científico artificial
La gran transformación de la ciencia actualcomo me explica el español Javier García, presidente de la Unión Química Internacional y exitoso empresario, es que algunos de los grandes descubrimientos no los hacen (solo) científicos, sino informáticos. Las máquinas superaron el test de Turing en 2018, son capaces de ofrecer rutas sintéticas indistinguibles de las de los mejores especialistas en química orgánica y algoritmo Pliegue alfa 2, desarrollado por la empresa DeepMind, logró predecir el plegamiento de proteínas a partir de una secuencia de aminoácidos. A Javier García le habían dicho en la época de universitario que esto último era sencillamente imposible.
Él inteligencia artificial abre un nuevo espacio para los descubrimientos asistidos por computadora y su capacidad de procesamiento de información, en un mundo sobreabundante de publicaciones científicas, le permite «leer» cientos de miles de documentos diariamente y establecer tendencias, anticipar, virtualizar y proponer mejores experimentos en sus “colegas” humanos.
Es en este contexto que el reciente anuncio de Meta, antes conocido como Facebook, de que está “democratizando el acceso a modelos de lenguaje a escala con OPT-175B”, un modelo de lenguaje con 175.000 millones de parámetros entrenados a partir de conjuntos de datos disponibles públicamente. Sus dimensiones son similares a las del sistema. AbiertoA GPT-3I, un modelo de inteligencia artificial que asombra al mundo con su capacidad para escribir diferentes tipos de texto con un nivel de calidad excepcional.
Pero OPT-175B trae más, según Meta AI. Porque su lanzamiento incluye tanto los modelos pre-entrenados como el código necesario para entrenarlos y usarlos. Además, para mantener su integridad y evitar abusos, se distribuirá bajo una licencia no comercial y se centrará en casos de uso de investigación científica. Así, solo podrán beneficiarse, por el momento, investigadores universitarios, organizaciones gubernamentales y de la sociedad civil, así como laboratorios de investigación industrial de todo el mundo. Sin embargo, es cuestión de tiempo que finalmente obtenga su propia voz en el metaverso, por supuesto.
Director de Investigación del Observatorio de Internet de Stanford, Renee DiRestano necesitaba luchar con un modelo de lenguaje de 175.000 millones de parámetros para darse cuenta de que con un sistema capaz de producir disertaciones a escala industrial, con una gramática perfecta y una consistencia excelente, “el suministro de información errónea pronto será interminable”, según el título de uno de sus ensayos. Y el psicólogo social Jonathan Haidt ni siquiera quiere pensar en lo que sucederá cuando el programa OpenAI se actualice a GPT-4.
Es llamativo ver como la misma herramienta puede producir niveles igualmente altos de veracidad y engaño. Como lenguaje natural. Lo que ya es indiscutible es que ese caballo salvaje artificial debe ser domado, y hay al menos dos ejercicios que la sociedad debe promover para no ser devorado por tan poderosa energía.
Una es la promoción de la identidad digital: del mismo modo que los bancos y la Administración aplican estrictos mecanismos de «conoce a tu cliente» (conozca a su cliente, KYC) es fundamental que en el futuro podamos saber, y las redes sociales también nos ayudan a hacerlo, si estamos interactuando con una persona o una máquina. El consorcio español Alastria es uno de los más avanzados del mundo, por supuesto es el más avanzado de Europa, en cuanto a tecnología de identidad digital, aunque fue el gobierno alemán el que llevó la iniciativa a nuestro país con la excusa de la euros digitales. Un tema que siempre pica.
El otro ejercicio debe ser salvaguardar la neutralidad informativa, base del liberalismo cultural (no económicos) sobre los que se construyen las instituciones democráticas contemporáneas. La reciente confrontación entre el gobierno de Boris Johnson en el Reino Unido y la dirección de la BBC por este tema aún resuena. Hoy más que nunca, debemos reivindicar los valores del conocimiento compartido sin importar credo, raza, género u origen. La importancia de contar con entidades neutrales enfocadas únicamente en promover el acceso de todos a la mejor información.
La máquina solo es capaz de generar conocimiento de calidad con mucha información, esta es su grandeza y su debilidad. La gente necesita muy poca información para obtenerla, esa es la diferencia. Pero debe ser bueno.