Sobre homúnculos, gólems y LLMs

Sobre homúnculos, gólems y LLMs


Los mitos del pasado se entrelazan muy a menudo con los nuevos avances que nos traen la ciencia y la tecnología. ¿Alquimia y cibernética? No es una conexión tan rara como parece y de hecho ha sido tratada en la ciencia ficción, el manga y los videojuegos. Hasta el punto de que establecer un nexo entre la IA y la figura del gólem casi se ha convertido en un lugar común.

Recopilemos una serie de recortes para explorar algunas de estas conexiones entre el pasado y el presente...

En mitología, se denomina homúnculo a:

"cualquier humano, criatura humana o humanoide creada por el hombre mediante alquimia o magia."

En Inteligencia Artificial, llamamos LLMs (Grandes Modelos de Lenguaje) a:

“redes neuronales capaces de leer, traducir y resumir textos, pudiendo así crear frases y predecir palabras pareciendo que escribe o habla un humano. Este tipo de IA han sido entrenadas con una ingente cantidad de datos y millones de palabras, lo que les ha permitido reconocer patrones de palabras y aprender sobre el lenguaje y su utilización natural y contextual.”


Año 1539.

El alquimista Paracelso usa por primera vez el término “homúnculo”. Según la información de la  Wikipedia:

“Paracelso afirmó haber creado un homúnculo al intentar encontrar la piedra filosofal […]. La criatura no habría medido más de 30 centímetros de alto y hacía las tareas que se le encargaban. Sin embargo, tras poco tiempo, el homúnculo se volvía contra su creador y huía.”
¿Una última frase que anticipa la rebelión de la IA?        

La forma descrita para producir un homúnculo nos suena hoy tremendamente disparatada, aunque no dejaba de estar basada en los recursos y los conceptos disponibles en la época:

“La receta para crearlo consistía en una bolsa de carbón, mercurio, fragmentos de piel o pelo de cualquier humano o animal del que el homúnculo sería un híbrido. Todo esto había de enterrarse rodeado de estiércol de caballo durante cuarenta días, tiempo en el cual el embrión estaría formado en el seno de la Tierra.”
¿Una manera antigua de describir el dataset y el tiempo necesarios para el entrenamiento del modelo IA?        

En las siguientes décadas, a la vez que el mundo avanzaba hacia el conocimiento científico, con Isaac Newton estableciendo las bases de la mecánica clásica, a los alquimistas se les fue todavía más la pinza proponiendo diversas variantes para fabricar homúnculos:

“Una de ellas implicaba usar mandrágora. Las creencias populares sostenían que esta planta crecía donde caía al suelo el semen que los ahorcados emitían durante las últimas convulsiones antes de la muerte; además, sus raíces tienen una forma vagamente parecida hasta cierto punto a un ser humano. La raíz había de ser recogida antes del amanecer de una mañana de viernes por un perro negro, siendo entonces lavada y «alimentada» con leche y miel y, en algunas recetas, sangre, con lo cual se terminaría de desarrollar en un humano en miniatura que guardaría y protegería a su dueño.”
¿Representaría la "raíz" el núcleo de la personalidad de un individuo, con el dataset de sus pensamientos más característicos y propios? Y el resultado final, ¿es un ProtectorBot?        
“Un tercer método, citado por el doctor David Christianus en la Universidad de Giessen durante el siglo XVIII, era tomar un huevo puesto por una gallina negra, practicar un pequeño agujero en la cáscara, reemplazar una porción de clara del tamaño de una alubia por esperma humano, sellar la abertura con pergamino virgen y enterrar el huevo en estiércol el primer día del ciclo lunar de marzo. Tras treinta días surgiría del huevo un humanoide en miniatura que ayudaría y protegería a su creador a cambio de una dieta regular de semillas de lavanda y lombrices.”
¿Llegará algún CEO friki de Silicon Valley a proponer el entrenamiento biodinámico de LLMs, basado en las fases de la Luna? ¿Se fabricará el ProtectorBot versión Tamagotchi?        


Año 2024.

Por suerte, hemos reemplazado todas esas complicadas prácticas para crear homúnculos por el entrenamiento de modelos LLM con datasets masivos de textos, imágenes, videos y transcripciones.

Hace unos pocos días, Reid Hoffman, el co-fundador de LinkedIn (además de empresario, inversor y escritor) publicaba un alucinante video donde entrevista a una copia de sí mismo desarrollada con IA generativa: Reid AI. Este homúnculo digital es un Custom GPT entrenado con 20 años del contenido de sus libros, discursos y podcasts, así como con las imágenes y videos de su persona. Merece la pena ver la entrevista para observar cómo la réplica IA no se desenvuelve nada mal, además de vestir mejor y exhibir un afeitado más apurado. La verdad es que estos últimos años (o meses) hemos perdido la capacidad de sorpresa ante hitos o avances que casi parecen magia.


La copia digital de uno mismo como una posibilidad real no es una idea nueva, ya lo planteaba el ingeniero transhumanista Hans Moravec a principios de los 90. También ha sido fuente de inspiración para más de un capítulo de Black Mirror. Lo increíble es que ahora estamos viendo algo que se “aproxima” a una tangibilización de esa idea - al menos hasta el nivel de poder mantener un diálogo convincente con la copia. Es así como se crearán LLMs que puedan absorber el conocimiento de un gran experto y hacer de profesor de miles de alumnos a la vez, como se crearán griefbots para reemplazar a nuestra persona amada en la etapa de duelo tras su fallecimiento, o cómo Meta ya ha creado modelos IA para chatear con celebrities como Paris Hilton o Kendall Jenner, que han cedido sus “derechos de personalidad”.


¿Y el gólem?

Eso, ¿qué pasa con él? ¿Es lo mismo que un homúnculo? ¿Tiene también algún paralelismo con los LLM?

“Un gólem es una personificación, en el folclore medieval y la mitología judía, de un ser animado fabricado a partir de materia inanimada (normalmente barro, arcilla o un material similar).”
Pinocho como homúnculo de madera.
Los modelos LLMs dando "vida" al silicio en las GPUs de NVIDIA.        
“El relato folclórico más famoso relativo al gólem es el de la Sinagoga Vieja de Praga. Sin embargo, el gólem habría sido creado en varias ocasiones y por diversos rabinos ilustres a lo largo de toda la Edad Media a partir del barro, insuflándole después una chispa divina que le habría dado la vida […] Sin embargo, todo gólem carece de un alma propiamente dicha.”
Todo el mundo sabe que, a diferencia de los humanos, los robots y la IA no tienen alma, salvo en las películas de Pixar.        
“Según sostiene una leyenda, la limitación principal del gólem era la incapacidad de hablar. Además, para hacerlo funcionar había que meterle un papel con una orden por la boca u otro orificio.”
¿No es esto último sorprendentemente similar a las tarjetas perforadas de los ordenadores IBM en los 1950s? En cambio, lo de hablar ya está hoy en día más que superado...        
“La creación de un gólem presenta entonces ventajas y desventajas, el gólem es fuerte, pero no inteligente; si se le ordena llevar a cabo una tarea, la llevará a cabo de un modo sistemático, lento y ejecutando las instrucciones de modo literal, sin cuestionamiento ninguno. Famosa en este sentido es una anécdota según la cual la esposa del rabino le pidió al gólem que fuera "al río a sacar agua" a lo que el gólem accedió, pero al pie de la letra: fue al río y comenzó a sacar agua del mismo sin parar, hasta que terminó por inundar la ciudad."
Una excelente descripción de la importancia del prompting, el arte de dar buenas instrucciones. De hecho, las redes sociales nos han dado hace apenas unos días una actualización moderna de esta fábula...        


En una conexión más elaborada, también se puede equiparar al gólem con un sistema automático, por ejemplo, con el sistema de los bancos para conseguir una hipoteca o el sistema de las telcos para gestionar la portabilidad de nuestra línea. Esto hace que nos sintamos cabreados y frustrados cuando nos peleamos contra ese sistema "tonto" que no es capaz de entender y manejar las excepciones. Para una explicación fascinante y profunda de este asunto, se recomienda ver esta charla.




To view or add a comment, sign in

Explore topics