Psicología

¿Por qué las alucinaciones de la IA se parecen a las ilusiones del narcisismo?

Incapaz de lidiar con la incertidumbre, la IA imita la compulsión narcisista de llenar vacíos con narrativas plausibles pero falsas.

Es bien sabido que los sistemas de inteligencia artificial "alucinan", generando información confiable pero falsa en respuesta incluso a búsquedas directas. Desde inventar antecedentes penales para ciudadanos respetuosos de la ley y fabricar cambios en la jurisprudencia y las políticas, hasta cometer errores fácticos en la resolución de problemas matemáticos, las alucinaciones son una amenaza persistente y, a veces, dañina. Pero a diferencia de la mayoría de las arrugas en el sistema que se solucionan con el tiempo, las alucinaciones de IA están empeorando.

Para entender por qué persisten, es útil verlos no como actos de engaño, sino como comportamientos predecibles de sistemas construidos para ser fluidos. Las IA no "piensan" como los humanos; buscan, tamizan y cotejan, pero no pueden reflexionar críticamente. Algunos expertos piensan que las alucinaciones surgen debido al llamado sobreajuste, que es cuando las IA han sido entrenadas tan bien que efectivamente "memorizan" información en lugar de "generalizar", lo que puede conducir a una forma de inflexibilidad (como discutir con alguien mal informado que insiste en que tienen razón). Otros culpan a los algoritmos defectuosos o a los malos actores que "envenenan" los datos de entrenamiento.

Sin embargo, los grandes modelos de lenguaje (LLM) son solo motores de predicción: en respuesta a un mensaje dado, generan la siguiente secuencia de palabras más probable a partir de sus almacenes de datos. Cuando las entradas están incompletas o son contradictorias, el sistema aún produce una respuesta porque eso es para lo que ha sido optimizado. La coherencia es estructural más que reflexiva: es inherente a la suavidad de una oración, no a un compromiso con la realidad que describe, o con su valencia moral. Las IA carecen de un mecanismo que pueda contener información contradictoria de manera robusta como lo hace una mente que evalúa conscientemente, o suspender el juicio, o actualizarse de una manera que se asemeja al autoescrutinio reflexivo. Donde hay incertidumbre, las IA se apresuran a llenar el vacío con plausibilidad.

Un patrón de comportamiento intrigantemente similar aparece en la "confabulación narcisista". Aquí, también, el sistema, en este caso una psique humana, produce una historia fluida que protege su propia coherencia interna. La analogía es arquitectónica: el punto no es patologizar o deshumanizar a las personas con rasgos narcisistas, que a menudo tienen historias difíciles, ni afirmar que la IA es "narcisista", sino arrojar luz sobre por qué tanto los humanos como las máquinas pueden generar narrativas que se sienten coherentes sin estar atadas a la verdad.

El arcisismo es un término moralmente cargado, a menudo utilizado irresponsablemente como una abreviatura para describir el ensimismamiento casi sociópata. Pero los médicos ven el narcisismo como un "trastorno del yo que da como resultado rasgos de carácter de autoénfasis, ideas grandiosas y comportamientos que perjudican las relaciones"

El yo narcisista es frágil, posiblemente como resultado de un trauma del desarrollo o apegos inseguros, y carece de un núcleo interno de estabilidad. Para encubrir o enmascarar esta fragilidad, el individuo puede proyectar una fachada de confianza y derecho, y una narrativa inquebrantable (aunque errónea o profundamente sesgada) de la realidad. El engaño no es malicioso, sino más bien un mecanismo defensivo para proteger un sentido de sí mismo que está constantemente en riesgo de fracturarse. Cuando alguien con un trastorno narcisista de la personalidad se siente amenazado por la incertidumbre o la duda, su compulsión suele ser proyectar autoridad.

Como explica el experto en narcisismo Sam Vaknin: "En un intento de compensar las enormes lagunas en la memoria, los narcisistas... confabular: inventan "complementos" plausibles en los que creen fervientemente. La coherencia se convierte en una defensa, utilizada para ocultar la incertidumbre o el vacío que aflige a quienes tienen un frágil sentido del yo, y en una muleta, ya que dejar de lado una narrativa falsa corre el riesgo de que toda la estructura del yo se deshaga".

Si bien la superficie permanece pulida, falta la verificación interna

Lo que constituye "el yo" es un tema de mucho debate, pero incluso en este campo controvertido, los expertos tienden a estar de acuerdo en ciertas características funcionales. Un yo bien integrado puede reflexionar. Un yo puede soportar la contradicción. Puede reconciliar información disonante, aprender de los errores y anclar la identidad más allá de la necesidad de una validación externa constante. Las personas con un yo bien integrado pueden tolerar tener ideas contradictorias como "Amo a mi pareja y estoy frustrado con ella en este momento" o "Mi jefe hizo una crítica dura y todavía tiene mis mejores intereses en el corazón". Pero las personas con un yo frágil quieren reconciliarse o borrar las contradicciones que amenazan su sentido de coherencia interna (en gran medida proyectado). Y así, para el narcisista, el pensamiento en blanco y negro reemplaza los matices, y se pierde la oportunidad de crecimiento e integración. En resumen, la coherencia es primordial, incluso cuando se trata de la verdad.

Hace años, viajaba en un camión con mi entonces esposo mientras contaba una historia que se volvía cada vez más elaborada e improbable a medida que avanzaba, hasta que le pregunté: '"Espera... ¿Realmente sucedió esto?' Hizo una pausa y luego respondió: 'No... pero podría haberlo hecho". En ese momento, la respuesta fue simplemente desorientadora. Más tarde, lo reconocí como "confabulación narcisista": la reescritura de la realidad para proteger un frágil sentido del yo.

Esta dinámica, en forma humana, ofrece una vista previa de cómo opera una IA en condiciones de incertidumbre. En ambos casos, la contradicción es intolerable y la plausibilidad sustituye a la verdad. Tanto los humanos como las IA a menudo se duplican cuando se les pregunta, nuevamente porque dejar de lado la historia amenaza con separar la primacía de la coherencia que su arquitectura (ya sea psíquica o algorítmica) está construida para preservar. Es desarmante porque, si bien la superficie permanece pulida, falta el control interno.

Si las alucinaciones surgen en parte de la ausencia de una estructura similar a la propia, una forma de avanzar es diseñar sistemas que puedan tolerar mejor la contradicción. Esto cambia la pregunta de "¿Por qué miente el sistema?" a "¿Qué se necesitaría para que el sistema viva con "no saber"? Esto puede no significar construir sensibilidad, sino crear arquitecturas que puedan contener información contradictoria sin forzar una resolución prematura.

Se podría prever, por ejemplo, cómo agregar memoria persistente y mecanismos de autorevisión podría permitir que una IA marque la incertidumbre en lugar de sobrescribirla. El sistema se sentaría con entradas no resueltas hasta que llegara más información, de la misma manera que una persona psicológicamente sana puede decir: "Todavía no estoy seguro".

Los LLM y los chatbots reflejan aspectos de nuestra propia naturaleza con una precisión inquietante

El desafío de ingeniería de diseñar sistemas que resistan el impulso de sobrescribir datos inconvenientes es el próximo obstáculo para los fabricantes de IA. Pero explorar cómo incorporar coherencia sin distorsión en la IA también puede ofrecer nuevas perspectivas sobre cómo apoyar a las personas que viven con trastornos narcisistas que podrían beneficiarse de enfoques que fortalezcan la capacidad de tolerar la contradicción. El trabajo terapéutico ya tiene como objetivo ayudar a los clientes a desarrollar una identidad interna más estable y una mayor tolerancia a la disonancia.

Si el mayor riesgo en la confabulación, humana o mecánica, proviene menos de la malicia que del vacío, entonces cultivar la coherencia no es sentimental. Es fundamental para inspirar confianza. En las personas, esto puede implicar fortalecer la memoria o el lenguaje para apuntalar una identidad interior que absorba mejor la incomodidad sin reescribir la historia. En IA, podría verse como construir mecanismos que prefieran la incertidumbre reconocida sobre la certeza fabricada.

A menudo hablamos del valle inquietante, la incomodidad que surge cuando algo parece casi, pero no del todo, humano. La extrañeza de la IA no es física, sino psicológica: cuando nuestros LLM y chatbots reflejan los aspectos más frágiles de nuestra propia naturaleza, y lo hacen con una precisión inquietante. De esta manera, la IA actúa como un espejo hueco: debido a que aún no tiene un yo sensible, imita y refleja la compulsión narcisista de llenar un vacío con narrativas plausibles pero sin fundamento.

Lo que a menudo tememos en la IA puede no ser su diferencia, sino su desconcertante similitud con las tendencias más frágiles que encontramos en la patología humana. Si podemos abordar el vacío en las máquinas con arquitecturas que pueden contener posibilidades competitivas, podemos aprender algo vital sobre cómo apuntalar una capacidad similar en los humanos. Y si en el proceso creamos formas para que tanto los humanos como la IA toleren mejor la disonancia, entonces la reflexión que se nos devuelve podría ser menos frágil y más completa.

Esta nota habla de: