Técnicas para engañar y manipular una IA

Estamos en la era de la Inteligencia Artificial (IA). O eso nos dicen los publicistas, en un engaño de enormes proporciones, donde este argumento de la IA se usa para vendernos cualquier producto, vestido con el impactante argumento: “incorpora IA”. Todo lleva “IA”. Me extraña que no haya salido ropa interior con IA todavía. Aunque probablemente haya algo ya preparándose en el mercado, no me extrañaría.

Antes de nada, dejemos algo muy claro: la IA no existe. Lo comenté hace poco sobre esa noticia relacionada con una androide llamada Sophia. Esa tal Sophia no tiene nada de inteligente, y es solo un sistema de reconocimiento de voz sin más.

Lo que se llama IA es un conjunto de algoritmos sofisticados y complejos que resuelven problemas diversos, pero siempre concretos y cuantificables. No le pida a la IA que razone sobre filosofía o sobre el ser humano, y no espere que estos sistemas de voz como Alexa, Siri y otros tengan respuestas a sus preguntas. Son simples programas informáticos primitivos si se compara con la lógica interna de una sola célula del ser humano. Pero vamos al tema: ¿cómo engañar a una IA? Les cuento un caso reciente.

ia

Una IA es muy fácil de engañar, solo requiere de algo de destreza y habilidad

Estaba recientemente tramitando un anuncio de pago a través de Instagram para promocionar un producto que se encuentra en oferta en estos momentos. Hasta ahí todo normal. El producto tiene un precio, y está de oferta por una serie de motivos. Preparo el anuncio, y lo mando a los censores revisores de Instagram, los cuales revisan el anuncio para verificar que todo es correcto. Hasta ahí todo normal…

Al cabo de unos minutos, recibo un mensaje del personal de Instagram, por el cual el anuncio ha sido rechazado. Examino el motivo, y el motivo del rechazo es que el anuncio incorpora publicidad engañosa. El producto ofertado no se corresponde con el producto final.

Mi sorpresa es absoluta. ¿Cómo dice? ¿Publicidad engañosa? ¿De  qué me está hablando esta gente? Es completamente falso, no hay nada de publicidad engañosa en el anuncio. Pero al instante me doy cuenta de lo que ocurre. Para pequeños movimientos de publicidad, con costes bajos, una IA de Instagram revisa el anuncio y da una respuesta. No lo examinan humanos, porque sería imposible atender las miles de ofertas que se graban en cada instante para promociones por debajo de un umbral.

La IA ha interpretado, por alguna razón, que la oferta no es real. Que la oferta no es cierta. Que es una manipulación. ¿Por qué lo ha interpretado así? Porque las IA se confunden con mucha frecuencia. Y, a veces, con resultados nada agradables. Sus algoritmos son muy complejos. Tan complejos que extraen muchas veces conclusiones ridículas. Y ahí está el peligro: si es realmente muy ridícula, se puede detectar. ¿Y si una IA clasifica un cáncer de un subtipo como de otro subtipo? El tratamiento posterior sería inútil.

Por eso, las IA deben ser constantemente vigiladas y verificadas por seres humanos. La idea de dejar a una IA que tenga el control total de un sistema, de principio a fin, puede tener consecuencias nefastas, peligrosas, y que pueden poner incluso en peligro vidas humanas.

Pero sigamos con mi pequeño problema con la IA de Instagram. ¿Qué solución puedo aplicar? Lo que hago es cambiar ligeramente la estructura de la frase. Añado alguna palabra, busco algún sinónimo. Pequeños cambios sutiles, ya que el anuncio es exactamente el mismo.

Mando el anuncio a Instagram, la IA lo revisa, y, oh milagro, ahora sí autoriza el anuncio y pasa el filtro sin problemas. ¿Por qué? ¿Qué ha ocurrido con la maravillosa IA?

Lo que ha ocurrido es que las IA solo tienen de inteligencia el nombre. Y sé cómo funcionan y operan, ya que yo también programo IAs, y sé cómo se mueven internamente. De hecho he visto los resultados de una IA con problemas; ya expliqué una vez qué me ocurrió con la programación de la IA de una hydra de tres cabezas de un videojuego, que tenía que realizar una serie de acciones, y la pobre hydra terminó paranoica. Pobre Hydra, tuvimos que sacrificarla en el veterinario. Virtualmente claro. Luego la reprogramé casi de cero, y por fin se comportó como se esperaba. Más o menos.

Dorothea
Imagen de la hydra cuya IA programé para un videojuego. Es una buena chica a pesar de su aspecto…

Pero explicaré un poco más por qué funcionó este truco absurdo con Instagram, viendo todo esto de cómo funciona una IA a continuación, para detallar brevemente cómo opera, y mucho más importante, cómo puede usted engañar a una IA. A cualquier IA. Veamos:

Una IA analiza una frase y la convierte en un conjunto de variables que tienen un peso determinado en relación a un contexto. Veamos un anuncio ficticio:

“Vendo mi Opel Corsa de 1984 a buen precio”.

Esta frase se puede convertir en un conjunto de valores, donde cada elemento de la frase, el sujeto, el verbo, y los complementos, tienen un nivel de autenticidad y veracidad con respecto al resto de elementos de la frase. Cada palabra se convierte en una pieza de un algoritmo, donde un peso específico que influye sobre las demás.

En este caso, ese análisis indicaría una frase verdadera. La frase no tiene elementos de peso que puedan convertirse en negativos. Es una simple declaración cuyo valor argumental no puede valorarse como positivo o negativo. No hay precio, no hay estado del vehículo. La IA no puede analizar la frase, y la da por buena.

Ahora bien:

“Vendo Opel corsa de 1984 a buen precio, motor 120 caballos y solo 10.000 km, de cero a cien en tres segundos”.

En este caso la frase compara el producto, un coche Opel Corsa de 1984, con el complemento “motor 120 caballos” y “10.000 km”. Luego analiza la parte que dice “de cero a cien en tres segundos”. La IA analiza el “Opel Corsa”, compara los datos que describo con una base de datos sobre el coche, y sabe que no puede tener 120 caballos, y que la probabilidad de que un coche tan antiguo tenga 10.000 km es muy baja. También sabe que el motor jamás permitiría pasar de cero a cien en tres segundos. Todas las variables que se han generado sobre las descripciones han dado valores negativos o muy negativos. Es decir, todos los “pesos” indican falsedad. Luego, la IA cancela el anuncio, ya que la probabilidad de que sea falso es muy alta.

De acuerdo. Una IA fantástica. Pero, ¿qué ocurre cuando la información confunde a la IA, como me ocurrió a mí recientemente? Y es que es probable que mi estilo literario para escribir anuncios confunda a las IA. Y eso no es culpa mía, sino de la IA.

artificial_intelligence_machine_learning
El aprendizaje de las máquinas no se asemeja en nada al del ser humano, ni tiene las mismas consecuencias

Pero vamos con el ejemplo. Vamos a ver si podemos engañar a la IA para que nos deje poner el anuncio. Recordemos: se trata de pesos específicos verdad/falso y probabilística, sumado a una estadística de frases semánticamente similares que la IA usa como base para obtener un valor sobre el conjunto de argumentos, y ese valor genere un peso específico en una ecuación final verdadero/falso. Dicho esto, tenemos:

“Vendo mi Opel Corsa de 1984 a buen precio, motor modificado a 120 caballos y revisado a 10.000 km”.

¿Puedo haber modificado un Opel Corsa de 1984 para que dé una potencia de 120 caballos? En teoría sí. ¿Y si he hecho un mantenimiento del motor y lo he dejado como si solo tuviese 10.000 km? Cambiando el bloque motor, incluyendo los cilindros por ejemplo, y el carburador. ¿Qué hará la IA?

Depende. Sus algoritmos analizarán la frase, y de una sentencia que es real y cierta podría creer que es falsa. Podría ocurrir que la sentencia fuese falsa, y creyese que es verdadera.

En todo caso, ¿qué hacer en estos casos? Lo mejor es modificar la frase, como he hecho yo, por ejemplo de este modo:

“Vendo mi Opel Corsa de 1984 a buen precio, motor modificado a un caballaje de tres cifras, y revisado a un kilometraje de puesta a punto inicial”.

Lo más probable es que este anuncio sí pase el control  de la IA. El lector sabe que un caballaje de tres cifras es al menos 100 caballos, pero es muy probable que la IA no lo sepa. Y el kilometraje de puesta a punto inicial puede ser cualquier cosa. En todo caso, la IA no sabrá que estamos engañándola, tanto como al lector inocente, que va a recibir un mensaje falso de un coche que es una trampa meditada y precisa. En definitiva: hemos hecho que esos pesos que generaban valores negativos no puedan resolverse como tales, haciendo que un anuncio falso resulte en verdadero.

1984-opel-corsa-pic-14574-640x480
Opel Corsa de 1984

¿Qué podemos, en definitiva, hacer para engañar a una IA?

El secreto está en el lenguaje. En las palabras, pero sobre todo en la relación entre palabras y el contexto. Repito: palabra, contexto. Porque es la palabra, y el contexto, los que se introducen en la ecuación, para generar un peso específico, y calcular la certeza o falsedad de la afirmación.

La IA convierte todos esos valores en ecuaciones y pesos probabilísticos en función de los términos, y asigna una probabilidad final de verdadero/falso. Si la primera vez que lo intentamos sale un falso, podremos retocar el contexto de la frase ligeramente, e ir cambiando los pesos entre las frases y palabras, hasta encontrar un texto final que sea aprobado por la IA. Un texto que sea positivamente identificado por la IA, y permita publicar el anuncio.

Mucha gente pensará que publicitar un coche tan antiguo y sencillo como la oportunidad de una vida es algo que poca gente creerá. Y es cierto, pero, sin embargo, estos anuncios funcionan, y solo hay que ver la carpeta de spam de gmail y de otros sistemas para ver cómo reconocen los anuncios falsos. Sin embargo, algunos siguen entrando, y quienes no tienen sistemas antispam se ven inundados de anuncios falsos.

Yo propondría a la comunidad científica en general que cambiaran el término IA por algo como “Algoritmos de conocimiento avanzado” (“Advanced Cognitive Algorithms“, o ACA) para dejar bien claro que estamos tratando con algoritmos que simulan un cierto conocimiento, pero nada más.

Ese sería un buen término. Pero como tengo cero influencia en el mundo académico, científico y en mi casa, se seguirá usando el término IA. Y se podrá seguir publicitando algo que no existe, y que es bastante fácil de engañar.

Parece que nos gusta que nos engañen; cuántas mentiras creemos, y qué pocas verdades. Pero esa es la naturaleza del ser humano. Cambiar eso sí va a ser muy, muy difícil.


 

 

Anuncios

Autor: Fenrir

Amateur writer, I like aviation, movies, beer, and a good talk about anything that concerns the human being.

3 comentarios en “Técnicas para engañar y manipular una IA”

  1. qué interesante y detallado. me vino en la mente un ejemplo real que sucedió hace un par de meses en facebook: a un conocido le bloquearon la publicación de una receta culinaria con el título: como preparar XXX. la confusión surgió en el nombre del plato, totalmente inocente, pero que, a la vez, se usa como jerga, en muy pocos contextos, para referirse a los hombres homosexuales. era el punto de risas y bromas por unos días en varias comunidades ruso-hablantes, pero era obvio que este error jamas cometería una persona. sin embargo, la IA aprende, y se corrige, evoluciona. creo que podría superar este tipo de confusiones. pero cuando las supera, el humano ay tendrà otros trucos 🙂

    1. Efectivamente, una IA no conoce el contexto, o no lo sitúa siempre en el entorno adecuado. Recuerdo un caso de un servicio de correo que verificaba si se mandaban desnudos, y si era así los borraba. Un grupo de médicos especialistas en cáncer de mama vieron que sus fotos de pacientes desaparecían de sus correos cuando se mandaban imágenes unos a otros. Tuvieron que protestar para que no se les borrara su material de trabajo. Una vez más, la mente humana es infinitamente superior, como no podía ser de otro modo. Saludos y gracias por comentar.

      1. sí, hay cosas bastante locas, pero se corrigen. de todas maneras la IA está en proceso de mejor continua. siempre es un placer leerlo:) muy interesante

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.