Versione PDF di: Por qué doblar una toalla es más difícil que el ajedrez para la IA

Questa è una versione PDF del contenuto. Per la versione completa e aggiornata, visita:

https://blog.tuttosemplice.com/es/por-que-doblar-una-toalla-es-mas-dificil-que-el-ajedrez-para-la-ia/

Verrai reindirizzato automaticamente...

Por qué doblar una toalla es más difícil que el ajedrez para la IA

Autore: Francesco Zinghinì | Data: 23 Febbraio 2026

Estamos en febrero de 2026. Los modelos de lenguaje masivos (LLM) escriben sinfonías, generan vídeo hiperrealista en segundos y diagnostican enfermedades raras con una precisión que avergüenza a los mejores especialistas humanos. Sin embargo, si entras en el laboratorio de robótica más avanzado del mundo y le pides a su máquina más sofisticada que doble una toalla arrugada sacada de una cesta, serás testigo de un espectáculo lamentable: pausas interminables, movimientos torpes y, con frecuencia, un fallo catastrófico. Esta contradicción flagrante, que ha desconcertado a los ingenieros durante décadas, tiene un nombre: la Paradoja de Moravec.

Hans Moravec, junto con otros pioneros de la inteligencia artificial como Rodney Brooks y Marvin Minsky, formuló esta observación en los años 80, y hoy, en la era dorada de la IA generativa y ChatGPT, sigue siendo una verdad incómoda. La premisa es contraintuitiva para la mente humana: el razonamiento de alto nivel requiere muy poca computación, mientras que las habilidades sensomotoras de bajo nivel requieren recursos computacionales enormes. En términos sencillos, es comparativamente fácil hacer que una computadora juegue al ajedrez a nivel de Gran Maestro, pero es increíblemente difícil darle las habilidades de percepción y movilidad de un niño de un año.

La ilusión de la dificultad: ¿Qué es realmente inteligente?

Para entender por qué doblar una toalla es una tarea titánica para un algoritmo, primero debemos deconstruir nuestra propia percepción de la dificultad. Los humanos tendemos a juzgar la complejidad de una tarea basándonos en cuánto esfuerzo consciente nos requiere. El cálculo integral, el ajedrez o la traducción de idiomas nos parecen difíciles porque requieren años de estudio deliberado y concentración. Por el contrario, caminar, reconocer una cara o manipular un objeto blando nos parece “gratis”; lo hacemos sin pensar.

Sin embargo, desde la perspectiva de la automatización y el diseño de software, la realidad es inversa. El ajedrez opera en un mundo cerrado, con reglas finitas, discretas y perfectas. No hay fricción, no hay gravedad, no hay sombras engañosas. Es pura lógica simbólica. Una toalla, por el contrario, es un objeto deformable en un entorno físico caótico. No tiene una forma definida; puede adoptar un número casi infinito de configuraciones geométricas. Para un sistema de visión por computadora, una toalla arrugada es una pesadilla de oclusiones (partes de la tela que tapan otras partes) y texturas repetitivas que confunden a los sensores de profundidad.

El infierno matemático de los objetos deformables

Profundicemos en el aspecto técnico. Cuando una IA juega al Go o al ajedrez, explora un árbol de decisiones. Aunque el número de partidas posibles es astronómico, el estado del tablero es siempre 100% conocible. No hay ambigüedad. Cuando un robot intenta manipular una toalla, se enfrenta a lo que en física e ingeniería se conoce como un sistema con grados de libertad infinitos.

Un objeto rígido, como una taza, tiene 6 grados de libertad (posición y orientación en el espacio). Un robot puede calcular la trayectoria para agarrar la taza con relativa facilidad usando cinemática inversa. Pero una toalla es un objeto no rígido. Cada punto de la tela puede moverse independientemente de los demás, sujeto a restricciones de elasticidad y gravedad. Para que un algoritmo de machine learning prediga cómo se comportará la toalla si la agarra por una esquina, debe simular una física compleja en tiempo real.

Además, está el problema de la percepción. Las redes neuronales convolucionales (CNN) son excelentes para clasificar imágenes 2D, pero luchar contra la geometría tridimensional de un objeto que cambia de forma al ser tocado es otro nivel. El robot debe coordinar la información visual con la retroalimentación háptica (tacto). Si aprieta demasiado, la toalla se deforma de manera impredecible; si aprieta muy poco, se resbala. Esta coordinación visomotora, que nosotros damos por sentada, es un problema de control de bucle cerrado extremadamente complejo.

La herencia evolutiva: 4.000 millones de años de I+D

La explicación más profunda de la Paradoja de Moravec reside en la biología evolutiva. La razón por la que nos resulta “fácil” ver, oír, caminar y manipular objetos es que llevamos más de 500 millones de años de evolución animal optimizando el hardware y el “wetware” (cerebro) para estas tareas. Son funciones críticas para la supervivencia. La naturaleza ha dedicado eones a perfeccionar nuestra corteza visual y nuestro cerebelo.

Por otro lado, el pensamiento abstracto —la lógica, las matemáticas, el lenguaje complejo— es una adquisición evolutiva muy reciente, de apenas unos cientos de miles de años. Es una capa fina y superficial sobre un océano de procesamiento inconsciente. Cuando diseñamos inteligencia artificial, empezamos intentando replicar esa capa fina (lógica simbólica) porque era lo que entendíamos conscientemente. Fue un éxito rápido. Pero cuando intentamos replicar el océano subyacente (percepción y motricidad), nos dimos cuenta de que no teníamos ni idea de cómo funcionaba realmente nuestro propio cerebro en esos niveles basales.

Como señaló Moravec: “Estamos todos prodigiosamente equipados para interpretar el mundo sensorial y actuar en él, pero no somos conscientes de lo difícil que es, porque lo hacemos demasiado bien”.

El abismo entre el mundo digital y el físico

En 2026, los modelos de deep learning han transformado el procesamiento de datos. Un LLM puede escribir código en Python o redactar un ensayo legal porque el texto es un dato discreto y digital. No hay ruido físico. Pero la robótica introduce el caos del mundo real. Un robot que dobla toallas no puede simplemente “alucinar” una solución como a veces hace ChatGPT; si alucina una trayectoria física, rompe el objeto o se rompe a sí mismo.

Los avances actuales intentan cerrar esta brecha mediante el aprendizaje por refuerzo (Reinforcement Learning) y el entrenamiento en simulación (Sim2Real). Los ingenieros crean miles de toallas virtuales en entornos simulados donde la IA puede intentar doblarlas millones de veces sin coste físico. Luego, intentan transferir ese “cerebro” a un robot real. El problema es la “brecha de la realidad”: la fricción de la tela real, la elasticidad exacta y las condiciones de luz nunca coinciden perfectamente con la simulación. El robot se encuentra, de nuevo, perdido en la traducción.

¿Por qué es importante resolver esto?

Podría parecer trivial que un robot no sepa doblar la colada. Pero la toalla es solo un proxy de un problema mucho mayor: la generalización en el mundo físico. Si queremos robots que cuiden a ancianos, que limpien residuos tóxicos o que realicen cirugías autónomas, necesitamos resolver la Paradoja de Moravec. Necesitamos IAs que entiendan la física intuitiva, no solo a través de ecuaciones, sino a través de la experiencia sensomotora, tal como lo hace un niño.

Actualmente, estamos viendo el surgimiento de “Modelos de Fundación para Robótica” (Robotic Foundation Models), que intentan aplicar la lógica de los grandes modelos de lenguaje a las acciones físicas. En lugar de predecir la siguiente palabra, intentan predecir el siguiente movimiento articular. Aunque prometedor, el coste computacional y de datos sigue siendo la barrera. El universo físico tiene un ancho de banda de datos infinitamente mayor que todo el texto de internet.

Conclusión

La Paradoja de Moravec nos enseña una lección de humildad tecnológica. Nos recuerda que lo que consideramos “inteligencia” es a menudo solo la punta del iceberg de nuestras capacidades cognitivas. Mientras celebramos que una inteligencia artificial pueda aprobar el examen de la abogacía o ganar concursos de arte, no debemos olvidar que, en términos de interacción con el mundo físico, nuestras máquinas más avanzadas todavía luchan por alcanzar la competencia de una cucaracha o un niño pequeño.

Doblar una toalla no es solo una tarea doméstica; es el Santo Grial de la robótica moderna. El día que una máquina pueda entrar en una casa desconocida, encontrar una cesta de ropa sucia y doblar una toalla con la misma elegancia y distracción con la que lo hace un humano, sabremos que la verdadera Era de la Inteligencia Artificial General habrá llegado. Hasta entonces, el ajedrez seguirá siendo fácil, y la colada, el desafío final.

Preguntas frecuentes

¿Qué es la Paradoja de Moravec en la inteligencia artificial?

La Paradoja de Moravec es una observación fundamental en robótica que establece una contradicción contraintuitiva: el razonamiento de alto nivel, como jugar al ajedrez o resolver matemáticas, requiere relativamente poca computación, mientras que las habilidades sensomotoras básicas, como caminar o percibir el entorno, exigen recursos computacionales enormes. Esto explica por qué es más fácil crear una IA que supere a un Gran Maestro de ajedrez que construir un robot con la destreza manual de un niño pequeño.

¿Por qué es tan difícil para un robot doblar una toalla?

Doblar una toalla es extremadamente complejo para un robot porque se trata de un objeto deformable con grados de libertad infinitos. A diferencia de los objetos rígidos, una toalla no tiene una forma definida y cambia geométricamente al ser tocada, lo que obliga al algoritmo a simular una física compleja en tiempo real. El robot debe coordinar constantemente su visión con la retroalimentación táctil para evitar que la tela se resbale o se arrugue de forma impredecible, un desafío que supera a la mayoría de los sistemas actuales.

¿Cuál es la diferencia entre la dificultad percibida por humanos y por la IA?

Los humanos juzgamos la dificultad basándonos en el esfuerzo consciente; por eso el cálculo nos parece difícil y caminar nos parece fácil. Sin embargo, para la inteligencia artificial la realidad es inversa: las tareas lógicas operan en mundos cerrados con reglas finitas y son fáciles de programar, mientras que interactuar con el mundo físico requiere procesar un caos de datos sensoriales, fricción y gravedad que la evolución biológica ha optimizado en nosotros durante millones de años, pero que es computacionalmente costoso para las máquinas.

¿Qué soluciones se están desarrollando para mejorar la motricidad de los robots?

Para superar estas limitaciones, los ingenieros están utilizando el aprendizaje por refuerzo y el entrenamiento en simulación, conocido como Sim2Real. Esto permite a las inteligencias artificiales practicar tareas físicas millones de veces en entornos virtuales antes de intentar realizarlas en el mundo real. Además, están surgiendo los Modelos de Fundación para Robótica, que intentan aplicar la lógica predictiva de los grandes modelos de lenguaje a las secuencias de movimiento articular.

¿Por qué es importante que los robots aprendan a manipular objetos blandos?

Lograr que un robot manipule objetos deformables como una toalla es crucial porque representa la capacidad de generalización en el mundo físico. Resolver este problema, conocido como el Santo Grial de la robótica moderna, es el paso necesario para desarrollar máquinas capaces de realizar tareas útiles y delicadas, como el cuidado de ancianos, la limpieza de residuos peligrosos o la realización de cirugías autónomas, acercándonos a una verdadera Inteligencia Artificial General.