Ingeniería de prompts — habla con las IA como un pro — 3. Guiar el razonamiento

17 min read min de lecture
Capítulo 03

Guiar el razonamiento

Capítulo 3 de 10 · 30%

Objetivos de este capítulo

  • Usar el chain-of-thought en las tareas complejas
  • Descomponer los grandes problemas y hacer verificar las respuestas
  • Saber cuándo guiar el razonamiento — y cuándo es inútil

Por qué un modelo tan sabio se equivoca en un cálculo simple

Sofía prepara el presupuesto de una campaña: descuento del 15 %, margen del 35 %, IVA... Lo pega todo en el chat, pregunta «¿cuál es el presupuesto final?» y obtiene una cifra falsa. ¿Cómo puede un sistema capaz de disertar sobre física cuántica fallar un cálculo de porcentajes?

Porque un modelo de lenguaje no «calcula»: predice texto, palabra a palabra. Cuando exiges una respuesta inmediata, le pides que produzca el resultado de un razonamiento... sin hacer el razonamiento. En un problema de múltiples etapas, es como exigir a un humano que responda de cabeza, al instante, sin borrador. Los errores no son una fatalidad del modelo: son una consecuencia de la forma de pedir.

El remedio es simple y es una de las técnicas más documentadas del prompt engineering: dar al modelo el derecho — y la instrucción — de plantear su borrador antes de concluir.

Chain-of-thought: razonar antes de responder

En un problema lógico, matemático o de múltiples etapas, añade «razona paso a paso antes de responder». El modelo plantea entonces su razonamiento explícitamente: identifica los datos, desarrolla los cálculos intermedios, y luego concluye. Cada etapa escrita condiciona la siguiente, lo que reduce mucho los errores respecto a una respuesta directa. Es el chain-of-thought (cadena de pensamiento).

PROMPT
Un producto cuesta 80 €. Con un margen del 35 % sobre el precio de venta, ¿cuál es el precio de venta?
Razona paso a paso, y luego da el resultado final.

Este ejemplo es tramposo a propósito: un margen del 35 % sobre el precio de venta no se calcula como 80 × 1,35. En respuesta directa, muchos modelos caen en la trampa. En razonamiento guiado, el modelo plantea la ecuación (precio de venta = coste / (1 − 0,35)) y encuentra 123,08 €. El borrador no es un lujo: es lo que evita el error.

flowchart LR
  Q["Problema de múltiples etapas"] --> E1["Etapa 1: plantear los datos"]
  E1 --> E2["Etapa 2: calcular"]
  E2 --> V["Verificar la coherencia"]
  V --> R["Línea final: Respuesta"]
El chain-of-thought: el razonamiento explícito reduce los errores y se puede verificar.

Beneficio secundario, al menos tan valioso como la exactitud: el razonamiento es auditable. Cuando la respuesta es falsa, ves en qué etapa se coló el error — un dato mal leído, una fórmula invertida — y corriges precisamente ese punto en lugar de relanzar al azar esperando algo mejor.

Separar reflexión y respuesta

El razonamiento completo es útil para verificar, pero engorroso de usar: Sofía no va a pegar quince líneas de cálculo en su email al director financiero. La buena práctica consiste en pedir las dos cosas, claramente separadas: primero la reflexión, luego una conclusión aislada y concisa.

PROMPT
Calcula el presupuesto final de la campaña:
- 3 publicaciones patrocinadas a 450 € cada una
- descuento negociado del 15 % sobre el total
- servicio de la agencia: 20 % del importe tras el descuento

Razona paso a paso planteando cada cálculo.
Termina con una línea «Respuesta:» con únicamente el importe final en euros.

Obtienes a la vez el rigor (el razonamiento, que puedes verificar en diez segundos) y lo utilizable (la conclusión, que puedes copiar tal cual). Esta separación es un hábito a adoptar en toda tarea analítica: análisis y luego recomendación, diagnóstico y luego corrección, comparación y luego veredicto.

Para una conclusión limpia: «termina con una línea ‘Respuesta:’ que resuma sin el razonamiento». También puedes pedir el razonamiento en una sección «Borrador» y la respuesta en una sección «Conclusión» — práctico para leer solo el final cuando tienes prisa.

La descomposición: trocear los grandes problemas

El chain-of-thought ayuda en un problema de una decena de etapas. Pero algunos trabajos son demasiado grandes para un solo prompt, incluso bien guiado: analizar 40 respuestas a una encuesta, redactar un dosier completo, comparar tres proveedores en ocho criterios. La técnica reina aquí es la descomposición: trocear el trabajo en subtareas, y tratarlas una a una, cada respuesta alimentando la siguiente.

Para su balance de campaña, Sofía ya no pide «analiza estos resultados y redacta el balance». Encadena: 1) «lista las 5 lecciones principales de estas cifras», 2) «para cada lección, propón una acción concreta», 3) «redacta ahora el balance siguiendo este plan». Tres prompts cortos, cada uno verificable, en lugar de un prompt monstruo cuya salida es inverificable en bloque.

La descomposición tiene una ventaja oculta: te mantiene en el circuito. Entre cada etapa, puedes corregir, reorientar, descartar una mala pista — antes de que contamine todo lo que sigue. Un prompt único gigante, en cambio, no te ofrece ningún punto de control intermedio.

La autocrítica: hacer revisar el trabajo

Última técnica de la familia: pedir al modelo que critique su propia respuesta. Tras una primera salida, encadena con: «Relee tu respuesta. Verifica cada cálculo y cada afirmación. Lista los posibles errores o debilidades, y luego da una versión corregida.» El modelo detecta a menudo sus propias faltas durante esta relectura — exactamente como un humano que se relee en frío.

También puedes integrar la verificación de antemano en el prompt inicial: «antes de dar tu respuesta final, verifica la coherencia de cada etapa». Es lo que hace la casilla «Verificar la coherencia» del diagrama de arriba. Atención, sin embargo: la autocrítica mejora, pero no garantiza nada. Un modelo puede validar con aplomo un error que acaba de cometer. Para toda cifra o hecho crítico, la verificación final sigue siendo humana.

La autocrítica es temible también en los textos: «relee este post y critícalo desde el punto de vista de un restaurador con prisa: ¿qué le haría desconectar?» da a menudo mejores pistas de mejora que «mejora este post».

Cuándo guiar el razonamiento — y cuándo abstenerse

Estas técnicas tienen un coste: respuestas más largas, más lentas, más caras en contexto. Desenfundarlas para todo sería contraproducente. Aquí está el mapa de usos:

Respuesta directa (zero-shot)Tareas simples e inmediatas: reformular, traducir, resumir un texto corto. El razonamiento guiado solo aportaría pesadez.
Chain-of-thoughtProblemas lógicos, cálculos, decisiones multicriterio que caben en un prompt. «Razona paso a paso, luego Respuesta:».
DescomposiciónTrabajos demasiado grandes para un prompt: análisis largos, dosieres, comparativas. Trocea en subtareas encadenadas, con control humano entre cada una.
AutocríticaComo complemento de las demás, cuando lo que está en juego justifica una pasada de verificación: cifras importantes, texto de alto impacto, razonamiento con riesgo.

Nota por último que los modelos recientes llamados «de razonamiento» aplican una forma de chain-of-thought internamente, sin que se lo pidan. Incluso con ellos, estos reflejos siguen siendo útiles: exigir el detalle de las etapas hace la respuesta verificable, y la descomposición mantiene el control humano sobre los grandes trabajos. La técnica evoluciona, el principio — nunca aceptar una conclusión inverificable — permanece.

Los límites: un razonamiento plausible no es un razonamiento correcto

Una última advertencia, que vale para todo este capítulo. El chain-of-thought produce un razonamiento plausible — no necesariamente correcto. El modelo puede desarrollar etapas impecables en apariencia y colar un error en medio, con la misma seguridad tranquila. La fluidez del texto no es una prueba de validez.

El reflejo profesional: verificar las etapas críticas (las cifras, los hechos con fecha, las afirmaciones sorprendentes), no solo leer la conclusión. El razonamiento explícito no reemplaza tu juicio — simplemente lo hace posible, allí donde una respuesta seca te obligaba a creer bajo palabra. Es exactamente por eso que se exige.

🛠️ Te toca a ti

Contexto

Sofía debe presentar mañana el presupuesto de su campaña de fin de año al director financiero. El cálculo mezcla tres publicaciones patrocinadas con tarifas diferentes, un descuento del 15 % negociado con la agencia de medios, la comisión del 20 % de la agencia sobre el importe con descuento, y un presupuesto tope de 2 000 € que no se debe superar. Su primer intento en respuesta directa dio una cifra que no sabe verificar — y ya le llamaron la atención el mes pasado por un error de cálculo. Esta vez, quiere un resultado correcto Y verificable.

Instrucciones

  1. Plantea el problema completo a la IA con todos los datos numéricos, en respuesta directa primero (sin guiado).
  2. Relanza con «razona paso a paso planteando cada cálculo, y luego termina con una línea Respuesta:».
  3. Compara los dos resultados: ¿son idénticos? Si no, ¿cuál permite verificar el razonamiento?
  4. Verifica tú mismo dos etapas intermedias del razonamiento (un cálculo, un dato retomado).
  5. Encadena con una autocrítica: «relee tu razonamiento, verifica cada cálculo, señala cualquier error y corrige».
  6. Añade la restricción del tope: «¿el presupuesto supera los 2 000 €? Si es así, propón dos vías de ahorro con cifras».
  7. Anota en tus prompts ganadores la fórmula de guiado que mejor funcionó.
Pista — El razonamiento explícito te permite detectar dónde se cuela un error. Verifica las etapas, no solo la cifra final — ahí está todo el interés del método.

En resumen

  • Un modelo predice texto: exigir una respuesta inmediata en un problema complejo es prohibir el borrador.
  • «Razona paso a paso» (chain-of-thought) reduce mucho los errores en las tareas de múltiples etapas.
  • Separa reflexión y respuesta: el razonamiento para verificar, una línea «Respuesta:» para usar.
  • Descompón los grandes trabajos en subtareas encadenadas: cada etapa se vuelve verificable y corregible.
  • La autocrítica («relee y verifica tu respuesta») atrapa una parte de los errores — no todos.
  • Inútil en las tareas triviales: el guiado del razonamiento se reserva para los problemas que lo justifican.
  • Un razonamiento plausible no es necesariamente correcto: verifica tú mismo las etapas críticas.

Quiz — comprueba tu comprensión

1. ¿Cuándo es útil el chain-of-thought?

El razonamiento guiado brilla en las tareas lógicas o de varias etapas; recarga inútilmente las peticiones simples.

2. ¿Cómo obtener una conclusión limpia?

Aislar la respuesta final la hace directamente explotable, conservando el razonamiento para la verificación.

3. ¿Por qué un modelo se equivoca a menudo en respuesta directa en un cálculo de etapas?

Sin borrador explícito, el modelo debe producir la conclusión de un razonamiento que no ha planteado. Autorizarlo a razonar lo cambia todo.

4. ¿Cuál es el principal interés de la descomposición en subtareas?

Trocear te permite corregir el rumbo entre las etapas, en lugar de recibir un bloque final inverificable.

5. ¿Qué garantiza un razonamiento paso a paso bien redactado?

La fluidez no es una prueba. El razonamiento explícito hace posible la verificación; no la reemplaza.

Auteur(s)

R

REHOUMA Haythem

Haythem Rehouma est un ingénieur et architecte IA et cloud, formateur et enseignant technique, avec un profil orienté IA médicale, AWS, MLOps, LLM/RAG et vision par ordinateur.