Engenharia de prompts — falar com as IA como um profissional — 3. Guiar o raciocínio

17 min read min de lecture
Capítulo 03

Guiar o raciocínio

Capítulo 3 de 10 · 30%

Objetivos deste capítulo

  • Usar o chain-of-thought nas tarefas complexas
  • Decompor os grandes problemas e fazer verificar as respostas
  • Saber quando guiar o raciocínio — e quando é inútil

Porque é que um modelo tão sabedor se engana num cálculo simples

A Sofia prepara o orçamento de uma campanha: desconto de 15 %, margem de 35 %, IVA... Cola tudo no chat, pergunta «qual é o orçamento final?» e obtém um número errado. Como pode um sistema capaz de dissertar sobre física quântica falhar um cálculo de percentagens?

Porque um modelo de linguagem não «calcula»: prediz texto, palavra a palavra. Quando exiges uma resposta imediata, estás a pedir-lhe que produza o resultado de um raciocínio... sem fazer o raciocínio. Num problema com várias etapas, é como exigir a um humano que responda de cabeça, instantaneamente, sem rascunho. Os erros não são uma fatalidade do modelo: são uma consequência da forma de pedir.

A solução é simples e é uma das técnicas mais documentadas do prompt engineering: dar ao modelo o direito — e a instrução — de fazer o seu rascunho antes de concluir.

Chain-of-thought: raciocinar antes de responder

Num problema lógico, matemático ou com múltiplas etapas, acrescenta «raciocina passo a passo antes de responder». O modelo expõe então o seu raciocínio explicitamente: identifica os dados, desenrola os cálculos intermédios, e depois conclui. Cada etapa escrita condiciona a seguinte, o que reduz fortemente os erros em comparação com uma resposta direta. É o chain-of-thought (cadeia de pensamento).

PROMPT
Um produto custa 80 €. Com uma margem de 35 % sobre o preço de venda, qual é o preço de venda?
Raciocina passo a passo, depois dá o resultado final.

Este exemplo é traiçoeiro de propósito: uma margem de 35 % sobre o preço de venda não se calcula como 80 × 1,35. Em resposta direta, muitos modelos caem na armadilha. Em raciocínio guiado, o modelo formula a equação (preço de venda = custo / (1 − 0,35)) e encontra 123,08 €. O rascunho não é um luxo: é ele que evita o erro.

flowchart LR
  Q["Problema multi-etapas"] --> E1["Etapa 1: expor os dados"]
  E1 --> E2["Etapa 2: calcular"]
  E2 --> V["Verificar a coerência"]
  V --> R["Linha final: Resposta"]
O chain-of-thought: o raciocínio explícito reduz os erros e é verificável.

Benefício secundário, pelo menos tão precioso quanto a exatidão: o raciocínio é auditável. Quando a resposta está errada, vês em que etapa o erro se infiltrou — um dado mal lido, uma fórmula invertida — e corriges precisamente esse ponto em vez de relançar ao acaso esperando melhor.

Separar reflexão e resposta

O raciocínio completo é útil para verificar, mas incómodo para usar: a Sofia não vai colar quinze linhas de cálculo no email para o diretor financeiro. A boa prática consiste em pedir os dois, claramente separados: primeiro a reflexão, depois uma conclusão isolada e concisa.

PROMPT
Calcula o orçamento final da campanha:
- 3 publicações patrocinadas a 450 € cada
- desconto negociado de 15 % sobre o total
- serviço da agência: 20 % do montante após desconto

Raciocina passo a passo, expondo cada cálculo.
Termina com uma linha «Resposta:» apenas com o montante final em euros.

Obténs ao mesmo tempo o rigor (o raciocínio, que podes verificar em dez segundos) e o utilizável (a conclusão, que podes copiar tal e qual). Esta separação é um hábito a adquirir em toda a tarefa analítica: análise depois recomendação, diagnóstico depois correção, comparação depois veredicto.

Para uma conclusão limpa: «termina com uma linha ‘Resposta:’ que resuma sem o raciocínio». Também podes pedir o raciocínio numa secção «Rascunho» e a resposta numa secção «Conclusão» — prático para ler apenas o fim quando tens pressa.

A decomposição: dividir os grandes problemas

O chain-of-thought ajuda num problema de uma dezena de etapas. Mas certos trabalhos são demasiado grandes para um único prompt, mesmo bem guiado: analisar 40 respostas a um inquérito, redigir um dossiê completo, comparar três fornecedores em oito critérios. A técnica rainha aqui é a decomposição: dividir o trabalho em subtarefas e tratá-las uma a uma, cada resposta alimentando a seguinte.

Para o balanço da campanha, a Sofia já não pede «analisa estes resultados e redige o balanço». Ela encadeia: 1) «lista as 5 lições principais destes números», 2) «para cada lição, propõe uma ação concreta», 3) «redige agora o balanço seguindo este plano». Três prompts curtos, cada um verificável, em vez de um prompt monstro cuja saída é inverificável em bloco.

A decomposição tem uma vantagem escondida: mantém-te no circuito. Entre cada etapa, podes corrigir, reorientar, descartar uma má pista — antes que ela contamine todo o resto. Um prompt único gigante, esse, não te oferece nenhum ponto de controlo intermédio.

A autocrítica: fazer verificar a prova

Última técnica da família: pedir ao modelo que critique a sua própria resposta. Depois de uma primeira saída, encadeia com: «Relê a tua resposta. Verifica cada cálculo e cada afirmação. Lista os eventuais erros ou fraquezas, depois dá uma versão corrigida.» O modelo deteta muitas vezes as suas próprias falhas durante esta releitura — exatamente como um humano que se relê a frio.

Também podes integrar a verificação de antemão no prompt inicial: «antes de dares a tua resposta final, verifica a coerência de cada etapa». É o que faz a caixa «Verificar a coerência» do diagrama acima. Atenção, porém: a autocrítica melhora, mas não garante nada. Um modelo pode validar com aplomb um erro que acabou de cometer. Para qualquer número ou facto crítico, a verificação final continua a ser humana.

A autocrítica é temível também nos textos: «relê este post e critica-o do ponto de vista de um dono de restaurante apressado: o que o faria desistir?» dá frequentemente melhores pistas de melhoria do que «melhora este post».

Quando guiar o raciocínio — e quando abster-se

Estas técnicas têm um custo: respostas mais longas, mais lentas, mais caras em contexto. Usá-las em tudo seria contraproducente. Eis o mapa dos usos:

Resposta direta (zero-shot)Tarefas simples e imediatas: reformular, traduzir, resumir um texto curto. O raciocínio guiado só traria peso.
Chain-of-thoughtProblemas lógicos, cálculos, decisões multicritério que cabem num prompt. «Raciocina passo a passo, depois Resposta:».
DecomposiçãoTrabalhos demasiado grandes para um prompt: análises longas, dossiês, comparativos. Divide em subtarefas encadeadas, com controlo humano entre cada uma.
AutocríticaEm complemento das outras, quando o que está em jogo justifica uma passagem de verificação: números importantes, texto de grande impacto, raciocínio de risco.

Nota, por fim, que os modelos recentes ditos «de raciocínio» aplicam uma forma de chain-of-thought internamente, sem que o peçamos. Mesmo com eles, estes reflexos continuam úteis: exigir o detalhe das etapas torna a resposta verificável, e a decomposição mantém o controlo humano nos grandes trabalhos. A técnica evolui, o princípio — nunca aceitar uma conclusão inverificável — permanece.

Os limites: um raciocínio plausível não é um raciocínio correto

Um último aviso, que vale para todo este capítulo. O chain-of-thought produz um raciocínio plausível — não necessariamente correto. O modelo pode desenrolar etapas impecáveis na aparência e deixar escapar um erro a meio, com a mesma serenidade tranquila. A fluidez do texto não é uma prova de validade.

O reflexo profissional: verificar as etapas críticas (os números, os factos datados, as afirmações surpreendentes), não apenas ler a conclusão. O raciocínio explícito não substitui o teu julgamento — torna-o simplesmente possível, lá onde uma resposta seca te obrigava a acreditar pela palavra. É exatamente por isso que o exigimos.

🛠️ É a tua vez

Contexto

A Sofia tem de apresentar amanhã o orçamento da campanha de fim de ano ao diretor financeiro. O cálculo mistura três publicações patrocinadas com tarifas diferentes, um desconto de 15 % negociado com a régie, a comissão de 20 % da agência sobre o montante com desconto, e um orçamento máximo de 2 000 € a não ultrapassar. A primeira tentativa em resposta direta deu um número que ela não sabe verificar — e já foi repreendida o mês passado por um erro de cálculo. Desta vez, quer um resultado correto E verificável.

Instruções

  1. Apresenta o problema completo à IA com todos os dados numéricos, primeiro em resposta direta (sem orientação).
  2. Relança com «raciocina passo a passo expondo cada cálculo, depois termina com uma linha Resposta:».
  3. Compara os dois resultados: são idênticos? Se não, qual deles o raciocínio permite verificar?
  4. Verifica tu mesmo duas etapas intermédias do raciocínio (um cálculo, um dado retomado).
  5. Encadeia com uma autocrítica: «relê o teu raciocínio, verifica cada cálculo, assinala qualquer erro e corrige».
  6. Acrescenta a restrição do teto: «o orçamento ultrapassa os 2 000 €? Se sim, propõe duas pistas de poupança quantificadas».
  7. Anota nos teus prompts vencedores a fórmula de orientação que melhor funcionou.
Dica — O raciocínio explícito permite-te detetar onde um erro se infiltra. Verifica as etapas, não apenas o número final — é todo o interesse do método.

Em resumo

  • Um modelo prediz texto: exigir uma resposta imediata num problema complexo é proibir o rascunho.
  • «Raciocina passo a passo» (chain-of-thought) reduz fortemente os erros nas tarefas multi-etapas.
  • Separa reflexão e resposta: o raciocínio para verificar, uma linha «Resposta:» para usar.
  • Decompõe os grandes trabalhos em subtarefas encadeadas: cada etapa torna-se verificável e corrigível.
  • A autocrítica («relê e verifica a tua resposta») apanha uma parte dos erros — não todos.
  • Inútil nas tarefas triviais: a orientação do raciocínio reserva-se aos problemas que a justificam.
  • Um raciocínio plausível não é forçosamente correto: verifica tu mesmo as etapas críticas.

Quiz — verifica a tua compreensão

1. Quando é o chain-of-thought útil?

O raciocínio guiado brilha nas tarefas lógicas ou com várias etapas; pesa inutilmente nos pedidos simples.

2. Como obter uma conclusão limpa?

Isolar a resposta final torna-a diretamente utilizável, mantendo o raciocínio para verificação.

3. Porque é que um modelo se engana frequentemente em resposta direta num cálculo com etapas?

Sem rascunho explícito, o modelo tem de produzir a conclusão de um raciocínio que não formulou. Autorizá-lo a raciocinar muda tudo.

4. Qual é o principal interesse da decomposição em subtarefas?

Dividir permite-te corrigir o rumo entre as etapas, em vez de receber um bloco final inverificável.

5. O que garante um raciocínio passo a passo bem redigido?

A fluidez não é uma prova. O raciocínio explícito torna a verificação possível; não a substitui.

Auteur(s)

R

REHOUMA Haythem

Haythem Rehouma est un ingénieur et architecte IA et cloud, formateur et enseignant technique, avec un profil orienté IA médicale, AWS, MLOps, LLM/RAG et vision par ordinateur.