Guiar o raciocínio
Objetivos deste capítulo
- Usar o chain-of-thought nas tarefas complexas
- Decompor os grandes problemas e fazer verificar as respostas
- Saber quando guiar o raciocínio — e quando é inútil
Porque é que um modelo tão sabedor se engana num cálculo simples
A Sofia prepara o orçamento de uma campanha: desconto de 15 %, margem de 35 %, IVA... Cola tudo no chat, pergunta «qual é o orçamento final?» e obtém um número errado. Como pode um sistema capaz de dissertar sobre física quântica falhar um cálculo de percentagens?
Porque um modelo de linguagem não «calcula»: prediz texto, palavra a palavra. Quando exiges uma resposta imediata, estás a pedir-lhe que produza o resultado de um raciocínio... sem fazer o raciocínio. Num problema com várias etapas, é como exigir a um humano que responda de cabeça, instantaneamente, sem rascunho. Os erros não são uma fatalidade do modelo: são uma consequência da forma de pedir.
A solução é simples e é uma das técnicas mais documentadas do prompt engineering: dar ao modelo o direito — e a instrução — de fazer o seu rascunho antes de concluir.
Chain-of-thought: raciocinar antes de responder
Num problema lógico, matemático ou com múltiplas etapas, acrescenta «raciocina passo a passo antes de responder». O modelo expõe então o seu raciocínio explicitamente: identifica os dados, desenrola os cálculos intermédios, e depois conclui. Cada etapa escrita condiciona a seguinte, o que reduz fortemente os erros em comparação com uma resposta direta. É o chain-of-thought (cadeia de pensamento).
Um produto custa 80 €. Com uma margem de 35 % sobre o preço de venda, qual é o preço de venda? Raciocina passo a passo, depois dá o resultado final.
Este exemplo é traiçoeiro de propósito: uma margem de 35 % sobre o preço de venda não se calcula como 80 × 1,35. Em resposta direta, muitos modelos caem na armadilha. Em raciocínio guiado, o modelo formula a equação (preço de venda = custo / (1 − 0,35)) e encontra 123,08 €. O rascunho não é um luxo: é ele que evita o erro.
flowchart LR Q["Problema multi-etapas"] --> E1["Etapa 1: expor os dados"] E1 --> E2["Etapa 2: calcular"] E2 --> V["Verificar a coerência"] V --> R["Linha final: Resposta"]
Benefício secundário, pelo menos tão precioso quanto a exatidão: o raciocínio é auditável. Quando a resposta está errada, vês em que etapa o erro se infiltrou — um dado mal lido, uma fórmula invertida — e corriges precisamente esse ponto em vez de relançar ao acaso esperando melhor.
Separar reflexão e resposta
O raciocínio completo é útil para verificar, mas incómodo para usar: a Sofia não vai colar quinze linhas de cálculo no email para o diretor financeiro. A boa prática consiste em pedir os dois, claramente separados: primeiro a reflexão, depois uma conclusão isolada e concisa.
Calcula o orçamento final da campanha: - 3 publicações patrocinadas a 450 € cada - desconto negociado de 15 % sobre o total - serviço da agência: 20 % do montante após desconto Raciocina passo a passo, expondo cada cálculo. Termina com uma linha «Resposta:» apenas com o montante final em euros.
Obténs ao mesmo tempo o rigor (o raciocínio, que podes verificar em dez segundos) e o utilizável (a conclusão, que podes copiar tal e qual). Esta separação é um hábito a adquirir em toda a tarefa analítica: análise depois recomendação, diagnóstico depois correção, comparação depois veredicto.
A decomposição: dividir os grandes problemas
O chain-of-thought ajuda num problema de uma dezena de etapas. Mas certos trabalhos são demasiado grandes para um único prompt, mesmo bem guiado: analisar 40 respostas a um inquérito, redigir um dossiê completo, comparar três fornecedores em oito critérios. A técnica rainha aqui é a decomposição: dividir o trabalho em subtarefas e tratá-las uma a uma, cada resposta alimentando a seguinte.
Para o balanço da campanha, a Sofia já não pede «analisa estes resultados e redige o balanço». Ela encadeia: 1) «lista as 5 lições principais destes números», 2) «para cada lição, propõe uma ação concreta», 3) «redige agora o balanço seguindo este plano». Três prompts curtos, cada um verificável, em vez de um prompt monstro cuja saída é inverificável em bloco.
A decomposição tem uma vantagem escondida: mantém-te no circuito. Entre cada etapa, podes corrigir, reorientar, descartar uma má pista — antes que ela contamine todo o resto. Um prompt único gigante, esse, não te oferece nenhum ponto de controlo intermédio.
A autocrítica: fazer verificar a prova
Última técnica da família: pedir ao modelo que critique a sua própria resposta. Depois de uma primeira saída, encadeia com: «Relê a tua resposta. Verifica cada cálculo e cada afirmação. Lista os eventuais erros ou fraquezas, depois dá uma versão corrigida.» O modelo deteta muitas vezes as suas próprias falhas durante esta releitura — exatamente como um humano que se relê a frio.
Também podes integrar a verificação de antemão no prompt inicial: «antes de dares a tua resposta final, verifica a coerência de cada etapa». É o que faz a caixa «Verificar a coerência» do diagrama acima. Atenção, porém: a autocrítica melhora, mas não garante nada. Um modelo pode validar com aplomb um erro que acabou de cometer. Para qualquer número ou facto crítico, a verificação final continua a ser humana.
Quando guiar o raciocínio — e quando abster-se
Estas técnicas têm um custo: respostas mais longas, mais lentas, mais caras em contexto. Usá-las em tudo seria contraproducente. Eis o mapa dos usos:
Nota, por fim, que os modelos recentes ditos «de raciocínio» aplicam uma forma de chain-of-thought internamente, sem que o peçamos. Mesmo com eles, estes reflexos continuam úteis: exigir o detalhe das etapas torna a resposta verificável, e a decomposição mantém o controlo humano nos grandes trabalhos. A técnica evolui, o princípio — nunca aceitar uma conclusão inverificável — permanece.
Os limites: um raciocínio plausível não é um raciocínio correto
Um último aviso, que vale para todo este capítulo. O chain-of-thought produz um raciocínio plausível — não necessariamente correto. O modelo pode desenrolar etapas impecáveis na aparência e deixar escapar um erro a meio, com a mesma serenidade tranquila. A fluidez do texto não é uma prova de validade.
O reflexo profissional: verificar as etapas críticas (os números, os factos datados, as afirmações surpreendentes), não apenas ler a conclusão. O raciocínio explícito não substitui o teu julgamento — torna-o simplesmente possível, lá onde uma resposta seca te obrigava a acreditar pela palavra. É exatamente por isso que o exigimos.
Contexto
A Sofia tem de apresentar amanhã o orçamento da campanha de fim de ano ao diretor financeiro. O cálculo mistura três publicações patrocinadas com tarifas diferentes, um desconto de 15 % negociado com a régie, a comissão de 20 % da agência sobre o montante com desconto, e um orçamento máximo de 2 000 € a não ultrapassar. A primeira tentativa em resposta direta deu um número que ela não sabe verificar — e já foi repreendida o mês passado por um erro de cálculo. Desta vez, quer um resultado correto E verificável.
Instruções
- Apresenta o problema completo à IA com todos os dados numéricos, primeiro em resposta direta (sem orientação).
- Relança com «raciocina passo a passo expondo cada cálculo, depois termina com uma linha Resposta:».
- Compara os dois resultados: são idênticos? Se não, qual deles o raciocínio permite verificar?
- Verifica tu mesmo duas etapas intermédias do raciocínio (um cálculo, um dado retomado).
- Encadeia com uma autocrítica: «relê o teu raciocínio, verifica cada cálculo, assinala qualquer erro e corrige».
- Acrescenta a restrição do teto: «o orçamento ultrapassa os 2 000 €? Se sim, propõe duas pistas de poupança quantificadas».
- Anota nos teus prompts vencedores a fórmula de orientação que melhor funcionou.
Em resumo
- Um modelo prediz texto: exigir uma resposta imediata num problema complexo é proibir o rascunho.
- «Raciocina passo a passo» (chain-of-thought) reduz fortemente os erros nas tarefas multi-etapas.
- Separa reflexão e resposta: o raciocínio para verificar, uma linha «Resposta:» para usar.
- Decompõe os grandes trabalhos em subtarefas encadeadas: cada etapa torna-se verificável e corrigível.
- A autocrítica («relê e verifica a tua resposta») apanha uma parte dos erros — não todos.
- Inútil nas tarefas triviais: a orientação do raciocínio reserva-se aos problemas que a justificam.
- Um raciocínio plausível não é forçosamente correto: verifica tu mesmo as etapas críticas.
Quiz — verifica a tua compreensão
1. Quando é o chain-of-thought útil?
2. Como obter uma conclusão limpa?
3. Porque é que um modelo se engana frequentemente em resposta direta num cálculo com etapas?
4. Qual é o principal interesse da decomposição em subtarefas?
5. O que garante um raciocínio passo a passo bem redigido?