Dominar o Claude Code — Do zero ao 10x — 6. Delega em paralelo: os subagents

17 min read min de lecture
Capítulo 06

Delega em paralelo: os subagents

Capítulo 6 de 10 · 60%

Objetivos deste capítulo

  • Compreender o que é um subagent
  • Fazer o skill publicar em todas as plataformas em paralelo
  • Perceber porque é que o paralelismo faz ganhar um tempo precioso

O que é um subagent?

Um subagent é um processo separado que gere uma tarefa de forma independente. É a analogia mais próxima de um «funcionário IA»: confias-lhe uma missão delimitada, ele trabalha no seu canto com o contexto e as ferramentas necessárias, e depois traz-te o resultado. O agente principal — aquele com quem conversas — torna-se um maestro: divide o trabalho, delega e junta os resultados.

O teu skill principal /post vai delegar a subagents e recolher os seus resultados. Como eles correm em paralelo, as tarefas independentes (publicar em 4 plataformas) fazem-se em simultâneo em vez de uma de cada vez. É a mudança de escala deste capítulo: passamos de um assistente que faz as coisas depressa para um sistema que faz várias coisas ao mesmo tempo.

O verdadeiro superpoder: o contexto isolado

O ganho de tempo é a vantagem visível, mas há uma segunda, mais subtil e igualmente preciosa: cada subagent trabalha na sua própria janela de contexto. Lembra-te do capítulo 2: o ruído degrada as respostas. Quando um subagent adapta o teu post para o Instagram, carrega as regras Instagram, as amostras Instagram, faz as suas tentativas — e todo esse volume não polui a conversa principal. O agente principal só recebe o resultado final, limpo.

Sem subagents, publicar em 4 plataformas encheria a tua janela de contexto com quatro vezes todo esse trabalho intermédio, e a sessão tornar-se-ia confusa muito antes do fim. Com eles, a tua conversa principal continua a ser um diário de bordo legível: missão, delegação, resultados. É por isso que os subagents são úteis mesmo para tarefas sequenciais volumosas — explorar uma grande base de código, analisar dez documentos — não apenas para o paralelismo.

Regra de divisão: um subagent recebe uma missão autónoma e delimitada («adapta e publica este post para o Instagram»), não uma missão vaga («trata das redes»). Quanto mais nítida for a missão, menos ele precisa de voltar a perguntar-te seja o que for — e melhor é a paralelização.

Definir subagents especializados (opcional mas poderoso)

O Claude Code pode lançar subagents genéricos no momento — é o que fará o teu skill. Mas também podes definir subagents nomeados e especializados, com o comando /agents ou criando ficheiros em .claude/agents/. Cada ficheiro descreve um papel: o seu nome, a sua descrição (que serve ao Claude para saber quando o solicitar), as ferramentas a que tem direito e o seu prompt de sistema.

text
---
name: redator-instagram
description: Adapta um conteúdo ao formato Instagram (legenda + hashtags) na voz da marca. Usar para qualquer publicação Instagram.
tools: Read, Write, Bash
---

És o especialista Instagram da marca.
Lês o brand-voice.md antes de qualquer redação.
Formato: gancho forte, legenda arejada, 3 a 5 hashtags no fim.
Nunca publicas sem média associado.

O interesse da especialização: um subagent «redator Instagram» com um papel preciso e ferramentas restritas é mais fiável do que um generalista, exatamente como numa equipa humana. E limitar as suas ferramentas (sem acesso à rede para um revisor, por exemplo) é uma medida de segurança gratuita. Para o projeto da Lea, o skill com subagents criados no momento chega — mas guarda esta carta na manga para os teus sistemas mais ambiciosos.

Skill, hook, subagent: quem faz o quê?

Nesta altura do curso, tens três mecanismos de extensão. Parecem-se de longe, mas cada um responde a uma pergunta diferente — e confundi-los é o erro mais comum dos iniciantes:

SkillO QUE fazer. Um saber-fazer reutilizável que invocas (ou que o Claude invoca): «publicar um post». É a tua biblioteca de procedimentos.
HookO que deve acontecer SEMPRE. Uma garantia determinística presa ao ciclo de vida: «nenhuma publicação não conforme parte». É a tua lei.
SubagentQUEM trabalha. Um executante com o seu próprio contexto, paralelizável: «quatro redatores trabalham ao mesmo tempo». É a tua mão-de-obra.

Os três combinam-se naturalmente: o skill descreve o procedimento, que delega a subagents, cuja cada ação passa pelos hooks. É exatamente a arquitetura do sistema da Lea.

Passar o skill a multi-plataforma

PROMPT
atualiza o skill /post para suportar «all»:
/post "tema" all

quando a plataforma é «all»:
- cria o visual uma única vez
- lança um subagent por plataforma (twitter, linkedin, instagram, facebook)
- cada subagent adapta o texto ao formato, aos limites e à voz da plataforma
- todos publicam em paralelo
- regista todos os resultados

Nota o detalhe «cria o visual uma única vez»: é uma escolha de arquitetura. A geração do visual é cara e o resultado é partilhado — fica portanto no agente principal, antes da delegação. Só o trabalho realmente independente (adaptar o texto, publicar, registar) parte em paralelo. Identificar o que é partilhado e o que é independente é o coração da conceção de um sistema paralelo.

Lança depois: /post "os nossos compromissos desperdício zero" all. O Claude cria um visual, redige as variantes segundo a tua voz, pede-te validação e depois lança os subagents. Verás vários blocos de tarefas a executar em simultâneo na interface — é a tua equipa a trabalhar.

flowchart TD
  M["/post tema all"] --> V["Visual criado uma única vez"]
  V --> S1["Subagent Twitter"]
  V --> S2["Subagent LinkedIn"]
  V --> S3["Subagent Instagram"]
  V --> S4["Subagent Facebook"]
  S1 --> J["Registo + URLs"]
  S2 --> J
  S3 --> J
  S4 --> J
4 publicações em paralelo = uma única espera em vez de quatro.

Porque não em sequência?

Cada publicação é assíncrona: o Claude envia o post e depois interroga a API a cada poucos segundos até ao estado «publicado» (5 a 30 s consoante a plataforma). 4 posts em série = até 2 minutos de espera acumulada, durante os quais nada de útil acontece. 4 subagents em paralelo = uma única espera, a do mais lento.

Cada subagent gere o seu próprio ciclo assíncrono: enviar, interrogar, tratar a resposta, registar. A redação das variantes e a validação, essas, ficam no agente principal — validas uma vez, e depois tudo parte em paralelo. E se um subagent falhar (API em baixo, quota ultrapassada), os outros três terminam normalmente: só retomas a plataforma em falha, não o lote inteiro.

Cada subagent herda os teus hooks: o quality gate do capítulo anterior aplica-se portanto em todo o lado, automaticamente. É a combinação que torna o paralelismo sereno — não se multiplicam os executantes sem primeiro ter estabelecido a lei.

Os limites do paralelismo

O reflexo «paralelizar tudo» seria um erro. O paralelismo tem um custo: cada subagent consome os seus próprios tokens, e orquestrar tem a sua própria complexidade. Só vale a pena se as tarefas forem realmente independentes (nenhuma precisa do resultado de outra) e suficientemente longas para que a espera acumulada pese. Adaptar quatro posts: perfeito. Três etapas em que cada uma depende da anterior (pesquisar → redigir → publicar): nenhuma paralelização possível, é uma cadeia.

O bom teste: desenha o teu fluxo como o diagrama acima. Os ramos que partem do mesmo nó sem se tocarem depois são paralelizáveis; tudo o que se encadeia verticalmente não o é. Dois minutos de esquema evitam horas de arquitetura inutilmente complexa.

🛠️ É a tua vez

Contexto

A Lea lança uma promoção relâmpago de -20% este fim de semana e quer anunciá-la nas suas 4 redes imediatamente — cada minuto conta, nem pensar em esperar 2 minutos de publicações em série. É também o primeiro verdadeiro teste da arquitetura completa: skill + voz + quality gate + subagents. Vais observar o sistema de ponta a ponta, incluindo o comportamento quando um subagent encontra um problema.

Instruções

  1. Atualiza o skill /post para gerir «all» com o prompt fornecido.
  2. Relê o SKILL.md atualizado: identifica o que fica no agente principal (visual, validação) e o que parte para os subagents.
  3. Lança /post "promoção relâmpago -20% este fim de semana" all.
  4. Valida o plano uma única vez e observa os subagents a executar em paralelo na interface.
  5. Verifica o registo: 4 publicações, 4 URLs, um único tempo de espera.
  6. Verifica que o quality gate se aplicou bem a cada subagent (os posts respeitam limites e palavras proibidas).
  7. Pergunta ao Claude: «se o subagent Instagram tivesse falhado, o que teria acontecido?» e verifica que a retoma só diria respeito a essa plataforma.
Dica — Se um subagent falhar, não bloqueia os outros: são independentes. Só relanças a plataforma em falha.

Em resumo

  • Um subagent é um processo independente, como um «funcionário IA» a quem se confia uma missão delimitada.
  • Dupla vantagem: o paralelismo (ganho de tempo) e o contexto isolado (a conversa principal fica limpa).
  • O skill principal delega a subagents e recolhe os seus resultados; o trabalho partilhado (visual) fica a montante.
  • Subagents nomeados e especializados podem ser definidos em .claude/agents/ (papel, ferramentas restritas, prompt).
  • Skill = o que fazer, hook = o que deve acontecer sempre, subagent = quem trabalha: três mecanismos complementares.
  • O paralelismo transforma várias esperas assíncronas numa só — mas apenas para tarefas realmente independentes.
  • Os subagents herdam os hooks: o quality gate aplica-se em todo o lado, e uma falha isolada não bloqueia os outros.

Quiz — verifica a tua compreensão

1. Qual é o interesse principal de executar os subagents em paralelo?

Publicar em paralelo substitui a soma das esperas (até 2 min) por uma única espera.

2. O que herdam os subagents da tua configuração?

O quality gate aplica-se a cada subagent automaticamente.

3. Qual é a segunda vantagem dos subagents, para além do ganho de tempo?

O trabalho intermédio (tentativas, grandes volumes lidos) fica no contexto do subagent; o agente principal só recebe o resultado final.

4. Porque é que o visual é criado ANTES da delegação aos subagents?

Só o trabalho realmente independente parte em paralelo; o que é partilhado fica no agente principal. É o coração da conceção paralela.

5. Que tarefas são boas candidatas à paralelização?

Uma cadeia (pesquisar → redigir → publicar) não se paraleliza; ramos independentes (4 plataformas) sim.

Auteur(s)

R

REHOUMA Haythem

Haythem Rehouma est un ingénieur et architecte IA et cloud, formateur et enseignant technique, avec un profil orienté IA médicale, AWS, MLOps, LLM/RAG et vision par ordinateur.