Torna al Blog🇬🇧 Read in English

Agenti specialisti e skill da slash command: dividere il lavoro nel coding AI

Perché N specialisti battono un LLM generalista, in cosa differiscono role / skill / agente, cosa è incluso nell'Orchestrator gratuito (45 agenti, 52 skill, AGPL-3.0) e cosa aggiunge sopra il prossimo Multi-Agent Orchestrator.

Un generalista, o molti specialisti?

Il modello standard è ancora "una chat, un modello, una conversazione". Funziona finché il task rimane semplice. Quando include pianificazione, implementazione, test, review e documentazione, una sola conversazione trascina il contesto di ogni fase dentro tutte le altre—il modello confonde requisiti e artefatti, commenti di review e codice.

La letteratura sui sistemi agentici mostra un pattern. Il multi-agent research system di Anthropic lancia agenti specialisti in parallelo, ciascuno con la propria context window e strumenti. Sul loro benchmark, questo ha battuto Claude Opus 4 single-agent di oltre il 90%—al costo di 15× più token. Il takeaway non è "sempre multi-agent", bensì che per task con sotto-problemi chiari, gli specialisti paralleli superano una conversazione monolitica.

Role, skill, agente: tre unità di specializzazione

Tre concetti distinti:

Un role prompt è un'istruzione una tantum: "agisci come security reviewer". Effimero, non versionato.

Una skill è una postura salvata—un file markdown con system prompt e tool allowlist opzionale, richiamabile con /skill-name. Non persiste tra i turni; cambia la postura per un passaggio. Niente overhead di processo.

Un agente ha la propria context window, tool e subprocess. Gira in parallelo con altri. CrewAI modella gli agenti come membri del team; LangGraph usa macchine a stati esplicite; AutoGen orchestragli come partecipanti di una conversazione. Approcci diversi, stesso principio: stringi il ruolo, affina l'output.

Per ogni task: ti serve un ruolo a lungo termine (agente), un cambio di postura per un passaggio (skill), o solo una spinta (role prompt)?

Cosa è incluso nell'Orchestrator gratuito

Il VibeCoded Orchestrator gratuito, sotto licenza AGPL, esce con 45 agenti specialisti e 52 skill pronti all'uso. Coprono il loop quotidiano di scrittura, review e manutenzione di una codebase sulla tua macchina.

I 45 agenti inclusi coprono il core development loop (coder, planner, tester, code-explorer, code-migrator, expert-coder, frontend-specialist, backend-specialist, gui-expert), curation della conoscenza (kg-navigator, knowledge-curator, code-graph-updater, doc-organizer, doc-extractor, doc-maintainer, graph-health-checker), design dei workflow (ai-agentic-architect, ai-llm-expert, helper-scripter, prompt-engineer, deep-researcher), orchestrazione di progetto (orchestrator-installer, project-architect, project-bootstrapper, project-coordinator, project-migrator, project-organizer, gui-tester, web-explorer), e pack di specialisti per ruolo (Consulting CTO, Senior Designer / UX, Vendor / Sales + Marketing, Senior Scientist, Automation / AI Engineer, Solo SaaS Founder, Senior DevOps / SRE — ogni pack aggiunge ~2 agenti). Ogni agente è un file markdown con system prompt, tool allowlist e cap opzionali su modello e effort — puoi leggerlo, forkarlo, riscriverlo.

Le 52 skill coprono le mosse di cambio di postura: design (/architect, /api-designer, /architecture-consultant), implementazione (/tdd, /debug-expert, /fix-issue), review (/security-reviewer, /code-review-expert, /performance-optimizer, /accessibility-checker), esplorazione (/explore-codebase, /kg-research, /extract-docs), e una long tail di skill consulting + AI-domain. Una skill è un comando e uno scambio di system prompt; un agente è un processo.

Nel tier gratuito il coordinamento si basa sul modello nativo dei subagent di Claude Code: ogni agente è un file markdown con il proprio system prompt, tool allowlist e context window, lanciato in parallelo via il tool Agent. La ricerca valuta questo tipo di parallelismo pull-style fra specialisti 13–57% migliore della delega gerarchica su costo token e parallelismo. In pratica il limite reale è tre subagent paralleli; oltre, fondere i loro contesti diventa lossy e dispendioso.

Due forme concrete

"Progetta e implementa un nuovo modulo di auth." Nell'Orchestrator gratuito lanci prima l'agente planner; spezza il lavoro in task. Poi dispatch in parallelo via tool Agent di coder, tester e la skill /security-reviewer. Un reviewer fa da gate prima del merge. doc-organizer aggiorna la reference. Quattro specialisti, un risultato, e nessuna context window singola ha dovuto contenere tutto. È pura orchestrazione di subagent Claude Code nel tier gratuito.

"Coordina un refactor che tocca frontend, backend e database, con un documento di tradeoff prima." Qui entra in gioco il prossimo Multi-Agent Orchestrator (MAO). Descrivi l'obiettivo una volta; il maestro smista la richiesta, il planner HTN con fallback LLM Oracle lo decompone in un task graph con dipendenze e criteri di validazione, poi dispatcha ai-agentic-architect per il tradeoff doc, backend-specialist e frontend-specialist per implementare in parallelo, e deep-researcher per incrociare decisioni passate nel knowledge graph. Una UI desktop Tauri ti fa guardare il team operare in tempo reale, approvare azioni rischiose e correggere il piano quando deriva. Va oltre quello che i subagent di Claude Code da soli fanno — serve un runtime che lo guidi.

Cosa aggiunge MAO (prossimamente)

L'Orchestrator gratuito ti dà i pezzi: 45 agenti, 52 skill e il dispatch nativo dei subagent di Claude Code. MAO (Multi-Agent Orchestrator) — attualmente pre-lancio — è il runtime che li mette insieme.

MAO è costruito attorno al maestro: un livello di orchestrazione conversazionale con cui parli come a un singolo agente, e che delega agli specialisti sottostanti. Dietro il maestro c'è un planner gerarchico (engine HTN + fallback LLM Oracle che reinietta nel dominio le decomposizioni apprese), un hybrid agent harness che instrada i singoli ruoli su Claude / Ollama / OpenAI / Gemini a seconda di costo e capacità, e un task graph con persistenza SQLite in WAL così il team può pescare lavoro in parallelo senza pestarsi i piedi. Una UI desktop Tauri ti permette di guardare gli agenti in streaming, monitorare la task board e intervenire a metà piano.

MAO introduce anche gli agenti Tier 2 (workflow) — pipeline multi-step che mescolano step deterministici di codice, step LLM, checkpoint e prompt MCP di elicitation in un singolo workflow durabile. Sono architetturalmente distinti da un subagent Claude Code (un prompt, una context window) e da un agente Tier 1 tool: un agente Tier 2 è una macchina a stati guidata da codice con step checkpointati su DB, quindi sopravvive ai crash e può fare al collega umano una domanda strutturata a metà esecuzione via il canale MCP di elicitation.

Questi componenti di MAO non fanno parte del base gratuito né di Orchestrator Pro. Pro (€19/mese, €149/anno, €199 lifetime) aggiunge RL reranking, pack curati, auto-update e il client VCO-side della Coordination MCP sopra lo stesso base gratuito. MAO è un prodotto separato, attualmente pre-lancio, con prezzo da annunciare.

Dove si colloca nel panorama

ToolSpecialisti integratiEsecuzione parallelaEstendibileOpen source
VibeCoded Orchestrator (gratis)45 agenti + 52 skillSì (subagent Claude Code)Sì (markdown)AGPL
VibeCoded MAO (prossimamente)maestro + planner HTN + agenti Tier 2 workflowSì (task graph + hybrid agent harness)Commerciale
CursorComposer + Agent modeLimitataParzialeNo
GitHub CopilotAgent mode (singolo)NoLimitataNo
AiderSelezione di ruoliNoSì (CLI)
Devin (Cognition)Singolo agente autonomoInternaNoNo
CrewAIDIY (role-based)Sì (framework)
LangGraphDIY (state machines)Sì (framework)
AutoGenDIY (conversazionale)Sì (framework)

La maggior parte degli strumenti offre o un singolo agente (Cursor, Copilot, Devin) o un framework per costruire il tuo (CrewAI, AutoGen, LangGraph). L'Orchestrator gratuito è nel mezzo: 45 specialisti curati e 52 skill—abbastanza opinionato da funzionare subito, abbastanza aperto da riscrivere come markdown.

Quando superi il semplice dispatch di subagent Claude Code e ti serve un maestro, un planner gerarchico e agenti Tier 2 workflow che sopravvivono ai crash e fanno domande strutturate a metà esecuzione, MAO è dove quel runtime vive.


Fonti: