Panorama dei modelli: L'utilizzo dei modelli di IA nella gestione dei progetti è cresciuto rapidamente, con modelli distinti per compiti specifici.
Sintesi delle riunioni: Diversi modelli di IA eccellono nel riassumere le riunioni; la scelta del modello influisce su precisione e livello di dettaglio.
Comunicazione con gli stakeholder: L'IA aiuta a strutturare i contenuti per gli aggiornamenti agli stakeholder, ma la precisione varia tra i modelli.
Documentazione dell'ambito: Claude è preferito per le attività di dettaglio dell'ambito, soprattutto dove è necessario che il modello gestisca le dipendenze dei processi.
Documentazione dei processi: ChatGPT spesso è migliore nell'organizzare informazioni sparse in documenti di processo coerenti.
Parliamo spesso di strumenti di project management basati su AI qui su DPM, ma non abbiamo ancora puntato il riflettore sui modelli di AI stessi e su come stiano trasformando il lavoro dei project manager. Fino ad ora.
Il panorama dei modelli si è affollato rapidamente. Secondo il sondaggio sull'adozione dell'AI di Artificial Analysis, il numero medio di famiglie LLM utilizzate o considerate è passato da circa 2,8 nel 2024 a 4,7 nel 2025. E la classifica ‘Modelli di AI più utilizzati’ di T4 Atlas mostra quali compaiono più spesso sul mercato: GPT-4o, Claude 3.5 Sonnet, DeepSeek R1, Gemini 1.5 Pro, Llama 3, Copilot Model Stack, Grok e Codestral.
Se hai sperimentato più di un modello, sai già che non sono intercambiabili — e trattarli come tali potrebbe significare rinunciare a reali miglioramenti in termini di prestazioni. Per capire come si comportano questi modelli nei compiti più comuni dei project manager, ci siamo rivolti direttamente ai professionisti. Ecco cosa ci hanno raccontato.
Sintesi delle riunioni e punti d’azione
Claude, Gemini, Read AI
La sintesi delle riunioni è uno degli utilizzi più comuni dell’AI nel project management e anche uno dei più sensibili al degrado delle prestazioni dei modelli. Joe Troyer, Chief Marketing Officer presso Great Lakes Tiny Homes, fa un confronto diretto: "Claude mantiene i punti d’azione accurati su trascrizioni di un’ora, mentre GPT comincia a dimenticare nomi e scadenze dopo i primi trenta minuti." Più la riunione è lunga, più la scelta del modello conta.
Claude mantiene precisi i punti d’azione all’interno di trascrizioni di un’ora, mentre GPT inizia a dimenticare nomi e scadenze dopo i primi trenta minuti.
Ma identificare il modello giusto è solo metà dell'equazione — sapere come si presenta un buon output è l'altra. Troyer è preciso: "Un buon output elenca ogni elemento con il nome dell’oratore e una sola frase sull’impegno preso. Un cattivo output aggiunge attività extra che non sono mai state menzionate o attribuisce a una sola persona compiti appartenenti a due persone diverse."
Non tutti arrivano alle stesse conclusioni. Michael Gold, che gestisce progetti per diversi clienti, confronta deliberatamente diversi modelli invece di sceglierne uno solo: "Alla fine finisco per usare tutto: Gemini, Claude, Chatty, ecc., anche quando ho Firefly. Prendo la trascrizione di Firefly e la inserisco in qualcos'altro, perché non mi fido di Firefly." Il suo approccio considera il confronto tra modelli come parte integrante del flusso di lavoro — non come un passaggio preliminare che si fa una sola volta.
Ryan Gilbreath adotta un approccio più strutturato, classificando le opzioni che ha testato: "Direi che se dovessi valutare la mia lista di strumenti per quanto riguarda gli strumenti di presa appunti con AI, al momento Read AI è il migliore per me. Al secondo posto metterei Gemini semplicemente perché lavoro in un ambiente Google ed è facile sincronizzare e raccogliere tutte le mie note in un unico posto. Poi direi Otter AI."
Comunicazione con gli stakeholder e report sullo stato dei lavori
Claude Opus, ChatGPT-4
Un aggiornamento sullo stato utile fa alcune cose in modo eccellente. Come afferma Guillermo Ginesta, Managing Partner APAC presso Brinc: "Un output utile deve separare fatti, ostacoli, azioni specifiche dei responsabili e rischio politico senza inventare certezze." Ken Herron, co-fondatore di VCONify, lo chiarisce altrettanto bene: "Un buon risultato riassume ciò che è cambiato, perché è importante, chi possiede la prossima azione e dove sono richieste decisioni. Un cattivo risultato sembra un generico resoconto di una riunione, tratta ogni problema come ugualmente importante e perde il contesto decisionale."
Considerando ciò, i professionisti tendono a differenziarsi in base all'obiettivo di ottimizzazione. Ken Herron, Co-fondatore di VCONify, sceglie Claude quando la qualità della comunicazione è la priorità: "Quando ho bisogno di trasformare note di riunione, thread e-mail e feedback dei dirigenti in un aggiornamento sintetico per gli stakeholder, Claude [Opus] produce costantemente comunicazioni più chiare e sfumate rispetto agli altri modelli che ho testato."
Altri sostengono la scelta di ChatGPT-4. Bogdan Condurache, co-fondatore e CPO di Brizy, utilizza GPT-4 per la comunicazione con gli stakeholder insieme a Claude per la definizione dello scopo. Sottolinea la capacità di GPT-4 di adattare la comunicazione tra diversi destinatari: "Se devo spiegare un ritardo ai dirigenti, semplificare un aggiornamento di prodotto per i clienti o riassumere il debito tecnico per team non tecnici, regola bene tono e profondità."
Documentazione degli scopi e requisiti
Claude Opus, ChatGPT-4
Quando si tratta di definire l'ambito, il consenso tra i professionisti pende verso Claude — soprattutto per lavori complessi e con molte dipendenze, dove il costo di un'ipotesi mancata è elevato. Murli Pawar, Vicepresidente di SunTec, descrive come il suo team utilizzi Claude Opus proprio per questo: "Utilizziamo Claude Opus per trasformare il documento degli scopi di un cliente in un vero piano di progetto, suddividendo gli scopi in task, sequenziandoli e mappando le dipendenze. I nostri progetti tendono ad avere molti passaggi interdipendenti, dove una fase non può iniziare finché un'altra non è stata completata e verificata, quindi questa è la situazione in cui la pianificazione deve essere davvero ragionata, non solo elencata."
Ciò che distingue Claude in questo contesto, secondo Pawar, è il modo in cui gestisce l'ambiguità: "Quando gli sottopongo una richiesta vaga, Claude è il più coerente nell'individuare che il passaggio C dipende in realtà dal passaggio A e nel segnalare dove il brief è incompleto, invece di inventare silenziosamente delle ipotesi per coprire i vuoti. Gli altri spesso mi presentano un piano che sembra completo, ma la sequenza si disgrega appena la si verifica."
Secondo Pawar, la definizione di buon o cattivo risultato qui è fondamentale: "Un buon risultato è un piano che posso mettere in discussione. Porta alla luce le sue stesse ipotesi. Sa anche raggruppare i task in fasi logiche e dirmi dove il brief era ambiguo, invece di coprirlo superficialmente. Dovrei modificarlo, non ricostruirlo da capo. Un cattivo risultato è un piano troppo sicuro che però è sbagliato nella sostanza."
Documentazione SOP e dei processi ChatGPT
La documentazione dei processi pone esigenze diverse all'IA rispetto alla trascrizione in tempo reale delle riunioni — e il divario tra un risultato che appare ben rifinito e uno veramente utilizzabile può essere particolarmente gravoso in questo contesto. I professionisti che si occupano regolarmente di questo tipo di attività tendono a scegliere ChatGPT, spesso per la sua capacità di ristrutturare informazioni sparse in sequenze logiche.
Hien Nguyen, cofondatrice e direttrice di Happy Way, utilizza ChatGPT per consolidare le conoscenze operative che sono "disperse in vari luoghi — riunioni, messaggi su Slack, email e tra i vari membri del team Operativo." Il valore del modello, secondo la sua esperienza, risiede nella capacità di prendere input non organizzati e imporre struttura: "Un buon output definirà il processo passo dopo passo e includerà punti decisionali con tale dettaglio che un nuovo dipendente potrebbe utilizzare questo documento per eseguire il processo senza aver bisogno di chiarimenti continui."
Evidenzia chiaramente il principale schema di fallimento: "Un output scadente potrà apparire ben fatto ma non includerà i dettagli pratici. Se l’IA crea nuovi passaggi, omette informazioni vitali su un processo e utilizza termini generici per descrivere attività senza spiegare come viene svolto il lavoro, il documento diventa quasi inutilizzabile." Per le SOP, la coerenza superficiale non basta: la specificità deve esserci, altrimenti il documento fallisce nella pratica.
Copywriting e lavoro di scrittura
Claude, Gemini
Per i compiti di scrittura — che si tratti della stesura di comunicazioni per progetti, contenuti o copy — gli specialisti segnalano una chiara divisione. Claude e Gemini emergono come le opzioni preferite, mentre ChatGPT è in ritardo nei confronti diretti.
Jennifer Goebel, project coordinator presso Baker Marketing Laboratory, ritiene che Claude sia il miglior strumento di scrittura dal punto di vista del tono di voce: "Claude sembra essere lo strumento che funziona meglio per le comunicazioni, con meno iterazioni rispetto a ChatGPT e un tono di voce più naturale nella scrittura."
Yonelly Gutierrez, che gestisce workflow di progetto in diversi strumenti, ha adottato una svolta più decisa: ha abbandonato completamente il suo abbonamento professionale a ChatGPT dopo aver notato un calo di prestazioni. "Ho notato una grandissima differenza, anche tra i modelli GPT. Usavo ChatGPT tutto il tempo, ma ora ho visto che produce troppe allucinazioni." Ora si affida a Gemini per scrivere: "Quando si tratta di scrivere davvero, preferisco Gemini." Il suo strumento secondario è Glean — non per la qualità della scrittura, ma per la sua capacità di recuperare il contesto rilevante dei progetti interni.
Scegliere il modello giusto per il momento
Tra i riepiloghi delle riunioni, gli aggiornamenti di stato, la documentazione sui processi e il lavoro di definizione degli ambiti, emerge un tema costante: gli output dell'IA falliscono non perché la tecnologia sia sbagliata, ma perché sono state impostate aspettative errate — oppure perché è stato applicato il modello sbagliato al compito. I PM che ottengono più valore dall’IA non usano un solo strumento per tutto. Considerano la scelta del modello come una parte deliberata del loro flusso di lavoro — e valutano i risultati secondo uno standard chiaro di cos’è davvero un buon lavoro.
Vuoi altri approfondimenti di questo tipo? Registrati per un account DPM gratuito per continuare a ricevere consigli da altri esperti come questi.
