Panorama de Modelos: El uso de modelos de IA en la gestión de proyectos ha crecido rápidamente, con modelos específicos para tareas puntuales.
Resumen de Reuniones: Distintos modelos de IA sobresalen en la síntesis de reuniones; la elección del modelo afecta la precisión y el nivel de detalle.
Comunicación con Grupos de Interés: La IA ayuda a estructurar contenidos para actualizaciones a los grupos de interés, aunque la precisión varía entre modelos.
Documentación de Alcance: Claude es preferido para tareas de alcance orientadas al detalle, especialmente donde los procesos del modelo abordan dependencias.
Documentación de Procesos: ChatGPT suele ser mejor para organizar información dispersa en documentos de procesos coherentes.
Aquí en DPM hablamos mucho sobre las herramientas de gestión de proyectos con IA, pero hasta ahora no habíamos enfocado el lente en los propios modelos de IA y cómo están transformando el trabajo de gestión de proyectos. Hasta ahora.
El panorama de los modelos se ha saturado rápidamente. Según la Encuesta de Adopción de IA de Artificial Analysis, el número promedio de familias de LLM utilizadas o consideradas pasó de aproximadamente 2,8 en 2024 a 4,7 en 2025. Además, el ranking de ‘Modelos de IA Más Utilizados’ de T4 Atlas muestra cuáles son los que siguen apareciendo en todo el mercado: GPT-4o, Claude 3.5 Sonnet, DeepSeek R1, Gemini 1.5 Pro, Llama 3, Copilot Model Stack, Grok y Codestral.
Si has experimentado con más de uno, ya sabes que no son intercambiables; y tratarlos como si lo fueran podría significar dejar ganancias de rendimiento reales sobre la mesa. Para descubrir cómo se desempeñan estos modelos en las tareas más comunes de gestión de proyectos, fuimos directamente con los profesionales. Esto es lo que nos contaron.
Resumen de reuniones y elementos de acción
Claude, Gemini, Read AI
El resumen de reuniones es uno de los casos de uso de IA más comunes en la gestión de proyectos y también uno de los más sensibles a la degradación del rendimiento del modelo. Joe Troyer, director de marketing de Great Lakes Tiny Homes, hace una comparación directa: "Claude mantiene los elementos de acción precisos en transcripciones de una hora, mientras que GPT comienza a omitir nombres y fechas límite después de los primeros treinta minutos". Cuanto más larga es la reunión, más importa la elección del modelo.
Claude mantiene los puntos de acción precisos a lo largo de transcripciones de una hora, mientras que GPT empieza a omitir nombres y fechas límite después de los primeros treinta minutos.
Pero identificar el modelo correcto es solo la mitad de la ecuación; saber cómo se ve una buena entrega es la otra. Troyer es específico: "Una buena entrega enumera cada elemento con el nombre del orador y una sola frase sobre el compromiso. Una mala entrega agrega tareas extra que nunca se mencionaron o fusiona dos personas como si fueran un solo responsable."
No todos llegan al mismo resultado. Michael Gold, quien gestiona proyectos para varios clientes, compara deliberadamente modelos en lugar de comprometerse con uno solo: "Al final acabo usando todo: Gemini, Claude, Chatty, lo que sea, incluso cuando tengo Firefly. Tomo la transcripción de Firefly y la ingreso en otra herramienta porque no confío en Firefly." Su enfoque trata la comparación de modelos como parte del flujo de trabajo, no como un paso de configuración único.
Ryan Gilbreath adopta un enfoque más estructurado, clasificando las opciones que ha probado: "Diría que, si tuviera que calificar mi lista de herramientas en cuanto a aplicaciones de toma de notas con IA, Read AI ahora mismo ha sido la mejor para mí. Segunda sería Gemini, simplemente porque trabajo en un espacio de trabajo de Google y es fácil sincronizar y recopilar todas mis notas en un solo lugar. Y después diría Otter AI."
Comunicación con partes interesadas y elaboración de informes de estado
Claude Opus, ChatGPT-4
Una actualización de estado útil cumple funciones específicas. Como lo explica Guillermo Ginesta, Socio Director APAC en Brinc: "Una buena entrega tiene que separar hechos, bloqueos, acciones específicas por responsable y riesgo político sin inventarse certezas." Ken Herron, cofundador de VCONify, lo resume con la misma precisión: "Un buen resultado resume qué cambió, por qué es importante, quién tiene la próxima acción y dónde se requieren decisiones. Una mala entrega se lee como un resumen genérico de reunión, trata cada asunto como igual de importante y pierde el contexto ejecutivo."
Con esto en mente, los profesionales suelen diferenciarse según lo que buscan optimizar. Ken Herron, cofundador de VCONify, recurre a Claude cuando la calidad de la comunicación es la prioridad: "Cuando necesito convertir notas de reuniones, hilos de correo electrónico y comentarios ejecutivos en una actualización compacta para partes interesadas, Claude [Opus] produce sistemáticamente resultados más claros y matizados que otros modelos que he probado."
Otros defienden el uso de ChatGPT-4. Bogdan Condurache, cofundador y CPO de Brizy, utiliza GPT-4 para la comunicación con los stakeholders junto con Claude para la definición de alcance. Señala la capacidad de GPT-4 para adaptar las comunicaciones según la audiencia: "Si necesito explicar un retraso a la dirección, simplificar una actualización de producto para los clientes o resumir la deuda técnica para equipos no técnicos, ajusta bien el tono y el nivel de detalle."
Documentación y requisitos del alcance
Claude Opus, ChatGPT-4
Cuando se trata de definir el alcance, el consenso de los profesionales se inclina hacia Claude, especialmente en trabajos complejos y con múltiples dependencias donde el costo de una suposición no detectada es elevado. Murli Pawar, vicepresidente de SunTec, describe cómo su equipo utiliza Claude Opus precisamente para esto: "Usamos Claude Opus para transformar el documento de alcance de un cliente en un plan de proyecto real, desglosándolo en tareas, secuenciándolas y mapeando las dependencias. Nuestros proyectos suelen tener muchos pasos interdependientes, donde una etapa no puede comenzar hasta que otra ha terminado y está bien hecha, así que esta es la tarea donde la planificación debe estar realmente razonada y no solo enumerada."
Lo que distingue a Claude en este contexto, según la opinión de Pawar, es cómo maneja la ambigüedad: "Cuando le entrego una instrucción vaga, Claude es el más constante a la hora de detectar que el paso C depende en secreto del paso A y señalar dónde la instrucción está incompleta, en vez de inventar suposiciones para llenar los vacíos. Los demás suelen entregarme un plan que parece completo, pero cuyo orden se desmorona en cuanto lo revisas."
La definición de Pawar de buen vs. mal resultado merece ser resaltada: "Un buen resultado es un plan que puedo cuestionar. Expone sus propias suposiciones. También puede agrupar tareas en fases lógicas y decirme dónde la instrucción era ambigua, en vez de ocultarlo. Debo estar editándolo, no reconstruyéndolo. Un mal resultado es un plan demasiado confiado que en el fondo es erróneo."
Documentación de procedimientos y procesos estándar con ChatGPT
La documentación de procesos exige cosas diferentes a la IA que la captura en tiempo real de reuniones — y la diferencia entre un resultado visualmente pulido y otro verdaderamente utilizable puede ser especialmente costosa en este contexto. Los profesionales que realizan este trabajo habitualmente tienden a decantarse por ChatGPT, a menudo por su fortaleza a la hora de reestructurar información dispersa en secuencias lógicas.
Hien Nguyen, cofundadora y directora de Happy Way, utiliza ChatGPT para consolidar el conocimiento operativo que está "disperso en varias ubicaciones: reuniones, mensajes en Slack, correos electrónicos y aportaciones individuales de los miembros del equipo de Operaciones". El valor del modelo, según su experiencia, reside en su capacidad para tomar información desorganizada e imponer estructura: "Un buen resultado definirá el proceso paso a paso e incluirá puntos de decisión, con tal nivel de detalle que un empleado nuevo podría usar este documento para ejecutar el proceso sin necesitar aclaraciones continuas".
Ella identifica claramente el patrón central de fallo: "Un mal resultado puede parecer pulido, pero no incluirá los detalles prácticos. Si la IA crea nuevos pasos, omite información vital sobre un proceso y utiliza términos generales para describir negocios sin explicar cómo se realiza el trabajo, el documento se vuelve casi inutilizable". Para los procedimientos operativos estándar, la coherencia superficial no es suficiente: la especificidad debe estar presente o el documento fracasa en la práctica.
Redacción y trabajo escrito
Claude, Gemini
Para tareas de redacción —ya sea elaborar comunicaciones de proyectos, contenidos o copys—, los profesionales informan de una clara división. Claude y Gemini se perfilan como las opciones preferidas, quedando ChatGPT por detrás en comparaciones directas.
Jennifer Goebel, coordinadora de proyectos en Baker Marketing Laboratory, considera que Claude es la mejor herramienta de escritura desde el punto de vista del tono de voz: "Claude parece ser la herramienta que mejor funciona para las comunicaciones, con menos idas y vueltas que ChatGPT y un tono de voz más natural en la escritura".
Yonelly Gutierrez, quien gestiona flujos de trabajo de proyectos en múltiples herramientas, realizó un cambio más decidido: canceló totalmente su suscripción profesional a ChatGPT tras notar un descenso en su rendimiento. "He notado una gran diferencia, incluso entre modelos GPT. Solía usar ChatGPT todo el tiempo, pero ahora veo que alucina demasiado". Ahora confía en Gemini para la redacción: "Cuando se trata de escribir realmente, prefiero Gemini". Su herramienta secundaria es Glean, no por la calidad de la redacción, sino por su capacidad para extraer contexto relevante de los proyectos internos.
Elegir el modelo adecuado para el momento
En resúmenes de reuniones, actualizaciones de estado, documentación de procesos y tareas de alcance, surge un tema constante: los resultados de la IA fallan no porque la tecnología sea errónea, sino porque se aplicaron las expectativas equivocadas —o el modelo equivocado— a la tarea. Los jefes de proyecto que más valor obtienen de la IA no utilizan una sola herramienta para todo. Consideran la selección del modelo como parte deliberada de su flujo de trabajo, y exigen que los resultados cumplan con un estándar claro de lo que realmente es un buen resultado.
¿Quieres más ideas como estas? Regístrate para una cuenta gratuita en DPM para conocer a más expertos como estos.
