Blog
ChatGPT 5 es alucinante… en el mal sentido
Sí, sí… ya sé lo que muchos pensáis: “la inteligencia artificial está cambiando el mundo”. Y sí, lo está haciendo. Pero también está cometiendo errores de primero de primaria, con una sonrisa virtual y cero sentido de la responsabilidad.
Hoy vengo a hablar de ChatGPT 5. O mejor dicho, la versión que alucina… pero en el mal sentido.
El modelo que no escucha (aunque le grites 4 veces)
Le dices por activa, por pasiva y por pasiva reforzada: “no inventes, por favor, si es una hipótesis remárcalo”. ¿Y qué hace? Exacto. Invéntate otra vez. Una más. Y luego responde tan pancho, como si nada. Sin contexto, sin disculpa, sin criterio. Como si el error fuera parte del show.
¿Esta es la fiabilidad que nos promete Sam Altman? Pues que no esté tan tranquilo. Porque en el mundo real, donde las empresas necesitan precisión y consistencia, esto no es aceptable.
Cuando tu hermano pequeño responde mejor
Copilot, de Microsoft el “hermano pequeño”, que todavía usa ChatGPT 4o, está dando respuestas más estables. Sí, también falla (por ejemplo, en la lectura de Excel, día sí, día también), pero al menos sabes por dónde va. No cambia de opinión cada dos frases ni alucina con la seguridad de un tarotista de feria.
Y no lo decimos solo nosotros. El equipo técnico de Innovision lo tiene claro, los que lo usan cada día para tareas reales: preferimos modelos como Anthropic. Más estables, más predecibles, menos espectaculares, pero más fiables. Porque aquí, la funcionalidad sin fiabilidad… no sirve de nada. Más de 41% de los equipos de técnicos de IA estan usando Antrophic, frente un 21% que usa OpenAI (ChatGPT). El propio Microsoft ha llegado un acuerdo para que desde su plataforma se pueda usar Antrophic, y eso que Copilot es 100% ChatGPT.
Lo que las empresas necesitan
¿Queréis que las empresas implementen inteligencia artificial de verdad? Entonces dadnos estabilidad, no más “funcionalidades”.
Estamos cansados de escuchar que los usuarios “no saben hacer prompts”. No es un problema de prompts. Es un problema de robustez del sistema. Y si encima nos vais a decir, como algunos iluminados de Microsoft ya dijeron, que “la culpa es del usuario”, pues vamos listos.
Porque aquí no estamos hablando de jugar con una app de dibujos. Estamos hablando de sistemas que deben integrarse en procesos críticos de negocio. Y esos señores de OpenAI y de Microsoft deja mucho que desear, sin ir más lejos la semana pasada me llamaron muchos clientes que sus asistentes que analizaban datos habían dejado de funcionar… Nada estos caballeros sacaron una funcionalidad nueva que era un botón que se debían de activar si tenías que analizar datos, claro los asistentes no lo tenían activado y dejaron de funcionar. ¿Están jugando con el dinero de la gente?
Google no se queda atrás… pero viene con arrogancia
Y mientras tanto, Google avanza rápido. Muy rápido. Aunque claro, con esa arrogancia tan de “empresa de ingenieros” que a veces les juega en contra. Le pides que te etiquete una reserva en la agenda con una marca roja para que sea más visible y te contesta que “no está para esas cosas”. Literal. Porque claro, está por encima de esas banalidades humanas… Pero cuidado OpenAI, Google avanza muy bien y rápido. Aunque se les viene un frente muy gordo con los buscadores que estamos dejando de utilizar. Y con nuevos jugadores como Perplexity que no está nada, nada mal como funciona.
Nota mental para Google: A veces lo que el usuario necesita es precisamente eso: que pongas la etiqueta roja en la agenda porque la reunión es importante, no que me recites la teoría del color.
Conclusión #1: menos fuegos artificiales, más fiabilidad
La inteligencia artificial tiene un potencial descomunal. Pero si no arreglamos lo básico —la consistencia, la precisión, la responsabilidad—, no va a haber adopción masiva. Las empresas necesitan herramientas que funcionen, no que sorprendan. Que ejecuten, no que improvisen.
Y esto va para todos los players del mercado: OpenAI, Microsoft, Google… Bajad del pedestal. Escuchad al usuario. Y sobre todo, dejad de alucinar. Que el mundo real necesita soluciones, no ilusiones.
Ahora viene un resumen ejecutivo del estudio comparativo de casos de uso empresariales, al final tienes las conclusiones de que modelos son los mejores (a día de hoy):
Resumen Ejecutivo – Evaluación de Modelos de IA Generativa (Octubre 2025)
Durante octubre de 2025 se evaluaron seis modelos de inteligencia artificial generativa: GPT-5 Instant, GPT-4o, Claude Sonnet 4.5, Microsoft Copilot, Gemini 1.5 Pro y Perplexity AI.
Las pruebas se realizaron a través de tres casos empresariales reales:
- optimización de ROI publicitario,
- análisis financiero de expansión internacional y
- estrategia de pricing dinámico.
El objetivo fue medir la capacidad de cada modelo para razonar, calcular y decidir con mentalidad directiva, evaluando su precisión financiera, su comprensión estratégica y la calidad de sus recomendaciones ejecutivas.
Los resultados muestran que los modelos de OpenAI (GPT-5 Instant y GPT-4o) y Claude Sonnet 4.5 (Anthropic) se consolidan como las soluciones más potentes y coherentes del mercado.
Destacan por su rigor numérico, razonamiento financiero y lenguaje claro, cercano al de un comité de dirección.
Microsoft Copilot mantiene un desempeño sólido y corporativo, aunque con menor profundidad analítica.
Gemini ofrece solidez técnica pero con una orientación poco práctica al negocio.
Perplexity presenta resultados superficiales y escasa capacidad de análisis.
Resultados por área
| Área evaluada | Modelos destacados | Conclusión |
|---|---|---|
| Cálculo y precisión financiera | GPT-5 Instant / Claude 4.5 | Rigor numérico absoluto y coherencia total |
| Análisis estratégico y de riesgo | Claude 4.5 / GPT-5 / GPT-4o | Visión empresarial y evaluación de riesgo avanzada |
| Claridad y tono ejecutivo | GPT-5 / GPT-4o | Comunicación profesional y orientación a la acción |
Ranking general (Octubre 2025)
- Claude Sonnet 4.5 – El modelo más analítico y estratégico, con mentalidad de CFO.
- GPT-5 Instant – Preciso, rápido y excelente en comunicación ejecutiva.
- GPT-4o – Equilibrio entre razonamiento técnico y visión comercial.
- Microsoft Copilot – Correcto y estable, útil en entornos corporativos.
- Gemini 1.5 Pro – Técnico, estructurado, pero alejado del contexto empresarial.
- Perplexity AI – Resumido y descriptivo, sin criterio financiero sólido.
Conclusión ejecutiva
Los modelos de nueva generación, especialmente Claude 4.5 y GPT-5, ya operan con mentalidad de dirección.
Analizan datos complejos, valoran riesgos y priorizan la rentabilidad con una claridad propia de un comité ejecutivo.
Su fiabilidad y su capacidad de decisión los convierten en herramientas estratégicas para dirección general, finanzas, marketing y operaciones.
Claude 4.5 destaca como el modelo más analítico y financiero.
GPT-5 Instant se confirma como el más adaptable, comunicativo y versátil en la práctica empresarial.
La evaluación demuestra que, en 2025, la inteligencia artificial generativa ha pasado de ser un asistente a convertirse en un verdadero ayudante para la toma de decisiones empresariales.
RECUERDA TRES COSAS:
1- Utiliza el método correcto para interactuar con la inteligencia artificial (no lo que explican en Youtube)
2- Haz que la IA verifique sus resultados: «Verifica el resultado, ¿estás seguro que está bien?»
3- Verifica los resultados, el humano sigue al mando y debe controlar que todo sea correcto