ChatGPT, Empresa, Innovación, Inteligencia Artificial, Tecnología Móvil, Transformacion Digital

ChatGPT 5 es alucinante… en el mal sentido

Posted by

Luis Font

24 marzo, 2026

On 28 octubre, 2025

Sí, sí… ya sé lo que muchos pensáis: “la inteligencia artificial está cambiando el mundo”. Y sí, lo está haciendo. Pero también está cometiendo errores de primero de primaria, con una sonrisa virtual y cero sentido de la responsabilidad.

Hoy vengo a hablar de ChatGPT 5. O mejor dicho, la versión que alucina… pero en el mal sentido.

El modelo que no escucha (aunque le grites 4 veces)

Le dices por activa, por pasiva y por pasiva reforzada: “no inventes, por favor, si es una hipótesis remárcalo”. ¿Y qué hace? Exacto. Invéntate otra vez. Una más. Y luego responde tan pancho, como si nada. Sin contexto, sin disculpa, sin criterio. Como si el error fuera parte del show.

¿Esta es la fiabilidad que nos promete Sam Altman? Pues que no esté tan tranquilo. Porque en el mundo real, donde las empresas necesitan precisión y consistencia, esto no es aceptable.

Cuando tu hermano pequeño responde mejor

Copilot, de Microsoft el “hermano pequeño”, que todavía usa ChatGPT 4o, está dando respuestas más estables. Sí, también falla (por ejemplo, en la lectura de Excel, día sí, día también), pero al menos sabes por dónde va. No cambia de opinión cada dos frases ni alucina con la seguridad de un tarotista de feria.

Y no lo decimos solo nosotros. El equipo técnico de Innovision lo tiene claro, los que lo usan cada día para tareas reales: preferimos modelos como Anthropic. Más estables, más predecibles, menos espectaculares, pero más fiables. Porque aquí, la funcionalidad sin fiabilidad… no sirve de nada. Más de 41% de los equipos de técnicos de IA estan usando Antrophic, frente un 21% que usa OpenAI (ChatGPT). El propio Microsoft ha llegado un acuerdo para que desde su plataforma se pueda usar Antrophic, y eso que Copilot es 100% ChatGPT.

Lo que las empresas necesitan

¿Queréis que las empresas implementen inteligencia artificial de verdad? Entonces dadnos estabilidad, no más “funcionalidades”.

Estamos cansados de escuchar que los usuarios “no saben hacer prompts”. No es un problema de prompts. Es un problema de robustez del sistema. Y si encima nos vais a decir, como algunos iluminados de Microsoft ya dijeron, que “la culpa es del usuario”, pues vamos listos.

Porque aquí no estamos hablando de jugar con una app de dibujos. Estamos hablando de sistemas que deben integrarse en procesos críticos de negocio. Y esos señores de OpenAI y de Microsoft deja mucho que desear, sin ir más lejos la semana pasada me llamaron muchos clientes que sus asistentes que analizaban datos habían dejado de funcionar… Nada estos caballeros sacaron una funcionalidad nueva que era un botón que se debían de activar si tenías que analizar datos, claro los asistentes no lo tenían activado y dejaron de funcionar. ¿Están jugando con el dinero de la gente?

Google no se queda atrás… pero viene con arrogancia

Y mientras tanto, Google avanza rápido. Muy rápido. Aunque claro, con esa arrogancia tan de “empresa de ingenieros” que a veces les juega en contra. Le pides que te etiquete una reserva en la agenda con una marca roja para que sea más visible y te contesta que “no está para esas cosas”. Literal. Porque claro, está por encima de esas banalidades humanas… Pero cuidado OpenAI, Google avanza muy bien y rápido. Aunque se les viene un frente muy gordo con los buscadores que estamos dejando de utilizar. Y con nuevos jugadores como Perplexity que no está nada, nada mal como funciona.

Nota mental para Google: A veces lo que el usuario necesita es precisamente eso: que pongas la etiqueta roja en la agenda porque la reunión es importante, no que me recites la teoría del color.

Conclusión #1: menos fuegos artificiales, más fiabilidad

La inteligencia artificial tiene un potencial descomunal. Pero si no arreglamos lo básico —la consistencia, la precisión, la responsabilidad—, no va a haber adopción masiva. Las empresas necesitan herramientas que funcionen, no que sorprendan. Que ejecuten, no que improvisen.

Y esto va para todos los players del mercado: OpenAI, Microsoft, Google… Bajad del pedestal. Escuchad al usuario. Y sobre todo, dejad de alucinar. Que el mundo real necesita soluciones, no ilusiones.

Ahora viene un resumen ejecutivo del estudio comparativo de casos de uso empresariales, al final tienes las conclusiones de que modelos son los mejores (a día de hoy):

Resumen Ejecutivo – Evaluación de Modelos de IA Generativa (Octubre 2025)

Durante octubre de 2025 se evaluaron seis modelos de inteligencia artificial generativa: GPT-5 Instant, GPT-4o, Claude Sonnet 4.5, Microsoft Copilot, Gemini 1.5 Pro y Perplexity AI.
Las pruebas se realizaron a través de tres casos empresariales reales:

optimización de ROI publicitario,
análisis financiero de expansión internacional y
estrategia de pricing dinámico.

El objetivo fue medir la capacidad de cada modelo para razonar, calcular y decidir con mentalidad directiva, evaluando su precisión financiera, su comprensión estratégica y la calidad de sus recomendaciones ejecutivas.

Los resultados muestran que los modelos de OpenAI (GPT-5 Instant y GPT-4o) y Claude Sonnet 4.5 (Anthropic) se consolidan como las soluciones más potentes y coherentes del mercado.
Destacan por su rigor numérico, razonamiento financiero y lenguaje claro, cercano al de un comité de dirección.
Microsoft Copilot mantiene un desempeño sólido y corporativo, aunque con menor profundidad analítica.
Gemini ofrece solidez técnica pero con una orientación poco práctica al negocio.
Perplexity presenta resultados superficiales y escasa capacidad de análisis.

Resultados por área

Área evaluada	Modelos destacados	Conclusión
Cálculo y precisión financiera	GPT-5 Instant / Claude 4.5	Rigor numérico absoluto y coherencia total
Análisis estratégico y de riesgo	Claude 4.5 / GPT-5 / GPT-4o	Visión empresarial y evaluación de riesgo avanzada
Claridad y tono ejecutivo	GPT-5 / GPT-4o	Comunicación profesional y orientación a la acción

Ranking general (Octubre 2025)

Claude Sonnet 4.5 – El modelo más analítico y estratégico, con mentalidad de CFO.
GPT-5 Instant – Preciso, rápido y excelente en comunicación ejecutiva.
GPT-4o – Equilibrio entre razonamiento técnico y visión comercial.
Microsoft Copilot – Correcto y estable, útil en entornos corporativos.
Gemini 1.5 Pro – Técnico, estructurado, pero alejado del contexto empresarial.
Perplexity AI – Resumido y descriptivo, sin criterio financiero sólido.

Conclusión ejecutiva

Los modelos de nueva generación, especialmente Claude 4.5 y GPT-5, ya operan con mentalidad de dirección.
Analizan datos complejos, valoran riesgos y priorizan la rentabilidad con una claridad propia de un comité ejecutivo.

Su fiabilidad y su capacidad de decisión los convierten en herramientas estratégicas para dirección general, finanzas, marketing y operaciones.

Claude 4.5 destaca como el modelo más analítico y financiero.
GPT-5 Instant se confirma como el más adaptable, comunicativo y versátil en la práctica empresarial.

La evaluación demuestra que, en 2025, la inteligencia artificial generativa ha pasado de ser un asistente a convertirse en un verdadero ayudante para la toma de decisiones empresariales.

RECUERDA TRES COSAS:

1- Utiliza el método correcto para interactuar con la inteligencia artificial (no lo que explican en Youtube)

2- Haz que la IA verifique sus resultados: «Verifica el resultado, ¿estás seguro que está bien?»

3- Verifica los resultados, el humano sigue al mando y debe controlar que todo sea correcto

ChatGPT 5 es alucinante… en el mal sentido

El modelo que no escucha (aunque le grites 4 veces)

Cuando tu hermano pequeño responde mejor

Lo que las empresas necesitan

Google no se queda atrás… pero viene con arrogancia

Conclusión #1: menos fuegos artificiales, más fiabilidad

Resumen Ejecutivo – Evaluación de Modelos de IA Generativa (Octubre 2025)

Resultados por área

Ranking general (Octubre 2025)

Conclusión ejecutiva

El Imperio Contraataca

IA en la empresa: más allá del hype y los “coming soon”

Explorando el Futuro de la Inteligencia Artificial: Un Vistazo a las Aplicaciones Empresariales

Deja una respuesta Cancelar la respuesta

Blog

El modelo que no escucha (aunque le grites 4 veces)

Cuando tu hermano pequeño responde mejor

Lo que las empresas necesitan

Google no se queda atrás… pero viene con arrogancia

Conclusión #1: menos fuegos artificiales, más fiabilidad

Resumen Ejecutivo – Evaluación de Modelos de IA Generativa (Octubre 2025)

Resultados por área

Ranking general (Octubre 2025)

Conclusión ejecutiva

Related Posts

El Imperio Contraataca

IA en la empresa: más allá del hype y los “coming soon”

Explorando el Futuro de la Inteligencia Artificial: Un Vistazo a las Aplicaciones Empresariales

Deja una respuesta Cancelar la respuesta