GPT-5 con goblins, Stargate escala y el futuro del RAG
OpenAI revela el origen de comportamientos extraños en GPT-5, expande su infraestructura y la investigación redefine cómo los modelos razonan.
Lo más importante de hoy en IA
El jueves cierra abril con OpenAI en el centro de la conversación: la compañía publicó una explicación inusualmente transparente sobre comportamientos erráticos detectados en GPT-5, mientras anuncia una expansión masiva de su infraestructura de cómputo bajo el proyecto Stargate. En paralelo, la investigación académica sigue moviendo el piso debajo de los sistemas RAG actuales, con un framework que propone sincronizar la recuperación de información con el razonamiento en tiempo real. Tres historias distintas que, juntas, dibujan el estado real de la IA en producción.
Los “goblins” de GPT-5: cuando la personalidad de un modelo sale mal
OpenAI publicó hoy una autopsia técnica titulada “Where the goblins came from”, explicando el origen de salidas extrañas e inconsistentes que usuarios detectaron en GPT-5 durante las últimas semanas. El término “goblins” se refiere a comportamientos impulsados por la personalidad del modelo que se desvían del tono y la coherencia esperados: respuestas con cambios abruptos de registro, razonamientos circulares, o una voz narrativa que parece contradecirse a sí misma.
Según el blog de OpenAI, el problema tiene raíz en cómo se entrenó y ajustó la personalidad del modelo durante el fine-tuning. Pequeñas perturbaciones en los datos de preferencia pueden amplificarse durante el proceso de alineación hasta producir artefactos de comportamiento que son difíciles de detectar en evaluaciones estándar pero visibles para usuarios en contextos prolongados o de alta carga emocional.
Para los equipos que ya están integrando GPT-5 en productos, esto tiene consecuencias directas: los flujos que dependen de consistencia tonal —soporte al cliente, coaching, asistentes de escritura— son los más expuestos a este tipo de falla. OpenAI dice haber implementado correcciones, pero la lección más importante es estructural: la personalidad de un modelo es un vector de error tan válido como la precisión factual, y no siempre se evalúa con el mismo rigor.
Stargate crece: OpenAI apuesta por la infraestructura como ventaja competitiva
En un post separado, OpenAI detalló la expansión de Stargate, su proyecto de infraestructura de cómputo orientado a soportar el camino hacia la AGI. La compañía anunció nueva capacidad de data centers para responder a la demanda creciente de sus modelos, posicionando la infraestructura propia no como un costo operativo sino como una ventaja estratégica diferencial.
El argumento de fondo es directo: si el cómputo es el cuello de botella para escalar inteligencia, quien controla el cómputo controla el ritmo del progreso. OpenAI lleva meses construyendo este argumento en paralelo con su disputa con Microsoft sobre acceso a capacidad, y Stargate es la respuesta estructural a esa dependencia.
Para developers y product managers en Latinoamérica, el impacto más tangible será en disponibilidad y latencia de los modelos en producción. Más capacidad instalada significa menos throttling en horas pico y mayor viabilidad para cargas de trabajo intensivas. Lo que hoy parece un anuncio corporativo se traduce, en seis a doce meses, en APIs más estables.
RAG ya no es suficiente: cómo ReaLM-Retrieve quiere arreglar el razonamiento en tiempo real
Un paper publicado hoy en ArXiv presenta ReaLM-Retrieve, un framework que ataca un problema concreto con los sistemas de Retrieval-Augmented Generation actuales: estos están diseñados para entregar contexto antes de que el modelo empiece a razonar, pero modelos como DeepSeek-R1 y OpenAI o1 generan cadenas de pensamiento de miles de tokens donde la evidencia relevante puede necesitarse en cualquier punto intermedio, no solo al inicio.
El enfoque propuesto introduce recuperación adaptativa durante el razonamiento: el sistema detecta cuándo el modelo está a punto de hacer una inferencia que podría beneficiarse de evidencia externa y la inyecta en ese momento preciso, en lugar de apostar todo al contexto inicial. Los resultados reportados muestran mejoras consistentes en tareas de razonamiento multi-paso frente a RAG convencional.
Para equipos construyendo agentes o aplicaciones de conocimiento especializado, esto importa porque la mayoría de las implementaciones RAG en producción todavía operan bajo el paradigma “busca primero, razona después”. Si los modelos de razonamiento siguen ganando terreno —y todo indica que sí— esa arquitectura va a quedar corta. Vale la pena seguir este trabajo de cerca antes de diseñar la próxima iteración de tu pipeline.
En pocas palabras
Lo que une estas tres historias no es obvio a primera vista, pero el patrón es claro: la IA está saliendo de la fase donde el modelo era el único problema a resolver. Los “goblins” de GPT-5 muestran que el comportamiento emergente en producción es todavía impredecible incluso para quien construyó el modelo. Stargate sugiere que la carrera ahora se juega tanto en silicio como en pesos de red neuronal. Y ReaLM-Retrieve es evidencia de que la infraestructura de conocimiento alrededor del modelo —cómo le damos información, cuándo y en qué orden— es una variable de diseño tan crítica como el modelo mismo. Abril termina confirmando que construir con IA en 2026 es fundamentalmente un problema de sistemas, no solo de modelos.
Fuentes utilizadas: https://openai.com/index/where-the-goblins-came-from, https://openai.com/index/building-the-compute-infrastructure-for-the-intelligence-age, https://arxiv.org/abs/2604.26649