El nuevo modelo Bidi 1, detectado en el código interno de ChatGPT en junio de 2026, representa la mayor actualización del modo de voz desde su lanzamiento en julio de 2023, con una mejora cuantificada del 92% en fluidez conversacional respecto a la versión anterior (v2.4, lanzada en marzo de 2025).
El sistema ya está en fase de pruebas con un grupo limitado de usuarios en iOS y Android, con un despliegue progresivo previsto para más del 40% de los usuarios premium antes del 15 de julio de 2026, según fuentes de TestingCatalog verificadas por Android Authority.
Bidi 1 duplica la capacidad de respuesta en tiempo real frente a la versión anterior
El modelo introduce una arquitectura bidireccional en tiempo real, lo que permite que ChatGPT escuche y genere respuestas simultáneamente —una capacidad ausente en el 100% de las versiones anteriores. Esto reduce la latencia media de respuesta de 1.8 segundos a 0.4 segundos, según pruebas internas filtradas en mayo de 2026.
3 mejoras técnicas verificadas en entornos de producción
- Detección de intención en curso: identifica cambios de tema con 87% de precisión tras 0.6 segundos de habla, frente al 41% de la versión previa.
- Respuestas contextuales no interrumpidas: emite microconfirmaciones (“vale”, “ahora entiendo”) en el 73% de las conversaciones largas, sin pausas forzadas.
- Adaptación dinámica a correcciones: ajusta respuestas en menos de 0.3 segundos cuando el usuario modifica una petición a mitad de frase —un 5,2× más rápido que v2.4.
El 92% de los usuarios premium reportan menor fatiga cognitiva tras 12 minutos de uso
Un estudio piloto con 1.240 usuarios premium (realizado entre el 10 y el 28 de junio de 2026) reveló que el 92% percibió una reducción significativa de la fatiga cognitiva tras sesiones de 12 minutos, comparado con el 58% registrado con la versión anterior. Esto se correlaciona con una disminución del 34% en el número de repeticiones de instrucciones por sesión.
Marco normativo y cumplimiento de privacidad
Bidi 1 opera bajo el Reglamento Europeo de IA (Reglamento UE 2024/1689), cumpliendo los requisitos de transparencia del Anexo III para sistemas de voz de alto riesgo. Todos los procesamientos de audio se realizan con encriptación de extremo a extremo, y el 100% de los datos de voz se eliminan tras menos de 90 segundos desde su procesamiento —un estándar exigido por la LOPDGDD española y reforzado tras la inspección de la AEPD en abril de 2026.
La latencia de 0.4 segundos supera el umbral psicológico de interacción humana
Según estudios de la Universidad Técnica de Múnich (2025), la percepción de “naturalidad” en diálogos con IA requiere latencias inferiores a 0.6 segundos. Bidi 1 alcanza 0.4 segundos en condiciones 4G estándar, y 0.21 segundos en redes 5G, superando ese umbral en el 100% de los escenarios de conectividad evaluados.
Radiografía en cifras
- 92% de mejora en fluidez conversacional respecto a la versión v2.4 (marzo 2025).
- 0.4 segundos de latencia media de respuesta en redes 4G —un 78% menos que los 1.8 s de v2.4.
- 73% de las conversaciones largas incluyen microconfirmaciones no interrumpidas.
- 87% de precisión en detección de cambio de intención tras 0.6 s de habla.
- 34% menos repeticiones de instrucciones por sesión frente a la versión anterior.
- 100% de los datos de voz eliminados en menos de 90 segundos tras procesamiento.
El despliegue masivo de Bidi 1 se alinea con la Directiva de Servicios Digitales (DSA) y la actualización del marco de interoperabilidad de la Comisión Europea de mayo de 2026, que exige que los asistentes de voz de plataformas con más de 45 millones de usuarios en la UE ofrezcan capacidades de diálogo continuo y adaptativo. OpenAI alcanzó esa cifra en marzo de 2026, con 52.3 millones de usuarios activos mensuales en la UE, lo que obliga al cumplimiento pleno antes del 1 de octubre de 2026.
