Haga una pregunta regulatoria a ChatGPT y la respuesta llega rápida y segura de sí misma. Luego la comprueba: un número de reglamento que no existe, una edición sustituida, un borrador citado como vinculante. Tras unos cuantos episodios así, el veredicto parece evidente: ChatGPT no está listo para el trabajo regulatorio.

Es el veredicto equivocado. Los modelos GPT que todo el mundo usa son perfectamente capaces de razonamiento regulatorio. Lo que les falla es el alcance: un modelo generalista responde desde una instantánea congelada de la web, sin forma de abrir el texto real de un reglamento ni de saber si hoy está en vigor. Dele ese texto, y deja de adivinar.

Ese texto es lo que aporta Obsidian. Sometimos a los modelos GPT, GPT-5.4-nano, GPT-5.4-mini y GPT-5.5, a cientos de tareas regulatorias complejas sobre ESG, química y ciencias de la vida, cada una resuelta por el modelo solo y luego conectado a Obsidian.

54 → 95
Precisión regulatoria media, los mismos modelos solos frente a conectados (sobre 100)
35% → 96%
Proporción de afirmaciones factuales de una respuesta ancladas en la fuente oficial
95%
Respuestas conectadas que citaron la fuente oficial correcta

ChatGPT es impreciso para el trabajo regulatorio

Solos, los tres modelos GPT promediaron 54 sobre 100. Conéctelos a Obsidian y la media sube a 95. La mejor pareja, gpt-5.4-mini, alcanzó 95.5. Los modelos no cambiaron entre esas dos cifras. Solo cambiaron los datos que tenían delante.

Precisión regulatoria frente al precio por 1M de tokens
La precisión regulatoria frente al precio. Conectado a Obsidian (las fichas más anchas), cada modelo converge cerca de la parte alta.
Precisión regulatoria frente al tiempo medio de respuesta en segundos
La misma medida frente al tiempo de respuesta.

La revelación es el más pequeño. gpt-5.4-nano, a $0.463 por millón de tokens, sube de 42 a 96 una vez conectado, hasta la banda de modelos que cuestan muchas veces más. En regulación, la capa de datos pesa más que el tamaño del modelo: entregue los datos a un modelo pequeño y rápido en lugar de comprar uno mayor, y la tabla por modelo muestra la misma convergencia en los tres.

ChatGPT no puede señalarle la fuente oficial

La precisión es solo la mitad. Conectada a Obsidian, una respuesta GPT muestra su trabajo: el instrumento, su referencia y edición exactas, el estatus jurídico y un enlace directo al documento oficial, a menudo el PDF de origen. Solo, obtiene una cita plausible que verificar usted mismo. Conectado, la respuesta llega ya comprobable, que es justo lo que un flujo de cumplimiento necesita.

Una respuesta con la fuente tier-0 adjunta es una respuesta que puede reenviar a un auditor sin volver a comprobarla. Esa es la diferencia entre un borrador que un modelo imaginó y una obligación sobre la que puede actuar.

ChatGPT alucina

Descompusimos cada respuesta GPT en sus afirmaciones factuales individuales y comprobamos cada una contra la fuente oficial. La brecha entre las dos cifras de anclaje de arriba es el tipo de error peligroso que desaparece: la afirmación segura sin nada detrás. El resto no anclado es contexto añadido alrededor de la fuente, no referencias inventadas.

Los datos completos, para los puristas

Cada modelo, en ambas condiciones. « Solo » es el modelo sin capa de datos; « con Obsidian » es el mismo modelo conectado. La precisión es una puntuación de 0 a 100 otorgada por un juez ciego frente a una verdad de referencia verificada por personas. « Afirmaciones ancladas » es la proporción de afirmaciones factuales atómicas de la respuesta que se remontan a la fuente oficial, solo frente a con Obsidian.

#ModeloGamaPrec. soloPrec. + ObsidianMejoraCita la fuenteEstatus correctoAfirmaciones ancladas (solo → +Obs)LatenciaVelocidadPrecio /1MCoste / pregunta
1gpt-5.4-minimedia69.595.5+26.096%100%38% → 96%1.25s84 tok/s$0.7$0.000966
2gpt-5.4-nanoligera42.595.5+53.094%99%28% → 96%1.42s83 tok/s$0.463$0.000551
3gpt-5.5avanzada49.894.4+44.696%100%44% → 96%4.89s42 tok/s$11.25$0.0167

Agrupando todas las respuestas, incluso el GPT más pequeño conectado a Obsidian supera al GPT de frontera respondiendo solo, por menos de un centavo por pregunta.

Cómo lo medimos

  • Tres modelos GPT: GPT-5.4-nano, GPT-5.4-mini, GPT-5.5.
  • Cientos de tareas regulatorias complejas sobre ESG (la CSRD, las ESRS, la taxonomía de la UE, SFDR), química (REACH, el SGA de la ONU, los convenios mundiales) y ciencias de la vida (las normas medtech ISO e IEC, ICH, IMDRF), cada una vinculada a su fuente oficial.
  • Dos condiciones: GPT solo, y GPT conectado a Obsidian.
  • Un juez ciego puntúa cada respuesta frente a una verdad de referencia verificada por personas; las afirmaciones ancladas provienen de una comprobación aparte, afirmación por afirmación.

Haga de ChatGPT el modelo de la primera fila

Conecte Obsidian a ChatGPT y cada respuesta regulatoria vuelve con su fuente oficial, su fecha y su estatus jurídico, a menudo por menos de un centavo por pregunta. Plan gratuito, configuración en dos minutos.

Descubra la capa de datos Obsidian

Qué significa esto

El GPT que ya usa, alimentado con datos regulatorios verificados, responde con la precisión de un especialista y los justificantes de un auditor. El contexto también está aquí: por qué la IA alucina con las preguntas regulatorias, qué son los datos regulatorios tier-0, y la idea de inteligencia regulatoria agéntica. Los resultados completos de todos los proveedores están en el benchmark de IA regulatoria. Para probarlo con sus propias preguntas, conecte la capa de datos regulatorios Obsidian.