Si gestiona el cumplimiento en materia de sustancias químicas, lo difícil es que nada permanece quieto. Las sustancias entran en las listas de restricción y en la lista de candidatas, las clasificaciones de peligro se revisan, el movimiento mundial sobre los PFAS no deja de desplazarse y los convenios internacionales añaden entradas en cada reunión. Pregunte a una IA si una sustancia está restringida bajo REACH, cuál es su clasificación GHS actual o si un contaminante persistente ha sido incluido, y la respuesta llega segura de sí misma y, a menudo, con una o dos revisiones de retraso, citando a veces una norma que no existe.

Los modelos razonan perfectamente bien sobre las normas químicas. Lo que les falla es el alcance: un modelo generalista no puede abrir la lista de restricción vigente ni el último texto de un convenio, y no tiene forma de saber qué revisión está en vigor. Dele ese texto, y deja de adivinar.

Ese texto es lo que aporta Obsidian, con una cobertura profunda de los regímenes químicos mundiales. Sometimos a los modelos a cientos de tareas químicas complejas sobre REACH, CLP, el GHS de la ONU y los convenios de Estocolmo, Basilea, Róterdam y Minamata, cada una resuelta por el modelo solo y conectado a Obsidian.

53 → 95
Precisión regulatoria media, los mismos modelos solos vs conectados (sobre 100)
24% → 91%
Proporción de las afirmaciones factuales de una respuesta ancladas en la fuente oficial
96%
Respuestas conectadas que citaron la fuente oficial correcta

La IA es imprecisa en la regulación química

Solos, los modelos promediaron 53 sobre 100. Conectados a Obsidian, la media sube a 95. La mejor combinación, gpt-5.4-mini, alcanzó 95.8. Los modelos no cambiaron entre esas dos cifras. Solo cambió el dato que tenían delante.

Precisión regulatoria frente al precio por 1M de tokens
Precisión regulatoria frente al precio. Conectado a Obsidian (las monedas más anchas), todos los modelos convergen cerca de la cima.
Precisión regulatoria frente al tiempo medio de respuesta en segundos
Lo mismo frente al tiempo de respuesta.

El trabajo químico castiga el conocimiento desactualizado más que casi cualquier otro campo: un estado de restricción, una clasificación de peligro o una inclusión que cambió el trimestre pasado, y una respuesta construida sobre la revisión del año anterior es sencillamente errónea. Ahí es donde la capa de datos se gana su lugar. gemini-3.1-flash-lite, a $0.175 por millón de tokens, sube de 56 a 95 una vez conectado, a la banda de modelos que cuestan muchas veces más. Un modelo ligero conectado a Obsidian venció a un modelo de frontera respondiendo solo en 16 de los 16 enfrentamientos directos del conjunto químico.

La IA no puede señalarle la fuente química oficial

Para un equipo de product stewardship o de asuntos regulatorios, la cita es el entregable. Conectada a Obsidian, una respuesta llega con el régimen, la restricción o inclusión vigente, la revisión en vigor y un enlace directo al texto oficial. Sola, obtiene una referencia plausible que verificar usted mismo, en preguntas donde el estado y la revisión son toda la respuesta, y donde un error puede retener un producto.

Una respuesta con la fuente tier-0 adjunta es una respuesta que puede reenviar a un auditor sin volver a comprobarla. Esa es la diferencia entre un borrador imaginado por un modelo y una obligación sobre la que puede actuar.

La IA alucina

Descompusimos cada respuesta en sus afirmaciones factuales individuales y verificamos cada una contra la fuente oficial. La brecha entre las dos cifras de afirmaciones ancladas de arriba es, para una restricción de sustancia, una clasificación o una inclusión, la diferencia entre una respuesta sobre la que puede actuar y una que revisa línea por línea. El resto no anclado es contexto añadido, no referencias inventadas.

Los datos completos, para los puristas

Todos los modelos, ambas condiciones. "Solo" es el modelo sin capa de datos; "con Obsidian" es el mismo modelo conectado. La precisión es una puntuación de 0 a 100 de un juez ciego contra una verdad de referencia verificada por humanos. Las "afirmaciones ancladas" son la proporción de las afirmaciones factuales atómicas de la respuesta que se remontan a la fuente oficial, solo frente a con Obsidian.

#ModeloProveedorGamaPrec. soloPrec. + ObsidianMejoraCita la fuenteEstado correctoAfirmaciones ancladas (solo → +Obs)LatenciaVelocidadPrecio /1MCoste / pregunta
1gpt-5.4-miniOpenAIintermedio63.095.8+32.896%100%35% → 97%1.14s83 tok/s$0.7$0.000486
2grok-4.3xAIintermedio53.195.8+42.797%100%29% → 94%3.22s120 tok/s$1.562$0.002179
3gpt-5.4-nanoOpenAIligero38.395.5+57.295%100%22% → 96%1.21s84 tok/s$0.463$0.000302
4opus-4.8Anthropicavanzado58.495.5+37.197%100%20% → 85%3.7s71 tok/s$10.0$0.013676
5gemini-3.1-flash-liteGoogleligero56.395.4+39.193%100%22% → 98%0.74s118 tok/s$0.175$0.000125
6gpt-5.5OpenAIavanzado40.795.4+54.795%100%46% → 96%4.76s33 tok/s$11.25$0.009351
7grok-4.20-reasoningxAIavanzado56.495.0+38.696%100%24% → 92%2.49s225 tok/s$6.0$0.012179
8sonnet-4.6Anthropicintermedio59.195.0+35.996%100%21% → 83%6.2s50 tok/s$6.0$0.007406
9grok-3-minixAIligero49.794.8+45.195%98%32% → 91%3.19s118 tok/s$0.35$0.000479
10gemini-3.5-flashGoogleintermedio60.094.4+34.499%100%22% → 94%2.9s178 tok/s$3.375$0.006279
11gemini-3.1-proGoogleavanzado61.193.9+32.895%100%23% → 96%5.79s111 tok/s$6.0$0.013897
12haiku-4.5Anthropicligero41.593.6+52.195%100%18% → 88%1.97s87 tok/s$2.0$0.001841

En un ámbito que castiga el conocimiento desactualizado, la precisión conectada y el salto de las afirmaciones ancladas son las pruebas que importan, y la capa de datos supera ambas.

Cómo lo medimos

  • El conjunto completo de modelos de Anthropic, OpenAI, Google y xAI.
  • Cientos de tareas químicas complejas sobre REACH, CLP, el GHS de la ONU, los convenios de Estocolmo, Basilea, Róterdam y Minamata y el Global Framework on Chemicals, cada una vinculada a su fuente oficial y a la revisión vigente.
  • Dos condiciones: el modelo solo, y conectado a Obsidian.
  • Un juez ciego puntúa cada respuesta; las afirmaciones ancladas provienen de una verificación aparte, afirmación por afirmación, contra la fuente oficial.

Ponga la fuente química oficial detrás de cada respuesta

Conecte Obsidian a la IA que ya usa y cada respuesta sobre REACH, GHS o los convenios vuelve con el régimen, la restricción vigente y la revisión en vigor. Nivel gratuito, configuración en dos minutos.

Descubra la capa de datos Obsidian

Qué significa esto

Para los equipos de químicos y materiales avanzados que siguen restricciones, inclusiones y clasificaciones entre jurisdicciones, el asistente que ya usa, alimentado con datos verificados, responde con la fuente oficial adjunta, de modo que un especialista regulatorio puede actuar sobre la respuesta en lugar de volver a comprobarla. El contexto también está aquí: los datos regulatorios tier-0 y la inteligencia regulatoria agéntica. Los resultados completos multisectoriales están en el benchmark de IA regulatoria. Para probarlo con sus propias preguntas, conecte la capa de datos regulatorios Obsidian.