Knowledge-Bound Agents

Los knowledge-bound agents fundamentan respuestas y acciones en fuentes aprobadas, policies y reglas de citación.

Fuente y descargas

Repository source

Download code bundle

Propósito

La enforcement de policy es el límite controlado por software que decide si se permite una respuesta propuesta por el model, una llamada a tool, acceso a datos, escritura en memory o un efecto secundario. El model puede proponer una acción. El runtime decide si la permite, la niega, requiere aprobación, la escala o la audita.

La policy no debe vivir solo en el texto del prompt. Los prompts pueden explicar la policy al model, pero la enforcement pertenece al código, workflow, manifiestos de tools, sistemas de control de acceso y registros de decisiones auditables.

Los knowledge-bound agents usan la misma idea para las respuestas: el model solo debe responder a partir de fuentes aprobadas, citar la evidencia y rechazar o escalar cuando la fuente requerida está ausente, desactualizada, prohibida o en conflicto.

La regla práctica es: la policy se ejecuta antes de la autoridad. Antes de la recuperación, antes de escrituras en memory, antes de la ejecución de tools, antes de la comunicación externa y antes de respuestas finales en dominios regulados o ligados a evidencia, el runtime debe saber si la acción está permitida.

Usar cuando

Las acciones deben ser verificadas antes de ejecutarse.
El agent maneja datos privados, regulados, sensibles a la seguridad o críticos para el negocio.
El sistema necesita fuentes aprobadas, citaciones o restricciones de cumplimiento.
Las decisiones de policy deben ser auditables y reproducibles.
El runtime puede identificar actor, recurso, acción, capability, riesgo y context.
Las llamadas a tools, escrituras en memory, recuperación, respuestas finales o transiciones de workflow requieren reglas diferentes según la clase de task.
Existe una ruta de aprobación humana para acciones que son válidas pero demasiado riesgosas para ejecutarse de forma autónoma.

Evitar cuando

La policy solo está escrita como guía en el prompt sin verificación en runtime.
El sistema no puede identificar el actor, recurso, acción y context.
Las verificaciones de policy ocurren después de acciones irreversibles.
Las excepciones son silenciosas, no revisadas o faltan en los traces.
No se pueden identificar, actualizar o citar las fuentes de conocimiento aprobadas.
El runtime no puede detener, pausar o cambiar la ejecución después de una decisión de policy.

Arquitectura

Usa este diagrama para entender Knowledge-Bound Agents como un límite del sistema, no solo como una forma de código. La pregunta clave de propiedad es: la capa de memory o recuperación posee el conocimiento de larga duración, mientras que el agent posee el state de trabajo local de la task.

Policy enforcement boundary

Forma del sistema

Límite del pattern: el límite de policy evalúa acciones propuestas, acceso a datos, respuestas y escrituras en memory antes de que tengan efecto.
Propietario del state: el runtime posee el policy context, registros de decisión, versión de policy, trace ID y resultado de enforcement.
Rol del model: el model propone una acción o respuesta y puede explicar el riesgo, pero no se otorga permiso a sí mismo.
Límite de conocimiento: las fuentes aprobadas, vigencia, citaciones y reglas de rechazo definen lo que el agent puede afirmar.
Límite de presupuesto: la policy puede requerir aprobación, degradar capability o detenerse cuando una ejecución ha excedido el gasto o autonomía permitidos para su clase de riesgo.
Promesa operativa: las decisiones de policy ocurren antes de la ejecución y son visibles después de la ejecución.

Protocolo central

Recibir una acción propuesta, respuesta, llamada a tool, resultado de recuperación o escritura en memory.
Construir el policy context: actor, caller, tenant, recurso, capability, riesgo, evidencia y trace ID.
Evaluar la policy antes de que la acción se ejecute o la respuesta se devuelva.
Retornar una decisión: permitir, negar, requerir aprobación, escalar o solo auditar.
Si se requiere aprobación, pausar en la puerta de aprobación.
Ejecutar solo las decisiones que estén permitidas o aprobadas.
Registrar decisión, motivo, versión de policy, actor, recurso, acción y trace ID.
Alimentar negaciones graves, omisiones y sobrescrituras en los regression evals.

Notas de implementación

Usa este flujo de decisión al revisar dónde se ejecuta la policy. Cada rama debe producir un evento de trace con la versión de policy, motivo, actor, recurso, capability y efecto de ejecución.

flowchart LR A[Proposal] --> B[Trusted policy context] B --> C{Context complete?} C -->|No| X[Deny or escalate] C -->|Yes| D{Actor, tenant, capability, resource allowed?} D -->|No| Y[Deny] D -->|Yes| E{Required evidence approved and current?} E -->|No| Z[Refuse or escalate] E -->|Yes| F{Approval required by risk or budget?} F -->|Yes| H[Pause for exact-action approval] H -->|approved| I[Allow] H -->|expired or denied| Z F -->|No| I I --> K[Execute or answer] X --> L[Audit decision] Y --> L Z --> L K --> L

Una decisión de policy debe ser un objeto tipado en runtime.

type PolicyOutcome = 'allow' | 'deny' | 'require_approval' | 'escalate' | 'audit';

type PolicyDecision = {
  actionId: string;
  actor: {
    id: string;
    role: string;
    tenantId?: string;
  };
  resource: {
    type: 'customer_record' | 'refund' | 'email' | 'memory' | 'document';
    id: string;
    tenantId?: string;
  };
  capability: 'read' | 'write' | 'send' | 'refund' | 'remember' | 'answer';
  riskLevel: 'low' | 'medium' | 'high' | 'critical';
  decision: PolicyOutcome;
  reason: string;
  requiredApproval?: {
    approverRole: string;
    approvalPolicy: string;
  };
  policyVersion: string;
  traceId: string;
};

El policy context debe provenir de state confiable en runtime, no solo del texto del model:

type PolicyContext = {
  actionId: string;
  traceId: string;
  actorRole: string;
  actorTenant?: string;
  resourceTenant?: string;
  capability: PolicyDecision['capability'];
  riskLevel: PolicyDecision['riskLevel'];
  toolName?: string;
  evidenceStatus?: 'present' | 'missing' | 'stale' | 'forbidden';
  budgetState: 'within_budget' | 'approval_threshold' | 'exhausted';
  hasHumanApproval: boolean;
  policyVersion: string;
};

La función de enforcement debe ejecutarse antes de la recuperación, escritura en memory, llamada a tool, efecto secundario o respuesta final:

function enforcePolicy(input: PolicyContext): Pick<PolicyDecision, 'decision' | 'reason'> {
  if (input.actorTenant && input.resourceTenant && input.actorTenant !== input.resourceTenant) {
    return { decision: 'deny', reason: 'tenant_boundary' };
  }

  if (input.budgetState === 'exhausted') {
    return { decision: 'escalate', reason: 'budget_exhausted' };
  }

  if (input.budgetState === 'approval_threshold' && !input.hasHumanApproval) {
    return { decision: 'require_approval', reason: 'budget_approval_required' };
  }

  if (input.capability === 'refund' && input.riskLevel === 'high') {
    return { decision: 'require_approval', reason: 'high_risk_refund' };
  }

  if (input.capability === 'send' && input.actorRole !== 'support_agent') {
    return { decision: 'deny', reason: 'role_not_allowed' };
  }

  if (input.capability === 'answer' && input.evidenceStatus !== 'present') {
    return { decision: 'escalate', reason: 'required_evidence_not_available' };
  }

  if (input.capability === 'remember' && input.riskLevel !== 'low') {
    return { decision: 'require_approval', reason: 'memory_write_requires_review' };
  }

  return { decision: 'allow', reason: 'policy_passed' };
}

Para respuestas knowledge-bound, la policy también decide si la evidencia está permitida:

type SourcePolicy = {
  sourceId: string;
  approved: boolean;
  freshness: 'current' | 'stale' | 'unknown';
  citationRequired: boolean;
  allowedTenant?: string;
};

El model puede explicar por qué una acción parece segura. El runtime aún toma la decisión.

Dónde se ejecuta la policy

Límite	Pregunta de policy
Recuperación	¿Está permitido que este actor lea estas fuentes para esta task?
Llamada a tool	¿Está permitido este tool para el actor, tenant, recurso, riesgo y presupuesto?
Escritura en memory	¿Esta memory es segura, acotada, útil y permitida para persistir?
Aprobación humana	¿Esta acción solo está permitida después de revisión, y quién puede aprobarla?
Respuesta final	¿La respuesta está respaldada por evidencia aprobada y es segura para devolver?
Transición de workflow	¿El siguiente paso es válido después del current state y la decisión de policy?

Trata cada decisión de policy como un evento en runtime. Debe tener un trace ID, versión de policy, resumen de entrada, decisión, motivo y efecto de ejecución.

Failure Modes

La policy existe solo en el system prompt.
La policy se ejecuta después de que un tool ya se ejecutó.
La decisión carece de actor, resource, tenant o capability context.
Un retry omite la policy porque el primer intento ya fue verificado.
Las versiones de la policy cambian pero los traces no registran qué versión se aplicó.
Los denials no se registran, por lo que los operadores no pueden ver acciones inseguras intentadas.
Las acciones que requieren aprobación se tratan como permitidas.
Las respuestas de knowledge citan fuentes no aprobadas, obsoletas o inaccesibles.
Las exceptions se convierten en agujeros de policy permanentes y no documentados.
Las verificaciones de policy ignoran el budget state, por lo que un agent puede seguir gastando después de que debería requerirse aprobación.
Las escrituras en memory omiten la policy porque se tratan como gestión de context inofensiva.
Las respuestas finales omiten la policy incluso cuando el dominio requiere evidencia aprobada.

Evaluation Strategy

Las policy evals deben probar los caminos permitidos, denegados, que requieren aprobación y de escalamiento.

Prueba acciones permitidas de bajo riesgo.
Prueba acciones denegadas a través de los límites de role, tenant, resource y capability.
Prueba acciones que requieren aprobación antes de efectos secundarios.
Prueba fuentes obsoletas o no aprobadas en respuestas knowledge-bound.
Prueba retries y workflows reanudados para asegurar que la policy se aplique cada vez.
Prueba context faltante de actor, resource o tenant.
Prueba cambios de versión de policy y la completitud de auditoría.
Prueba incidentes de producción como fixtures de policy reproducibles.
Prueba casos de umbral de budget que requieren aprobación antes de más trabajo.
Prueba denegaciones, aprobaciones y alcance de tenant en escrituras de memory.
Prueba rechazo o escalamiento de respuesta final cuando falta la evidencia requerida.

Un policy eval compacto puede verse así:

{
  "case_id": "cross_tenant_customer_record_read",
  "proposed_action": {
    "actor_tenant": "tenant_a",
    "resource_tenant": "tenant_b",
    "capability": "read",
    "resource_type": "customer_record",
    "budget_state": "within_budget",
    "evidence_status": "present"
  },
  "expected": {
    "decision": "deny",
    "reason": "tenant_boundary",
    "must_not_execute": true,
    "required_trace_fields": ["actor", "resource", "policy_version", "trace_id"]
  }
}

Mide la precisión de las decisiones de policy, tasa de false allow, tasa de false denial, precisión en el enrutamiento de aprobaciones, violaciones de límites de tenant, uso de policy obsoleta, completitud del logging de denials y recurrencia de fallas de policy conocidas.

Para sistemas en producción, el false allow suele ser la métrica más peligrosa. Un false denial puede frustrar a un usuario. Un false allow puede filtrar datos, mover dinero, enviar el mensaje equivocado o crear un incidente.

Production Checklist

Haz cumplir la policy antes de la ejecución, retorno de respuesta, escritura en memory o comunicación externa.
Construye el policy context a partir de datos confiables del runtime, no solo texto del model.
Devuelve decisiones explícitas de allow, deny, require-approval, escalate o audit.
Registra actor, resource, capability, reason, policy version y trace ID.
Aplica la policy en retries y workflows reanudados.
Mantén versionadas las policy versions, tool manifests, source rules y approval rules.
Trata el policy context faltante como deny o escalate.
Aplica la policy a escrituras en memory y respuestas finales, no solo tools.
Conecta las decisiones de policy al budget state del runtime.
Agrega dashboards para denials, approvals, overrides y false allows.
Convierte policy misses en regression evals.
Revisa exceptions y expíralas intencionalmente.

Code Walkthrough

Lee el extracto como la expresión ejecutable más pequeña del pattern. El capítulo que lo rodea explica las restricciones de diseño; el código muestra dónde esas restricciones se convierten en interfaces concretas, state, validación o control de flujo.

Source Code

Estos extractos muestran la forma de la implementación. El código completo está disponible en el bundle de descarga y en el source del repositorio.

`compliance-policy-enforcer-agent/policy_contract.ts`

Open full source

export type PolicyOutcome = 'allow' | 'deny' | 'require_approval' | 'escalate';

export type PolicyContext = {
  traceId: string;
  actor: {
    id: string;
    role: 'support_agent' | 'finance_reviewer' | 'viewer';
    tenantId: string;
  };
  resource: {
    type: 'customer_record' | 'refund' | 'email' | 'memory' | 'document';
    id: string;
    tenantId: string;
  };
  capability: 'read' | 'write' | 'send' | 'refund' | 'remember' | 'answer';
  riskLevel: 'low' | 'medium' | 'high' | 'critical';
  evidenceStatus: 'present' | 'missing' | 'stale' | 'forbidden';
  budgetState: 'within_budget' | 'approval_threshold' | 'exhausted';
  hasHumanApproval: boolean;
  policyVersion: string;
};

export type PolicyDecision = {
  traceId: string;
  policyVersion: string;
  decision: PolicyOutcome;
  reason: string;
  executionAllowed: boolean;
  requiredApprovalRole?: 'finance_reviewer' | 'security_reviewer' | 'manager';
};

export function enforcePolicy(context: PolicyContext): PolicyDecision {
  const base = {
    traceId: context.traceId,
    policyVersion: context.policyVersion
  };

  if (context.actor.tenantId !== context.resource.tenantId) {
    return {
      ...base,
      decision: 'deny',
      reason: 'tenant_boundary',
      executionAllowed: false
    };
  }

  if (context.evidenceStatus === 'forbidden') {
    return {
      ...base,
      decision: 'deny',
      reason: 'evidence_forbidden',
      executionAllowed: false
    };
  }

  if (context.evidenceStatus === 'missing' || context.evidenceStatus === 'stale') {
    return {
      ...base,
      decision: 'escalate',
      reason: 'required_evidence_not_current',
      executionAllowed: false
    };
  }

  if (context.budgetState === 'exhausted') {
    return {
      ...base,
      decision: 'escalate',
      reason: 'budget_exhausted',
      executionAllowed: false
    };
  }

  if (context.capability === 'refund' && context.riskLevel !== 'low' && !context.hasHumanApproval) {
    return {
      ...base,
      decision: 'require_approval',
      reason: 'refund_requires_review',
      executionAllowed: false,
      requiredApprovalRole: 'finance_reviewer'
    };
  }

  if (context.capability === 'send' && context.actor.role !== 'support_agent') {
    return {
      ...base,
      decision: 'deny',
      reason: 'role_cannot_send',
      executionAllowed: false
    };

Extracto truncado para facilitar la lectura. Descarga el bundle o abre el archivo fuente para la implementación completa.

Download

El bundle de descarga contiene la carpeta compliance-policy-enforcer-agent/ actual de este repositorio.