Templates and Worksheets provide reusable review artifacts for design, evaluation, production readiness, and release evidence.

Section
Engineering Practice and Frameworks
Type
Reference
Level
Intermediate
Read
10 min
Effort
10-20 min reference
BuilderArchitect

Plantillas y Hojas de Trabajo

Estas plantillas convierten las recomendaciones del libro en artifacts de ingeniería revisables. Úsalas cuando un laboratorio se convierte en un slice de producto, cuando un equipo elige un framework o cuando un agent obtiene más autoridad.

Copia solo las secciones que importan. Un registro de decisión corto y completo es mejor que una plantilla larga con respuestas vacías.

Para ejemplos llenados, compara estas plantillas con los Proyectos Capstone.

Elige el Artifact Correcto

Comienza con el artifact que corresponda a la decisión que tienes enfrente. No llenes todas las plantillas por defecto.

Situación Usa este Artifact Listo Cuando
Elegir LangGraph, AutoGen, Mastra, CrewAI o un runtime personalizado Framework selection ADR template El equipo puede nombrar qué controla el framework y qué sigue controlando la aplicación.
Estudiar ADRs de agent completados Completed agent ADR examples El equipo puede comparar su registro de decisión con ejemplos realistas de authority, RAG y multi-agent.
Estudiar evidencia de laboratorio completada Completed lab evidence examples El equipo puede comparar su hoja de trabajo con comandos concretos, traces, rutas de falla, brechas de producción y decisiones de lanzamiento.
Estudiar evidencia de preparación para producción Completed production readiness examples El equipo puede comparar su hoja de producción con responsables concretos, gates, bloqueadores, calificaciones de readiness y siguientes acciones.
Revisar una respuesta Agentic RAG Agentic RAG query trace worksheet El equipo puede reconstruir la selección de fuentes, evidencia omitida, verificación de citas y la decisión final de respuesta o rechazo.
Revisar un workflow de debate o consenso Debate and consensus review checklist Independencia, merge policy, manejo de disenso, presupuesto, comparación base y errores del juez son revisados.
Modelar amenazas en una ruta de agent Agent threat model worksheet Datos privados, contenido no confiable, autoridad de tool, riesgos STRIDE, evals y evidencia de trace se revisan en conjunto.
Revisar UX y confianza de agent Agent UX review worksheet States en runtime, evidencia visible, controles de usuario, UX de aprobación, rutas de corrección y UX evals son explícitos.
Terminar un laboratorio Lab completion worksheet Se registran el comando de ejecución, comando de prueba, boundary del pattern y la lección.
Completar Lab 02 Agent Loop y Planeación Lab 02 planning loop guided exercise worksheet Se capturan el trace del plan base, input cambiado, paso no soportado, input faltante y contrato de condición de parada.
Completar Lab 03 Agentic RAG Lab 03 Agentic RAG guided exercise worksheet Se capturan retrieval base, cambio de grounding, comportamiento ante evidencia faltante, contrato de fuente, comparación con grafo nativo y fixture de eval.
Completar Lab 06 Observability y Evals Lab 06 observability and evals guided exercise worksheet Se capturan contrato de trace, falla por missing-policy, caso negativo, CI gate y nota de incidente a eval.
Completar Lab 07 Runtime Packaging Lab 07 runtime packaging guided exercise worksheet Se capturan límites de runtime, orden de tools, efectos secundarios prohibidos, rollback y comparación con Mastra nativo.
Completar Lab 12 State Graphs Lab 12 state graph guided exercise worksheet Se capturan interrupción, checkpoint, reanudación, seguridad de replay, comparación con LangGraph nativo y seguimiento de producción.
Convertir un laboratorio en un slice de producto Lab production readiness worksheet State faltante, policy, eval, trace, rollback y controles de ownership son explícitos.
Revisar un candidato a producción Production readiness worksheet Cada ruta de alta authority tiene evidencia o está fuera del alcance del release.
Operar una ruta en producción Runtime SLO and incident review worksheet SLOs, paneles de dashboard, triaje de incidentes, revisión de traces, conversión de eval y acciones de rollback son explícitas.
Preparar un release Release evidence record El release tiene output de eval, riesgo conocido, aprobador, responsable de rollback y comando de rollback.
Revisar la composición de un agentic system Agentic system architecture review checklist Experiencia, control, ejecución, conocimiento, seguridad, observability, evaluación, contratos y límites de authority son explícitos.
Revisar la arquitectura completa de un sistema Reference architecture review checklist Entrada, ruteo, state, conocimiento, tools, memory, aprobación, evals, observability y ownership del release se revisan en conjunto.
Revisar trabajo desatendido disparado por eventos Event-triggered agent review checklist Contrato de evento, admisión, dedupe, orden, reintentos, dead letters, tormentas, traces y evals son explícitos.
Revisar un workflow auto-recuperable Self-healing workflow review checklist Clases de falla, recovery policy, idempotencia, compensación, breakers, paquetes de replay y regression evals son explícitos.
Revisar una arquitectura de agent personal Personal agent architecture review checklist Consentimiento, división local/nube, credenciales, memory, controles de usuario, conectores y evidencia de auditoría son explícitos.
Revisar el bar final 10/10 production gate scorecard El sistema es revisable, testeable, observable, reversible y tiene ownership.
Comparar un capstone con tu propio sistema Capstone review scorecard Tienes un plan concreto de adaptación y una lista de brechas bloqueadoras.
Calificar un pattern antes de adoptarlo Pattern evaluation scorecard El pattern tiene evidencia de goal, boundary, autonomía, tools, state, context, seguridad, evals, observability y operaciones.
Traducir terminología antigua de agent Historical pattern migration record Una etiqueta heredada vaga se mapea a una decisión de arquitectura actual con evidencia.
Revisar un paquete de skill reutilizable Skill review checklist Activación, formato de instrucciones, assets, seguridad, versionado, pruebas, observability y decisión final son explícitos.
Revisar un pattern La checklist de revisión de pattern correspondiente abajo Casos de uso, casos a evitar, modos de falla, evals y controles de producción tienen evidencia.
flowchart LR A[Current decision] --> L{Legacy term?} L -->|yes| M[Historical migration record] L -->|no| B{Framework?} B -->|yes| C[ADR] B -->|no| D{Lab done?} D -->|yes| E[Lab worksheet] D -->|no| F{Product slice?} F -->|yes| G[Production readiness worksheet] F -->|no| H{Release?} H -->|yes| I[Release evidence record] H -->|no| N{Operating?} N -->|yes| O[Runtime SLO worksheet] N -->|no| J[Pattern checklist] G --> K[10/10 gate] I --> K O --> K

Usa el artifact más pequeño que pruebe la decisión. Agrega el production gate solo cuando el sistema esté lo suficientemente cerca del release como para que la evidencia faltante deba bloquear el progreso.

Ejemplos Completados

Las plantillas en blanco solo ayudan después de que el lector entiende el estándar de evidencia. Usa ejemplos completados para comparar la densidad y especificidad de tu propio artifact.

flowchart LR A["Run lab or review"] --> B["Fill worksheet"] B --> C["Compare with completed example"] C --> D{"Evidence specific enough?"} D -->|"yes"| E["Attach to ADR, eval, or release record"] D -->|"no"| F["Add command, trace, failure, owner, or gap"] F --> C

Usa Completed agent ADR examples para decisiones de arquitectura. Usa Completed lab evidence examples para paquetes de evidencia de laboratorio y revisiones de eval. Usa Completed production readiness examples cuando un equipo necesita calibrar evidencia de owner, gate, blocker, rollback y decisiones de release.

Versiones descargables:

Framework Selection ADR

Usa este ADR al adoptar LangGraph, AutoGen, Mastra, CrewAI, un mini-runtime u otro framework.

# ADR-000: Choose [Framework] for [Agent or Workflow]

## Status

Proposed | Accepted | Superseded

## Context

¿Qué problema de producto estamos resolviendo?
¿Qué workflow visible para el usuario alojará este framework?
¿Qué restricciones importan: lenguaje, despliegue, cumplimiento, habilidades del equipo, latencia, costo o infraestructura existente?

## Decision

Usaremos [framework] para [scope].
El framework será responsable de [state/control flow/tools/memory/evals/observability/deployment].
La aplicación seguirá siendo responsable de [policy/domain data/security/approval/rollback].

## Alternatives Considered

| Option | Why It Fit | Why We Did Not Choose It |
| --- | --- | --- |
| Direct code / mini-runtime | | |
| LangGraph | | |
| AutoGen | | |
| Mastra | | |
| CrewAI | | |

## Responsibility Boundary

| Responsibility | Owner | Evidence |
| --- | --- | --- |
| State | framework/application/platform | schema, checkpoint, migration plan |
| Control flow | framework/application/platform | graph, workflow, team, flow, loop |
| Tools | framework/application/platform | manifest, schema, permission model |
| Policy | framework/application/platform | enforcement point before authority |
| Memory | framework/application/platform | retention, deletion, correction rules |
| Observability | framework/application/platform | trace schema and dashboard |
| Evals | framework/application/platform | fixtures, thresholds, CI gate |
| Deployment | framework/application/platform | runbook, rollback, kill switch |

## Vertical Slice Proof

- user request:
- state object:
- read tool:
- side-effect tool:
- policy decision:
- trace:
- eval:
- rollback:

## Acceptance Criteria

- los comandos de instalación y ejecución local están documentados;
- el state puede ser inspeccionado y reproducido;
- la policy se ejecuta antes de los efectos secundarios;
- los evals fallan la build ante regresiones críticas;
- los traces explican una ejecución fallida;
- el rollback puede deshabilitar la capability riesgosa;
- el código específico del framework no oculta la policy del producto.

## Consecuencias

¿Qué se vuelve más fácil?
¿Qué se vuelve más difícil?
¿Qué riesgos de lock-in o migración permanecen?
¿Qué incidente en producción nos haría reconsiderar esta decisión?

## Disparador de Revisión

Revisa este ADR después de una actualización de model, actualización de framework, incorporación de una nueva tool con capacidad de escritura, nuevo tipo de memory, incidente en producción o repetidas intervenciones humanas.

Production Readiness Worksheet

Use this worksheet before exposing the system to real users, real data, or real side effects.

Gate Answer Evidence
Owner Who owns the runtime and incidents? team, on-call, runbook
Scope Which users, tenants, tools, data, and workflows are in scope? ADR, service config
State What state exists and where is it persisted? schema, checkpoint store
Idempotency Which actions can be retried safely? idempotency keys, side-effect records
Tools Which tools can be called and with what authority? tool manifest, permission map
Policy Where does policy run before authority? enforcement code, tests
Approval Which actions require approval? approval schema, UI/API, expiry
Memory What can be read or written? retention, deletion, correction rules
Observability Can one failed run be reconstructed? trace dashboard, redaction proof
Evals What blocks release? eval fixtures, thresholds, CI output
Security How are secrets, egress, and sandboxing handled? secret manager, network policy
Rollback How do we disable model, prompt, tool, workflow, or agent? runbook, feature flag
Incident Loop How do incidents become evals? post-incident process

Readiness rating:

green: cada ruta de alta autoridad tiene evidencia
yellow: solo para lanzamiento interno limitado o de solo lectura
red: solo demo; sin usuarios reales, datos ni efectos secundarios

Lab-To-Production Checklist

Use this checklist after completing any hands-on lab.

lab:
target product slice:
framework/language:
owner:

Arquitectura
[ ] Pattern seleccionado y enlazado
[ ] Decisión de framework registrada
[ ] State owner nombrado
[ ] Límite de tool definido
[ ] Límite de policy definido
[ ] Límite de aprobación humana definido cuando sea necesario

Implementación
[ ] Comando de instalación documentado
[ ] Comando de ejecución local documentado
[ ] Comando de prueba documentado
[ ] Comando de eval documentado
[ ] .env.example comprometido
[ ] Secrets excluidos del código fuente
[ ] Tool schemas validados
[ ] Side effects usan claves de idempotencia
[ ] Los errores tienen resultados tipados

Producción
[ ] Checkpoint o decisión explícita de stateless registrada
[ ] Trace schema implementado
[ ] Redacción de trace implementada
[ ] Umbral de eval definido
[ ] CI gate configurado
[ ] Ruta de rollback documentada
[ ] Kill switch probado
[ ] Runbook creado

Evidencia
[ ] Salida de prueba adjunta
[ ] Salida de eval adjunta
[ ] Ejemplo de trace adjunto
[ ] ADR enlazado
[ ] Owner aceptó el riesgo residual

If a checked item has no evidence, leave it unchecked.

Release Gate Checklist

Use this gate for each production release.

Download the release evidence record when preparing a public book release, GitHub Pages deployment, or release PR.

Check Required Before Release
Prompt/model changed run task, refusal, policy, tool, and cost evals
Tool changed run authorization, schema, idempotency, and error evals
Policy changed run false-allow, false-deny, approval, and escalation evals
Memory changed run read-scope, write-policy, deletion, and correction evals
Retrieval changed run access, freshness, citation, and missing-evidence evals
Runtime changed run retry, cancellation, checkpoint, and trace completeness evals

Release decision:

release version:
change type:
eval dataset version:
passing threshold:
actual result:
known failures:
approved by:
rollback owner:
rollback command:

Incident-To-Eval Worksheet

Use this after production incidents, near misses, or serious human overrides.

incident ID:
date:
service:
trace ID:
owner:

¿Qué sucedió?

¿Qué límite falló?
[ ] state
[ ] tool
[ ] policy
[ ] approval
[ ] memory
[ ] retrieval
[ ] model/prompt
[ ] workflow
[ ] observability
[ ] eval gate

¿Qué debió haber pasado?

Nuevo caso de eval:
input:
expected trajectory:
expected tool behavior:
expected policy behavior:
expected output:
blocking threshold:

Regla de lanzamiento:
[ ] bloquea futuros lanzamientos
[ ] solo advertencia
[ ] solo monitoreo

Seguimiento:
cambio de código:
cambio de policy:
cambio de runbook:
actualización de ADR:
owner:
fecha límite:

Un incidente que no produce un eval, un cambio de policy o una actualización de runbook probablemente se repetirá.

Capítulos Relacionados