Estrategia de Pruebas

Asegura que tu skill funcione de manera confiable con un enfoque sistematico de pruebas.

La Matriz de Pruebas

Prueba tu skill en tres dimensiones:

1. Operacion Normal

Funciona la skill para casos de uso tipicos?

Escenarios de prueba:

  • Solicitudes estandar dentro del alcance
  • Variaciones comunes de solicitudes
  • Multiples solicitudes relacionadas en secuencia

Ejemplo para una skill de "React Guidelines":

"Create a button component" "Add click handler with loading state" "Make it accessible"

2. Casos Limite

Maneja la skill solicitudes inusuales pero validas?

Escenarios de prueba:

  • Condiciones de limite
  • Combinaciones inusuales
  • Entradas minimas y maximas

Ejemplo:

"Create an empty component" "Create a component with 20 props" "Nested components 5 levels deep"

3. Fuera del Alcance

Difiere o rechaza correctamente la skill?

Escenarios de prueba:

  • Solicitudes claramente fuera del dominio de la skill
  • Solicitudes que parecen relacionadas pero no estan cubiertas
  • Solicitudes que podrian entrar en conflicto con la skill

Ejemplo para una skill de "React Guidelines":

"How do I set up a database?" "Write a Python script" "Should I use Vue instead?"

Lista de Verificacion de Pruebas

Antes del Lanzamiento

  • [ ] Probadas todas las directrices documentadas
  • [ ] Verificado que los ejemplos producen la salida esperada
  • [ ] Comprobado que los casos limite no causan errores
  • [ ] Confirmado que el manejo fuera del alcance es apropiado
  • [ ] Probado en todas las plataformas soportadas

Despues del Lanzamiento

  • [ ] Monitorear comentarios de usuarios
  • [ ] Probar con escenarios del mundo real
  • [ ] Verificar conflictos con skills populares
  • [ ] Verificar que las actualizaciones no rompan el comportamiento existente

Pruebas Especificas por Plataforma

Claude Code

bash
# Install the skill
claude skill add your-username/skill-name

# Test in a project
claude "Your test prompt here"

# Verify behavior
# Check that responses follow your guidelines

Codex CLI

bash
# Add the skill
codex config add-skill your-username/skill-name

# Test
codex "Your test prompt here"

ChatGPT

  1. Agrega el contenido de la skill a Custom Instructions
  2. Inicia una nueva conversacion
  3. Prueba prompts y verifica las respuestas

Pruebas Automatizadas

Para pruebas exhaustivas, crea una suite de pruebas:

typescript
// skill-tests.ts
interface TestCase {
  prompt: string;
  expectedBehavior: string[];
  shouldNotContain?: string[];
}

const testCases: TestCase[] = [
  {
    prompt: "Create a React button component",
    expectedBehavior: [
      "Uses functional component",
      "Includes TypeScript types",
      "Has accessibility attributes",
    ],
    shouldNotContain: [
      "class component",
      "any type",
    ],
  },
  // Add more test cases...
];

Pruebas de Regresion

Al actualizar tu skill:

  1. Documenta el comportamiento actual - Guarda ejemplos de la salida actual
  2. Haz cambios - Actualiza la skill
  3. Compara salidas - Busca cambios inesperados
  4. Verifica mejoras - Confirma que los cambios intencionados funcionan

Pruebas de Usuario

Antes del lanzamiento amplio:

  1. Pruebas alpha - Prueba con 2-3 usuarios de confianza
  2. Recopila comentarios - Que funciona? Que es confuso?
  3. Itera - Haz mejoras
  4. Pruebas beta - Prueba con un grupo mas grande
  5. Lanzamiento - Publica en el marketplace

Depuracion de Problemas Comunes

La Skill No Se Activa

Verifica:

  • Esta la skill instalada correctamente?
  • Es el prompt relevante para el dominio de la skill?
  • Hay skills conflictivas con mayor prioridad?

Comportamiento Inconsistente

Verifica:

  • Son las directrices suficientemente especificas?
  • Hay reglas contradictorias?
  • Es la skill demasiado amplia?

Salidas Inesperadas

Verifica:

  • Son claros los ejemplos?
  • Es precisa la seccion de contexto?
  • Hay casos limite no cubiertos?

Proximos Pasos