Estrategia de Pruebas

Asegura que tu skill funcione de manera confiable con un enfoque sistematico de pruebas.

La Matriz de Pruebas

Prueba tu skill en tres dimensiones:

1. Operacion Normal

Funciona la skill para casos de uso tipicos?

Escenarios de prueba:

Solicitudes estandar dentro del alcance
Variaciones comunes de solicitudes
Multiples solicitudes relacionadas en secuencia

Ejemplo para una skill de "React Guidelines":

"Create a button component"
"Add click handler with loading state"
"Make it accessible"

2. Casos Limite

Maneja la skill solicitudes inusuales pero validas?

Escenarios de prueba:

Condiciones de limite
Combinaciones inusuales
Entradas minimas y maximas

Ejemplo:

"Create an empty component"
"Create a component with 20 props"
"Nested components 5 levels deep"

3. Fuera del Alcance

Difiere o rechaza correctamente la skill?

Escenarios de prueba:

Solicitudes claramente fuera del dominio de la skill
Solicitudes que parecen relacionadas pero no estan cubiertas
Solicitudes que podrian entrar en conflicto con la skill

Ejemplo para una skill de "React Guidelines":

"How do I set up a database?"
"Write a Python script"
"Should I use Vue instead?"

Lista de Verificacion de Pruebas

Antes del Lanzamiento

[ ] Probadas todas las directrices documentadas
[ ] Verificado que los ejemplos producen la salida esperada
[ ] Comprobado que los casos limite no causan errores
[ ] Confirmado que el manejo fuera del alcance es apropiado
[ ] Probado en todas las plataformas soportadas

Despues del Lanzamiento

[ ] Monitorear comentarios de usuarios
[ ] Probar con escenarios del mundo real
[ ] Verificar conflictos con skills populares
[ ] Verificar que las actualizaciones no rompan el comportamiento existente

Pruebas Especificas por Plataforma

Claude Code

bash

# Install the skill
claude skill add your-username/skill-name

# Test in a project
claude "Your test prompt here"

# Verify behavior
# Check that responses follow your guidelines

Codex CLI

bash

# Add the skill
codex config add-skill your-username/skill-name

# Test
codex "Your test prompt here"

ChatGPT

Agrega el contenido de la skill a Custom Instructions
Inicia una nueva conversacion
Prueba prompts y verifica las respuestas

Pruebas Automatizadas

Para pruebas exhaustivas, crea una suite de pruebas:

typescript

// skill-tests.ts
interface TestCase {
  prompt: string;
  expectedBehavior: string[];
  shouldNotContain?: string[];
}

const testCases: TestCase[] = [
  {
    prompt: "Create a React button component",
    expectedBehavior: [
      "Uses functional component",
      "Includes TypeScript types",
      "Has accessibility attributes",
    ],
    shouldNotContain: [
      "class component",
      "any type",
    ],
  },
  // Add more test cases...
];

Pruebas de Regresion

Al actualizar tu skill:

Documenta el comportamiento actual - Guarda ejemplos de la salida actual
Haz cambios - Actualiza la skill
Compara salidas - Busca cambios inesperados
Verifica mejoras - Confirma que los cambios intencionados funcionan

Pruebas de Usuario

Antes del lanzamiento amplio:

Pruebas alpha - Prueba con 2-3 usuarios de confianza
Recopila comentarios - Que funciona? Que es confuso?
Itera - Haz mejoras
Pruebas beta - Prueba con un grupo mas grande
Lanzamiento - Publica en el marketplace

Depuracion de Problemas Comunes

La Skill No Se Activa

Verifica:

Esta la skill instalada correctamente?
Es el prompt relevante para el dominio de la skill?
Hay skills conflictivas con mayor prioridad?

Comportamiento Inconsistente

Verifica:

Son las directrices suficientemente especificas?
Hay reglas contradictorias?
Es la skill demasiado amplia?

Salidas Inesperadas

Verifica:

Son claros los ejemplos?
Es precisa la seccion de contexto?
Hay casos limite no cubiertos?

Proximos Pasos

Escribir Descripciones - Mejora la descubribilidad
Crear Skills - Comienza a construir