Estrategia de Pruebas
Asegura que tu skill funcione de manera confiable con un enfoque sistematico de pruebas.
La Matriz de Pruebas
Prueba tu skill en tres dimensiones:
1. Operacion Normal
Funciona la skill para casos de uso tipicos?
Escenarios de prueba:
- Solicitudes estandar dentro del alcance
- Variaciones comunes de solicitudes
- Multiples solicitudes relacionadas en secuencia
Ejemplo para una skill de "React Guidelines":
"Create a button component"
"Add click handler with loading state"
"Make it accessible"
2. Casos Limite
Maneja la skill solicitudes inusuales pero validas?
Escenarios de prueba:
- Condiciones de limite
- Combinaciones inusuales
- Entradas minimas y maximas
Ejemplo:
"Create an empty component"
"Create a component with 20 props"
"Nested components 5 levels deep"
3. Fuera del Alcance
Difiere o rechaza correctamente la skill?
Escenarios de prueba:
- Solicitudes claramente fuera del dominio de la skill
- Solicitudes que parecen relacionadas pero no estan cubiertas
- Solicitudes que podrian entrar en conflicto con la skill
Ejemplo para una skill de "React Guidelines":
"How do I set up a database?"
"Write a Python script"
"Should I use Vue instead?"
Lista de Verificacion de Pruebas
Antes del Lanzamiento
- [ ] Probadas todas las directrices documentadas
- [ ] Verificado que los ejemplos producen la salida esperada
- [ ] Comprobado que los casos limite no causan errores
- [ ] Confirmado que el manejo fuera del alcance es apropiado
- [ ] Probado en todas las plataformas soportadas
Despues del Lanzamiento
- [ ] Monitorear comentarios de usuarios
- [ ] Probar con escenarios del mundo real
- [ ] Verificar conflictos con skills populares
- [ ] Verificar que las actualizaciones no rompan el comportamiento existente
Pruebas Especificas por Plataforma
Claude Code
bash
# Install the skill
claude skill add your-username/skill-name
# Test in a project
claude "Your test prompt here"
# Verify behavior
# Check that responses follow your guidelines
Codex CLI
bash
# Add the skill
codex config add-skill your-username/skill-name
# Test
codex "Your test prompt here"
ChatGPT
- Agrega el contenido de la skill a Custom Instructions
- Inicia una nueva conversacion
- Prueba prompts y verifica las respuestas
Pruebas Automatizadas
Para pruebas exhaustivas, crea una suite de pruebas:
typescript
// skill-tests.ts
interface TestCase {
prompt: string;
expectedBehavior: string[];
shouldNotContain?: string[];
}
const testCases: TestCase[] = [
{
prompt: "Create a React button component",
expectedBehavior: [
"Uses functional component",
"Includes TypeScript types",
"Has accessibility attributes",
],
shouldNotContain: [
"class component",
"any type",
],
},
// Add more test cases...
];
Pruebas de Regresion
Al actualizar tu skill:
- Documenta el comportamiento actual - Guarda ejemplos de la salida actual
- Haz cambios - Actualiza la skill
- Compara salidas - Busca cambios inesperados
- Verifica mejoras - Confirma que los cambios intencionados funcionan
Pruebas de Usuario
Antes del lanzamiento amplio:
- Pruebas alpha - Prueba con 2-3 usuarios de confianza
- Recopila comentarios - Que funciona? Que es confuso?
- Itera - Haz mejoras
- Pruebas beta - Prueba con un grupo mas grande
- Lanzamiento - Publica en el marketplace
Depuracion de Problemas Comunes
La Skill No Se Activa
Verifica:
- Esta la skill instalada correctamente?
- Es el prompt relevante para el dominio de la skill?
- Hay skills conflictivas con mayor prioridad?
Comportamiento Inconsistente
Verifica:
- Son las directrices suficientemente especificas?
- Hay reglas contradictorias?
- Es la skill demasiado amplia?
Salidas Inesperadas
Verifica:
- Son claros los ejemplos?
- Es precisa la seccion de contexto?
- Hay casos limite no cubiertos?
Proximos Pasos
- Escribir Descripciones - Mejora la descubribilidad
- Crear Skills - Comienza a construir