Teststrategie

Stellen Sie mit einem systematischen Testansatz sicher, dass Ihr Skill zuverlässig funktioniert.

Die Testmatrix

Testen Sie Ihren Skill in drei Dimensionen:

1. Normaler Betrieb

Funktioniert der Skill für typische Anwendungsfälle?

Testszenarien:

  • Standardanfragen innerhalb des Umfangs
  • Häufige Variationen von Anfragen
  • Mehrere verwandte Anfragen nacheinander

Beispiel für einen "React-Richtlinien"-Skill:

"Erstelle eine Button-Komponente" "Füge einen Click-Handler mit Ladezustand hinzu" "Mach sie barrierefrei"

2. Grenzfälle

Behandelt der Skill ungewöhnliche, aber gültige Anfragen?

Testszenarien:

  • Grenzbedingungen
  • Ungewöhnliche Kombinationen
  • Minimale und maximale Eingaben

Beispiel:

"Erstelle eine leere Komponente" "Erstelle eine Komponente mit 20 Props" "Verschachtelte Komponenten 5 Ebenen tief"

3. Außerhalb des Umfangs

Verweist oder lehnt der Skill korrekt ab?

Testszenarien:

  • Anfragen, die eindeutig außerhalb des Skill-Bereichs liegen
  • Anfragen, die verwandt erscheinen, aber nicht abgedeckt sind
  • Anfragen, die mit dem Skill in Konflikt geraten könnten

Beispiel für einen "React-Richtlinien"-Skill:

"Wie richte ich eine Datenbank ein?" "Schreib ein Python-Skript" "Sollte ich stattdessen Vue verwenden?"

Test-Checkliste

Vor der Veröffentlichung

  • [ ] Alle dokumentierten Richtlinien getestet
  • [ ] Überprüft, dass Beispiele erwartete Ausgabe erzeugen
  • [ ] Grenzfälle auf Fehler geprüft
  • [ ] Bestätigt, dass Behandlung außerhalb des Umfangs angemessen ist
  • [ ] Auf allen unterstützten Plattformen getestet

Nach der Veröffentlichung

  • [ ] Benutzerfeedback überwachen
  • [ ] Mit realen Szenarien testen
  • [ ] Auf Konflikte mit beliebten Skills prüfen
  • [ ] Überprüfen, dass Updates bestehendes Verhalten nicht brechen

Plattformspezifische Tests

Claude Code

bash
# Skill installieren
claude skill add your-username/skill-name

# In einem Projekt testen
claude "Ihr Testprompt hier"

# Verhalten überprüfen
# Prüfen, dass Antworten Ihren Richtlinien folgen

Codex CLI

bash
# Skill hinzufügen
codex config add-skill your-username/skill-name

# Testen
codex "Ihr Testprompt hier"

ChatGPT

  1. Skill-Inhalt zu benutzerdefinierten Anweisungen hinzufügen
  2. Neue Konversation starten
  3. Prompts testen und Antworten überprüfen

Automatisiertes Testen

Erstellen Sie für gründliches Testen eine Test-Suite:

typescript
// skill-tests.ts
interface TestCase {
  prompt: string;
  expectedBehavior: string[];
  shouldNotContain?: string[];
}

const testCases: TestCase[] = [
  {
    prompt: "Erstelle eine React-Button-Komponente",
    expectedBehavior: [
      "Verwendet funktionale Komponente",
      "Enthält TypeScript-Typen",
      "Hat Barrierefreiheits-Attribute",
    ],
    shouldNotContain: [
      "Klassenkomponente",
      "any-Typ",
    ],
  },
  // Weitere Testfälle hinzufügen...
];

Regressionstests

Bei der Aktualisierung Ihres Skills:

  1. Aktuelles Verhalten dokumentieren - Beispiele der aktuellen Ausgabe speichern
  2. Änderungen vornehmen - Skill aktualisieren
  3. Ausgaben vergleichen - Auf unerwartete Änderungen prüfen
  4. Verbesserungen überprüfen - Bestätigen, dass beabsichtigte Änderungen funktionieren

Benutzertests

Vor der breiten Veröffentlichung:

  1. Alpha-Tests - Mit 2-3 vertrauenswürdigen Benutzern testen
  2. Feedback sammeln - Was funktioniert? Was ist verwirrend?
  3. Iterieren - Verbesserungen vornehmen
  4. Beta-Tests - Mit einer größeren Gruppe testen
  5. Veröffentlichen - Im Marktplatz publizieren

Häufige Probleme debuggen

Skill wird nicht aktiviert

Prüfen:

  • Ist der Skill korrekt installiert?
  • Ist der Prompt relevant für den Skill-Bereich?
  • Gibt es widersprüchliche Skills mit höherer Priorität?

Inkonsistentes Verhalten

Prüfen:

  • Sind die Richtlinien spezifisch genug?
  • Gibt es widersprüchliche Regeln?
  • Ist der Skill zu breit gefasst?

Unerwartete Ausgaben

Prüfen:

  • Sind die Beispiele klar?
  • Ist der Kontextabschnitt genau?
  • Gibt es nicht abgedeckte Grenzfälle?

Nächste Schritte