Teststrategie
Stellen Sie mit einem systematischen Testansatz sicher, dass Ihr Skill zuverlässig funktioniert.
Die Testmatrix
Testen Sie Ihren Skill in drei Dimensionen:
1. Normaler Betrieb
Funktioniert der Skill für typische Anwendungsfälle?
Testszenarien:
- Standardanfragen innerhalb des Umfangs
- Häufige Variationen von Anfragen
- Mehrere verwandte Anfragen nacheinander
Beispiel für einen "React-Richtlinien"-Skill:
"Erstelle eine Button-Komponente"
"Füge einen Click-Handler mit Ladezustand hinzu"
"Mach sie barrierefrei"
2. Grenzfälle
Behandelt der Skill ungewöhnliche, aber gültige Anfragen?
Testszenarien:
- Grenzbedingungen
- Ungewöhnliche Kombinationen
- Minimale und maximale Eingaben
Beispiel:
"Erstelle eine leere Komponente"
"Erstelle eine Komponente mit 20 Props"
"Verschachtelte Komponenten 5 Ebenen tief"
3. Außerhalb des Umfangs
Verweist oder lehnt der Skill korrekt ab?
Testszenarien:
- Anfragen, die eindeutig außerhalb des Skill-Bereichs liegen
- Anfragen, die verwandt erscheinen, aber nicht abgedeckt sind
- Anfragen, die mit dem Skill in Konflikt geraten könnten
Beispiel für einen "React-Richtlinien"-Skill:
"Wie richte ich eine Datenbank ein?"
"Schreib ein Python-Skript"
"Sollte ich stattdessen Vue verwenden?"
Test-Checkliste
Vor der Veröffentlichung
- [ ] Alle dokumentierten Richtlinien getestet
- [ ] Überprüft, dass Beispiele erwartete Ausgabe erzeugen
- [ ] Grenzfälle auf Fehler geprüft
- [ ] Bestätigt, dass Behandlung außerhalb des Umfangs angemessen ist
- [ ] Auf allen unterstützten Plattformen getestet
Nach der Veröffentlichung
- [ ] Benutzerfeedback überwachen
- [ ] Mit realen Szenarien testen
- [ ] Auf Konflikte mit beliebten Skills prüfen
- [ ] Überprüfen, dass Updates bestehendes Verhalten nicht brechen
Plattformspezifische Tests
Claude Code
bash
# Skill installieren
claude skill add your-username/skill-name
# In einem Projekt testen
claude "Ihr Testprompt hier"
# Verhalten überprüfen
# Prüfen, dass Antworten Ihren Richtlinien folgen
Codex CLI
bash
# Skill hinzufügen
codex config add-skill your-username/skill-name
# Testen
codex "Ihr Testprompt hier"
ChatGPT
- Skill-Inhalt zu benutzerdefinierten Anweisungen hinzufügen
- Neue Konversation starten
- Prompts testen und Antworten überprüfen
Automatisiertes Testen
Erstellen Sie für gründliches Testen eine Test-Suite:
typescript
// skill-tests.ts
interface TestCase {
prompt: string;
expectedBehavior: string[];
shouldNotContain?: string[];
}
const testCases: TestCase[] = [
{
prompt: "Erstelle eine React-Button-Komponente",
expectedBehavior: [
"Verwendet funktionale Komponente",
"Enthält TypeScript-Typen",
"Hat Barrierefreiheits-Attribute",
],
shouldNotContain: [
"Klassenkomponente",
"any-Typ",
],
},
// Weitere Testfälle hinzufügen...
];
Regressionstests
Bei der Aktualisierung Ihres Skills:
- Aktuelles Verhalten dokumentieren - Beispiele der aktuellen Ausgabe speichern
- Änderungen vornehmen - Skill aktualisieren
- Ausgaben vergleichen - Auf unerwartete Änderungen prüfen
- Verbesserungen überprüfen - Bestätigen, dass beabsichtigte Änderungen funktionieren
Benutzertests
Vor der breiten Veröffentlichung:
- Alpha-Tests - Mit 2-3 vertrauenswürdigen Benutzern testen
- Feedback sammeln - Was funktioniert? Was ist verwirrend?
- Iterieren - Verbesserungen vornehmen
- Beta-Tests - Mit einer größeren Gruppe testen
- Veröffentlichen - Im Marktplatz publizieren
Häufige Probleme debuggen
Skill wird nicht aktiviert
Prüfen:
- Ist der Skill korrekt installiert?
- Ist der Prompt relevant für den Skill-Bereich?
- Gibt es widersprüchliche Skills mit höherer Priorität?
Inkonsistentes Verhalten
Prüfen:
- Sind die Richtlinien spezifisch genug?
- Gibt es widersprüchliche Regeln?
- Ist der Skill zu breit gefasst?
Unerwartete Ausgaben
Prüfen:
- Sind die Beispiele klar?
- Ist der Kontextabschnitt genau?
- Gibt es nicht abgedeckte Grenzfälle?
Nächste Schritte
- Beschreibungen schreiben - Auffindbarkeit verbessern
- Skills erstellen - Mit dem Erstellen beginnen