Teststrategie

Stellen Sie mit einem systematischen Testansatz sicher, dass Ihr Skill zuverlässig funktioniert.

Die Testmatrix

Testen Sie Ihren Skill in drei Dimensionen:

1. Normaler Betrieb

Funktioniert der Skill für typische Anwendungsfälle?

Testszenarien:

Standardanfragen innerhalb des Umfangs
Häufige Variationen von Anfragen
Mehrere verwandte Anfragen nacheinander

Beispiel für einen "React-Richtlinien"-Skill:

"Erstelle eine Button-Komponente"
"Füge einen Click-Handler mit Ladezustand hinzu"
"Mach sie barrierefrei"

2. Grenzfälle

Behandelt der Skill ungewöhnliche, aber gültige Anfragen?

Testszenarien:

Grenzbedingungen
Ungewöhnliche Kombinationen
Minimale und maximale Eingaben

Beispiel:

"Erstelle eine leere Komponente"
"Erstelle eine Komponente mit 20 Props"
"Verschachtelte Komponenten 5 Ebenen tief"

3. Außerhalb des Umfangs

Verweist oder lehnt der Skill korrekt ab?

Testszenarien:

Anfragen, die eindeutig außerhalb des Skill-Bereichs liegen
Anfragen, die verwandt erscheinen, aber nicht abgedeckt sind
Anfragen, die mit dem Skill in Konflikt geraten könnten

Beispiel für einen "React-Richtlinien"-Skill:

"Wie richte ich eine Datenbank ein?"
"Schreib ein Python-Skript"
"Sollte ich stattdessen Vue verwenden?"

Test-Checkliste

Vor der Veröffentlichung

[ ] Alle dokumentierten Richtlinien getestet
[ ] Überprüft, dass Beispiele erwartete Ausgabe erzeugen
[ ] Grenzfälle auf Fehler geprüft
[ ] Bestätigt, dass Behandlung außerhalb des Umfangs angemessen ist
[ ] Auf allen unterstützten Plattformen getestet

Nach der Veröffentlichung

[ ] Benutzerfeedback überwachen
[ ] Mit realen Szenarien testen
[ ] Auf Konflikte mit beliebten Skills prüfen
[ ] Überprüfen, dass Updates bestehendes Verhalten nicht brechen

Plattformspezifische Tests

Claude Code

bash

# Skill installieren
claude skill add your-username/skill-name

# In einem Projekt testen
claude "Ihr Testprompt hier"

# Verhalten überprüfen
# Prüfen, dass Antworten Ihren Richtlinien folgen

Codex CLI

bash

# Skill hinzufügen
codex config add-skill your-username/skill-name

# Testen
codex "Ihr Testprompt hier"

ChatGPT

Skill-Inhalt zu benutzerdefinierten Anweisungen hinzufügen
Neue Konversation starten
Prompts testen und Antworten überprüfen

Automatisiertes Testen

Erstellen Sie für gründliches Testen eine Test-Suite:

typescript

// skill-tests.ts
interface TestCase {
  prompt: string;
  expectedBehavior: string[];
  shouldNotContain?: string[];
}

const testCases: TestCase[] = [
  {
    prompt: "Erstelle eine React-Button-Komponente",
    expectedBehavior: [
      "Verwendet funktionale Komponente",
      "Enthält TypeScript-Typen",
      "Hat Barrierefreiheits-Attribute",
    ],
    shouldNotContain: [
      "Klassenkomponente",
      "any-Typ",
    ],
  },
  // Weitere Testfälle hinzufügen...
];

Regressionstests

Bei der Aktualisierung Ihres Skills:

Aktuelles Verhalten dokumentieren - Beispiele der aktuellen Ausgabe speichern
Änderungen vornehmen - Skill aktualisieren
Ausgaben vergleichen - Auf unerwartete Änderungen prüfen
Verbesserungen überprüfen - Bestätigen, dass beabsichtigte Änderungen funktionieren

Benutzertests

Vor der breiten Veröffentlichung:

Alpha-Tests - Mit 2-3 vertrauenswürdigen Benutzern testen
Feedback sammeln - Was funktioniert? Was ist verwirrend?
Iterieren - Verbesserungen vornehmen
Beta-Tests - Mit einer größeren Gruppe testen
Veröffentlichen - Im Marktplatz publizieren

Häufige Probleme debuggen

Skill wird nicht aktiviert

Prüfen:

Ist der Skill korrekt installiert?
Ist der Prompt relevant für den Skill-Bereich?
Gibt es widersprüchliche Skills mit höherer Priorität?

Inkonsistentes Verhalten

Prüfen:

Sind die Richtlinien spezifisch genug?
Gibt es widersprüchliche Regeln?
Ist der Skill zu breit gefasst?

Unerwartete Ausgaben

Prüfen:

Sind die Beispiele klar?
Ist der Kontextabschnitt genau?
Gibt es nicht abgedeckte Grenzfälle?

Nächste Schritte

Beschreibungen schreiben - Auffindbarkeit verbessern
Skills erstellen - Mit dem Erstellen beginnen