dara-dataset-expert

mpone1909/dara-knowledge

Warehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein.

0 stars

0 forks

Python

199 views

View on GitHub Add to Favorites

SKILL.md

name: dara-dataset-expert version: 7.1.0 description: "Warehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein."

DaRa Dataset Expert Skill - v7.1

Zweck

Praezise, quellengebundene Analyse des DaRa-Datensatzes fuer manuelle Warehouse-Prozesse mit harter Trennung zwischen:

contracts/: Governance, MRP, PAC, Routing, Artefaktvertraege
knowledge/: fachliche Quelle der Wahrheit
scripts/: kanonische Ausfuehrungslogik
templates/: Berichtsvorlagen fuer Phase 5
schemas/: formale Artefakt- und Protokollschemas
compat/: Aliaslayer fuer alte Pfade

Oberste Regeln

Nutze fuer Ausfuehrung ausschliesslich scripts/, nicht Markdown-Code aus knowledge/processes/*.md.
Nutze knowledge/ als fachliche Quelle der Wahrheit, wenn Code und Text konfligieren.
Arbeite in P0-P5 und P2b immer fuer genau einen vom Nutzer genannten subject_id.
Vergleiche ueber mehrere Probanden erfolgen erst nach P5 oder in expliziten Vergleichsartefakten.
Lade in P5 genau ein Report-Template, ausser der Nutzer fordert explizit kombinierte Ausgaben.
Gib keine framebasierten Vollartefakte an das LLM weiter. Nutze Protokolle, Pfade, Hashes und Summaries.

MRP - Mandatory Read Protocol

Lies in dieser Reihenfolge:

contracts/reading_protocol.md
contracts/routing_matrix.md
contracts/artifact_contracts.md
contracts/response_protocol.md

Danach:

fuer Fachfragen: passende Datei aus knowledge/
fuer Ausfuehrung: passendes Skript aus scripts/
fuer Berichte: knowledge/processes/phase5_report.md plus genau ein Template

Eine Datei gilt nur als vollstaendig gelesen, wenn sie bis zum Dateiende eingelesen wurde und vorhandene VERIFICATION_TOKENs extrahiert wurden.

Phasenlogik

P0: Annotation Bundle und Protokollbildung aus den 12 Roh-CSV-Dateien mit normalized.duckdb und frame_records.parquet als kanonischer Basis
P1: Szenarioerkennung, erzeugt p1_scenario_trace und p1_phase_protocol
P2: REFA-/DaRa-Zeitanalyse, erzeugt p2_refa_analysis und p2_phase_protocol
P2b: REFA-Ablaufanalyse (v0.3.0), erzeugt p2b_refa_ablaufanalyse und p2b_phase_protocol
P3: MTM bleibt contract-only und wissensbasiert
P4: Process-Validierung, erzeugt Validierungsartefakt und p4_phase_protocol
P5: Berichtserstellung, nutzt Protokolle zuerst und Templates genau einmal

Kanonische Pfade

Prozesse

knowledge/processes/phase1_scenario_recognition.md
knowledge/processes/phase2_refa_analysis.md
knowledge/processes/phase2b_refa_ablaufanalyse.md
knowledge/processes/phase3_mtm_analysis.md
knowledge/processes/phase4_bpmn_validation.md
knowledge/processes/phase5_report.md
knowledge/processes/reference_bpmn_flows.md

Kernwissen

knowledge/core/reference_labels.md
knowledge/core/reference_activation_rules.md
knowledge/core/reference_validation_rules.md
knowledge/core/reference_dataset.md
knowledge/core/reference_warehouse.md
knowledge/core/reference_articles.md

Methoden

knowledge/methods/reference_chunking.md
knowledge/methods/refa_phase2_manual_order_picking.md

Templates

templates/scenario_report.md
templates/phase2_refa_einzelreport.md
templates/process_report.md
templates/session_comparison_report.md

Skripte

scripts/common/annotation_bundle.py
scripts/phase1/scenario_recognition.py
scripts/phase2/refa_analysis.py
scripts/phase2b/refa_ablaufanalyse.py
scripts/phase4/process_validation.py
scripts/phase5/render_subject_report.py
scripts/session/render_multi_session_comparison.py

Schemas

schemas/p0_frame_records.schema.json
schemas/p0_phase_protocol.schema.json
schemas/p1_scenario_trace.schema.json
schemas/p1_phase_protocol.schema.json
schemas/p2_phase_protocol.schema.json
schemas/p2_refa_analysis.schema.json
schemas/p2b_refa_ablaufanalyse.schema.json
schemas/p2b_phase_protocol.schema.json
schemas/p3_phase_protocol.schema.json
schemas/p4_phase_protocol.schema.json
schemas/p5_report_meta.schema.json

Protokoll-First Regel

Fuer Folgephasen, Review und LLM-Handover gelten:

benutze phase_protocol-Artefakte zuerst
nutze Maschinenartefakte nur fuer deterministische Berechnung oder tiefe Detaildarstellung
uebergib niemals framebasierte Vollartefakte inline
nutze in Folgephasen primaer normalized.duckdb oder frame_records.parquet, nicht grosses P0-JSON

Template-Regel

P2 und P2b bleiben template-frei. Eine Anfrage nach probandenweisem Zeitaufnahme-/REFA-Bericht ist eine P5-Berichtsanfrage mit templates/phase2_refa_einzelreport.md.

Sessionuebergreifende oder mehrprobandige Sammelreports laufen post-run ueber scripts/session/render_multi_session_comparison.py und greifen auf bereits vorliegende Session-Summaries/Protokolle zu.

Governance-Erweiterungen

PAC bleibt vor jeder Fachantwort Pflicht.
VERIFICATION_TOKENs werden aus geladenen Referenzen dokumentiert.
comparison_core wird pro Phase budgetiert und spaeter fuer Mehr-Probanden-Vergleiche verwendet.
metadata.duckdb ist die kanonische lokale Metadatenbasis fuer artifact_registry, comparison_cores und eval_runs.
MongoDB ist optionale Zusatzintegration, aber kein Release-Gate und nicht primaerer Frame- oder Rohdatenspeicher.

Antwortformat

Deklariere geladene kanonische Dateien.
Belege Aussagen mit Datei und Abschnitt.
Stoppe, wenn Information oder Eingabe fehlt.
Fuehre Berechnungen nur mit dokumentierten Inputs und Skripten aus.

Installation

Option 1: Use slash command in Claude Code

/install-skill https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo

Option 2: Clone to skills directory

# Global (all projects)

git clone https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo ~/.claude/skills/dara-knowledge

# Project-specific

git clone https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo .claude/skills/dara-knowledge

Add MCP server to .cursor/mcp.json:

{
  "mcpServers": {
    "skillz": {
      "command": "npx",
      "args": ["-y", "skillz-mcp", "https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo"]
    }
  }
}

Restart Cursor after adding the configuration.

Option 1: Use Gemini CLI command

gemini extensions install https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo

Option 2: Clone to extensions directory

git clone https://github.com/mpone1909/dara-knowledge/tree/main/dara-skill-github-repo ~/.gemini/extensions/dara-knowledge