dara-dataset-expert

mpone1909/dara-knowledge

Warehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein.

0 stars
0 forks
Python
126 views

SKILL.md


name: dara-dataset-expert version: 7.1.0 description: "Warehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein."

DaRa Dataset Expert Skill - v7.1

Zweck

Praezise, quellengebundene Analyse des DaRa-Datensatzes fuer manuelle Warehouse-Prozesse mit harter Trennung zwischen:

  • contracts/: Governance, MRP, PAC, Routing, Artefaktvertraege
  • knowledge/: fachliche Quelle der Wahrheit
  • scripts/: kanonische Ausfuehrungslogik
  • templates/: Berichtsvorlagen fuer Phase 5
  • schemas/: formale Artefakt- und Protokollschemas
  • compat/: Aliaslayer fuer alte Pfade

Oberste Regeln

  1. Nutze fuer Ausfuehrung ausschliesslich scripts/, nicht Markdown-Code aus knowledge/processes/*.md.
  2. Nutze knowledge/ als fachliche Quelle der Wahrheit, wenn Code und Text konfligieren.
  3. Arbeite in P0-P5 und P2b immer fuer genau einen vom Nutzer genannten subject_id.
  4. Vergleiche ueber mehrere Probanden erfolgen erst nach P5 oder in expliziten Vergleichsartefakten.
  5. Lade in P5 genau ein Report-Template, ausser der Nutzer fordert explizit kombinierte Ausgaben.
  6. Gib keine framebasierten Vollartefakte an das LLM weiter. Nutze Protokolle, Pfade, Hashes und Summaries.

MRP - Mandatory Read Protocol

Lies in dieser Reihenfolge:

  1. contracts/reading_protocol.md
  2. contracts/routing_matrix.md
  3. contracts/artifact_contracts.md
  4. contracts/response_protocol.md

Danach:

  • fuer Fachfragen: passende Datei aus knowledge/
  • fuer Ausfuehrung: passendes Skript aus scripts/
  • fuer Berichte: knowledge/processes/phase5_report.md plus genau ein Template

Eine Datei gilt nur als vollstaendig gelesen, wenn sie bis zum Dateiende eingelesen wurde und vorhandene VERIFICATION_TOKENs extrahiert wurden.

Phasenlogik

  • P0: Annotation Bundle und Protokollbildung aus den 12 Roh-CSV-Dateien mit normalized.duckdb und frame_records.parquet als kanonischer Basis
  • P1: Szenarioerkennung, erzeugt p1_scenario_trace und p1_phase_protocol
  • P2: REFA-/DaRa-Zeitanalyse, erzeugt p2_refa_analysis und p2_phase_protocol
  • P2b: REFA-Ablaufanalyse (v0.3.0), erzeugt p2b_refa_ablaufanalyse und p2b_phase_protocol
  • P3: MTM bleibt contract-only und wissensbasiert
  • P4: Process-Validierung, erzeugt Validierungsartefakt und p4_phase_protocol
  • P5: Berichtserstellung, nutzt Protokolle zuerst und Templates genau einmal

Kanonische Pfade

Prozesse

  • knowledge/processes/phase1_scenario_recognition.md
  • knowledge/processes/phase2_refa_analysis.md
  • knowledge/processes/phase2b_refa_ablaufanalyse.md
  • knowledge/processes/phase3_mtm_analysis.md
  • knowledge/processes/phase4_bpmn_validation.md
  • knowledge/processes/phase5_report.md
  • knowledge/processes/reference_bpmn_flows.md

Kernwissen

  • knowledge/core/reference_labels.md
  • knowledge/core/reference_activation_rules.md
  • knowledge/core/reference_validation_rules.md
  • knowledge/core/reference_dataset.md
  • knowledge/core/reference_warehouse.md
  • knowledge/core/reference_articles.md

Methoden

  • knowledge/methods/reference_chunking.md
  • knowledge/methods/refa_phase2_manual_order_picking.md

Templates

  • templates/scenario_report.md
  • templates/phase2_refa_einzelreport.md
  • templates/process_report.md
  • templates/session_comparison_report.md

Skripte

  • scripts/common/annotation_bundle.py
  • scripts/phase1/scenario_recognition.py
  • scripts/phase2/refa_analysis.py
  • scripts/phase2b/refa_ablaufanalyse.py
  • scripts/phase4/process_validation.py
  • scripts/phase5/render_subject_report.py
  • scripts/session/render_multi_session_comparison.py

Schemas

  • schemas/p0_frame_records.schema.json
  • schemas/p0_phase_protocol.schema.json
  • schemas/p1_scenario_trace.schema.json
  • schemas/p1_phase_protocol.schema.json
  • schemas/p2_phase_protocol.schema.json
  • schemas/p2_refa_analysis.schema.json
  • schemas/p2b_refa_ablaufanalyse.schema.json
  • schemas/p2b_phase_protocol.schema.json
  • schemas/p3_phase_protocol.schema.json
  • schemas/p4_phase_protocol.schema.json
  • schemas/p5_report_meta.schema.json

Protokoll-First Regel

Fuer Folgephasen, Review und LLM-Handover gelten:

  • benutze phase_protocol-Artefakte zuerst
  • nutze Maschinenartefakte nur fuer deterministische Berechnung oder tiefe Detaildarstellung
  • uebergib niemals framebasierte Vollartefakte inline
  • nutze in Folgephasen primaer normalized.duckdb oder frame_records.parquet, nicht grosses P0-JSON

Template-Regel

P2 und P2b bleiben template-frei. Eine Anfrage nach probandenweisem Zeitaufnahme-/REFA-Bericht ist eine P5-Berichtsanfrage mit templates/phase2_refa_einzelreport.md.

Sessionuebergreifende oder mehrprobandige Sammelreports laufen post-run ueber scripts/session/render_multi_session_comparison.py und greifen auf bereits vorliegende Session-Summaries/Protokolle zu.

Governance-Erweiterungen

  • PAC bleibt vor jeder Fachantwort Pflicht.
  • VERIFICATION_TOKENs werden aus geladenen Referenzen dokumentiert.
  • comparison_core wird pro Phase budgetiert und spaeter fuer Mehr-Probanden-Vergleiche verwendet.
  • metadata.duckdb ist die kanonische lokale Metadatenbasis fuer artifact_registry, comparison_cores und eval_runs.
  • MongoDB ist optionale Zusatzintegration, aber kein Release-Gate und nicht primaerer Frame- oder Rohdatenspeicher.

Antwortformat

  • Deklariere geladene kanonische Dateien.
  • Belege Aussagen mit Datei und Abschnitt.
  • Stoppe, wenn Information oder Eingabe fehlt.
  • Fuehre Berechnungen nur mit dokumentierten Inputs und Skripten aus.