dara-dataset-expert
mpone1909/dara-knowledgeWarehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein.
SKILL.md
name: dara-dataset-expert version: 7.1.0 description: "Warehouse-Prozess-Analyse mit 207 Labels, 47 Prozessen, 8 Szenarien, 13 Triggern. v7.1 fuehrt P0 als formale Phase, phase_protocol-Artefakte, scenario_trace, Hybrid Governance und kompakte Handover-Regeln ein."
DaRa Dataset Expert Skill - v7.1
Zweck
Praezise, quellengebundene Analyse des DaRa-Datensatzes fuer manuelle Warehouse-Prozesse mit harter Trennung zwischen:
contracts/: Governance, MRP, PAC, Routing, Artefaktvertraegeknowledge/: fachliche Quelle der Wahrheitscripts/: kanonische Ausfuehrungslogiktemplates/: Berichtsvorlagen fuer Phase 5schemas/: formale Artefakt- und Protokollschemascompat/: Aliaslayer fuer alte Pfade
Oberste Regeln
- Nutze fuer Ausfuehrung ausschliesslich
scripts/, nicht Markdown-Code ausknowledge/processes/*.md. - Nutze
knowledge/als fachliche Quelle der Wahrheit, wenn Code und Text konfligieren. - Arbeite in
P0-P5undP2bimmer fuer genau einen vom Nutzer genanntensubject_id. - Vergleiche ueber mehrere Probanden erfolgen erst nach P5 oder in expliziten Vergleichsartefakten.
- Lade in P5 genau ein Report-Template, ausser der Nutzer fordert explizit kombinierte Ausgaben.
- Gib keine framebasierten Vollartefakte an das LLM weiter. Nutze Protokolle, Pfade, Hashes und Summaries.
MRP - Mandatory Read Protocol
Lies in dieser Reihenfolge:
contracts/reading_protocol.mdcontracts/routing_matrix.mdcontracts/artifact_contracts.mdcontracts/response_protocol.md
Danach:
- fuer Fachfragen: passende Datei aus
knowledge/ - fuer Ausfuehrung: passendes Skript aus
scripts/ - fuer Berichte:
knowledge/processes/phase5_report.mdplus genau ein Template
Eine Datei gilt nur als vollstaendig gelesen, wenn sie bis zum Dateiende
eingelesen wurde und vorhandene VERIFICATION_TOKENs extrahiert wurden.
Phasenlogik
P0: Annotation Bundle und Protokollbildung aus den 12 Roh-CSV-Dateien mitnormalized.duckdbundframe_records.parquetals kanonischer BasisP1: Szenarioerkennung, erzeugtp1_scenario_traceundp1_phase_protocolP2: REFA-/DaRa-Zeitanalyse, erzeugtp2_refa_analysisundp2_phase_protocolP2b: REFA-Ablaufanalyse (v0.3.0), erzeugtp2b_refa_ablaufanalyseundp2b_phase_protocolP3: MTM bleibtcontract-onlyund wissensbasiertP4: Process-Validierung, erzeugt Validierungsartefakt undp4_phase_protocolP5: Berichtserstellung, nutzt Protokolle zuerst und Templates genau einmal
Kanonische Pfade
Prozesse
knowledge/processes/phase1_scenario_recognition.mdknowledge/processes/phase2_refa_analysis.mdknowledge/processes/phase2b_refa_ablaufanalyse.mdknowledge/processes/phase3_mtm_analysis.mdknowledge/processes/phase4_bpmn_validation.mdknowledge/processes/phase5_report.mdknowledge/processes/reference_bpmn_flows.md
Kernwissen
knowledge/core/reference_labels.mdknowledge/core/reference_activation_rules.mdknowledge/core/reference_validation_rules.mdknowledge/core/reference_dataset.mdknowledge/core/reference_warehouse.mdknowledge/core/reference_articles.md
Methoden
knowledge/methods/reference_chunking.mdknowledge/methods/refa_phase2_manual_order_picking.md
Templates
templates/scenario_report.mdtemplates/phase2_refa_einzelreport.mdtemplates/process_report.mdtemplates/session_comparison_report.md
Skripte
scripts/common/annotation_bundle.pyscripts/phase1/scenario_recognition.pyscripts/phase2/refa_analysis.pyscripts/phase2b/refa_ablaufanalyse.pyscripts/phase4/process_validation.pyscripts/phase5/render_subject_report.pyscripts/session/render_multi_session_comparison.py
Schemas
schemas/p0_frame_records.schema.jsonschemas/p0_phase_protocol.schema.jsonschemas/p1_scenario_trace.schema.jsonschemas/p1_phase_protocol.schema.jsonschemas/p2_phase_protocol.schema.jsonschemas/p2_refa_analysis.schema.jsonschemas/p2b_refa_ablaufanalyse.schema.jsonschemas/p2b_phase_protocol.schema.jsonschemas/p3_phase_protocol.schema.jsonschemas/p4_phase_protocol.schema.jsonschemas/p5_report_meta.schema.json
Protokoll-First Regel
Fuer Folgephasen, Review und LLM-Handover gelten:
- benutze
phase_protocol-Artefakte zuerst - nutze Maschinenartefakte nur fuer deterministische Berechnung oder tiefe Detaildarstellung
- uebergib niemals framebasierte Vollartefakte inline
- nutze in Folgephasen primaer
normalized.duckdboderframe_records.parquet, nicht grosses P0-JSON
Template-Regel
P2 und P2b bleiben template-frei. Eine Anfrage nach probandenweisem
Zeitaufnahme-/REFA-Bericht ist eine P5-Berichtsanfrage mit
templates/phase2_refa_einzelreport.md.
Sessionuebergreifende oder mehrprobandige Sammelreports laufen post-run ueber
scripts/session/render_multi_session_comparison.py und greifen auf bereits
vorliegende Session-Summaries/Protokolle zu.
Governance-Erweiterungen
PACbleibt vor jeder Fachantwort Pflicht.VERIFICATION_TOKENs werden aus geladenen Referenzen dokumentiert.comparison_corewird pro Phase budgetiert und spaeter fuer Mehr-Probanden-Vergleiche verwendet.metadata.duckdbist die kanonische lokale Metadatenbasis fuerartifact_registry,comparison_coresundeval_runs.- MongoDB ist optionale Zusatzintegration, aber kein Release-Gate und nicht primaerer Frame- oder Rohdatenspeicher.
Antwortformat
- Deklariere geladene kanonische Dateien.
- Belege Aussagen mit Datei und Abschnitt.
- Stoppe, wenn Information oder Eingabe fehlt.
- Fuehre Berechnungen nur mit dokumentierten Inputs und Skripten aus.