docs: update .docs summaries for all 11 workspace crates

Alex · claude · Alex · commit c3e0263fa75b · 2026-02-22T10:14:23.000Z
Add comprehensive summary (summary.md) and individual per-crate summaries
for previously missing crates (thesaurus, medical-learning, medical-roles).
Update existing crate summaries with current architecture details.

Co-Authored-By: Claude Opus 4.6 &lt;noreply@anthropic.com&gt;
diff --git a/.docs/summary-crates-terraphim-medical-learning.md b/.docs/summary-crates-terraphim-medical-learning.md
@@ -0,0 +1,23 @@
+# terraphim-medical-learning - Case-Based Learning
+
+## Purpose
+Anonymized case-based learning for medical pattern recognition with clinician validation requirements.
+
+## Key Types
+- **MedicalCase**: Anonymized clinical case
+- **PatientProfile**: De-identified patient characteristics
+- **MedicalCaseLearner**: Learning engine
+- **LearnedPattern**: Recognized patterns
+- **AuditEntry/AuditAction**: Audit trail (Learn, Query, Validate)
+- **TreatmentOutcome**: Clinical outcomes
+- **AgeRange**: Age buckets for anonymization
+
+## Safety Requirements
+- NO PHI storage (anonymized profiles only)
+- Require clinician validation before learning
+- Audit trail for all patterns
+- Pattern recognition accuracy >85%
+- Learning inference latency <10ms
+
+## Integration
+Used by terraphim-medical-agents for case-based recommendations.
diff --git a/.docs/summary-crates-terraphim-medical-roles.md b/.docs/summary-crates-terraphim-medical-roles.md
@@ -0,0 +1,17 @@
+# terraphim-medical-roles - Specialist Role Abstractions
+
+## Purpose
+Defines specialist role abstractions and confidence thresholds for domain-specific medical agents.
+
+## Key Types
+- **SpecialistRole** trait: role_name, role_code, confidence_thresholds, can_handle_condition, priority_for_condition
+- **SpecialistRoleType**: Oncologist, Cardiologist, Pharmacogenomics, Neurologist, etc.
+- **ConfidenceThresholds**: min_for_treatment (0.75), min_for_trial (0.90), min_for_urgent (0.85), min_for_diagnosis (0.80)
+- **RoleConfig**: Complete role configuration
+- **RoleRegistry**: Central registry for managing and querying roles
+
+## Public API
+- `create_default_registry()` - Registry with all built-in roles
+
+## Integration
+Used by terraphim-medical-agents to determine which agent handles a given clinical task based on role priorities and confidence thresholds.
diff --git a/.docs/summary-crates-terraphim-thesaurus.md b/.docs/summary-crates-terraphim-thesaurus.md
@@ -0,0 +1,16 @@
+# terraphim-thesaurus - Domain-Specific Medical Thesaurus
+
+## Purpose
+Provides role-specific UMLS terminology slices for specialist roles (Oncologist, Cardiologist, Pharmacogenomics, Neurologist, General Practitioner).
+
+## Key Types
+- **RoleThesaurus**: Thesaurus for a specific role
+- **SpecialistRole**: Role definition enum
+- **UmlsSlice**: Terminology slice for a role
+- **SynonymLookup**: Lookup trait
+
+## Public API
+- `oncologist_data()`, `cardiologist_data()`, `pgx_data()`, `neurologist_data()`, `general_data()`, `additional_roles_data()` -- Embedded UMLS JSON slices
+
+## Integration
+Used by terraphim-medical-agents and terraphim-medical-roles for role-specific terminology. Fast lookup with ahash.
diff --git a/.docs/summary.md b/.docs/summary.md
@@ -0,0 +1,162 @@
+# Terraphim MedGemma Competition - Comprehensive Project Summary
+
+**Last Updated**: 2026-02-22
+
+## Project Overview
+
+Terraphim MedGemma Competition is a Rust workspace implementing a **personalized medicine clinical decision support system** for the Google MedGemma Impact Challenge. It combines medical knowledge graphs (SNOMED CT, UMLS, PrimeKG), pharmacogenomic safety validation (CPIC), and Google's MedGemma foundation models through an Erlang/OTP-inspired multi-agent architecture.
+
+## Workspace Structure (11 crates)
+
+```
+Cargo.toml (workspace root, edition 2021, MIT license)
+crates/
+  medgemma-client/          # MedGemma model inference (multi-backend)
+  terraphim-automata/       # Entity extraction (Aho-Corasick, <50us)
+  terraphim-kg/             # Knowledge graph (SNOMED CT + PrimeKG)
+  terraphim-pgx/            # Pharmacogenomics (CPIC guidelines)
+  terraphim-medical-agents/ # Multi-agent orchestration (OTP patterns)
+  terraphim-api/            # REST API (Axum)
+  terraphim-demo/           # Full clinical workflow demo
+  terraphim-evaluation/     # Evaluation harness (10-case smoke suite)
+  terraphim-thesaurus/      # Role-specific UMLS terminology
+  terraphim-medical-learning/ # Case-based learning (anonymized)
+  terraphim-medical-roles/  # Specialist role abstractions
+```
+
+## Architecture
+
+### End-to-End Pipeline
+
+```
+Clinical Text Input
+    |
+    v
+[Entity Extraction] -- terraphim-automata (Aho-Corasick, 48.9M UMLS terms)
+    |
+    v
+[Knowledge Graph Grounding] -- terraphim-kg (SNOMED CT + PrimeKG)
+    |                    \
+    |                     [PGx Safety Check] -- terraphim-pgx (CPIC)
+    v
+[MedGemma Inference] -- medgemma-client (local GGUF / HF / mock)
+    |
+    v
+[Safety Validation] -- SafetyValidationAgent (hard-gate)
+    |
+    v
+Treatment Recommendation Output
+```
+
+### Multi-Agent System (terraphim-medical-agents)
+
+Erlang/OTP-inspired architecture with:
+- **6 Specialized Agents**: ClinicalReasoning, Imaging, Pharmacogenomics, KnowledgeGraph, TreatmentPlanning, SafetyValidation
+- **Messaging**: Mailboxes with at-least-once/at-most-once/exactly-once delivery
+- **Supervision**: OneForOne, OneForAll, RestForOne restart strategies
+- **Task Orchestration**: Topological sort for dependency-aware parallel execution
+- **Two-Layer Validation**: Coherence (graph connectivity) + Completeness (category coverage)
+
+### Clinical Pipeline Phases
+1. **Extraction**: Entity extraction from clinical text
+2. **Parallel Analysis**: KG grounding + Imaging + PGx (concurrent)
+3. **Synthesis**: Treatment plan generation
+4. **Validation**: Safety gate (hard-block authority)
+
+## Key Performance Characteristics
+
+| Component | Metric | Target | Achieved |
+|-----------|--------|--------|----------|
+| Entity Extraction | Latency | <2ms | <50us (40x better) |
+| Knowledge Graph | Ancestor query | <10ms | <1us (O(1) cache) |
+| KG Artifact Load | Startup | <500ms | <100ms |
+| UMLS Artifact Load | Startup | <1s | <100ms |
+| MedGemma (GPU) | Inference | <30s | 5-10s |
+| MedGemma (CPU Q4) | Inference | <60s | 30-60s |
+
+## Data Sources
+
+| Source | Size | Format | Purpose |
+|--------|------|--------|---------|
+| UMLS | 48.9M terms, 4.2M CUIs | TSV | Entity extraction |
+| SNOMED CT | 1.5M concepts, 4.5M descriptions | RF2 | Medical hierarchy |
+| PrimeKG | 100K+ nodes, 4M+ edges | CSV | Drug-disease relationships |
+| CPIC | Guidelines per gene-drug pair | JSON | Pharmacogenomic safety |
+| MedGemma GGUF | 2.3GB (Q4_K_M) | GGUF | LLM inference |
+
+## Crate Dependency Graph
+
+```
+terraphim-api (HTTP REST)
+  +-- terraphim-medical-agents (orchestration)
+  |     +-- medgemma-client (LLM inference)
+  |     +-- terraphim-pgx (PGx safety)
+  |     +-- terraphim-kg (knowledge graph)
+  |     +-- terraphim-automata (entity extraction)
+  |     +-- terraphim-medical-learning (case learning)
+  |     +-- terraphim-thesaurus (role terminology)
+  |     +-- terraphim-medical-roles (role abstractions)
+  +-- terraphim-automata
+  +-- terraphim-pgx
+
+terraphim-demo (full workflow demo)
+  +-- (all of the above + HTTP proxy)
+
+terraphim-evaluation (testing harness)
+  +-- generic gate interface
+```
+
+## Individual Crate Summaries
+
+- [medgemma-client](summary-crates-medgemma-client.md) - Multi-backend MedGemma inference
+- [terraphim-automata](summary-crates-terraphim-automata.md) - Aho-Corasick entity extraction
+- [terraphim-kg](summary-crates-terraphim-kg.md) - SNOMED CT + PrimeKG knowledge graph
+- [terraphim-medical-agents](summary-crates-terraphim-medical-agents.md) - OTP-style multi-agent system
+- [terraphim-pgx](summary-crates-terraphim-pgx.md) - CPIC pharmacogenomics validator
+- [terraphim-api](summary-crates-terraphim-api.md) - Axum REST API
+- [terraphim-demo](summary-crates-terraphim-demo.md) - Clinical workflow demo
+- [terraphim-evaluation](summary-crates-terraphim-evaluation.md) - Evaluation harness
+- [terraphim-thesaurus](summary-crates-terraphim-thesaurus.md) - Role-specific UMLS terminology
+- [terraphim-medical-learning](summary-crates-terraphim-medical-learning.md) - Case-based learning
+- [terraphim-medical-roles](summary-crates-terraphim-medical-roles.md) - Specialist role abstractions
+
+## Key Architectural Patterns
+
+1. **Artifact-Based Loading**: One-time build of binary artifacts (bincode + zstd) for instant production startup
+2. **Sharded Aho-Corasick**: Overcomes 2M pattern limit by distributing across 59 automaton shards
+3. **OTP Supervision**: Erlang-style process management with restart strategies and intensity limits
+4. **Circuit Breaker Fallback**: Multiple inference backends with health-based routing
+5. **Two-Layer Validation**: Coherence + completeness ensures quality clinical responses
+6. **Safety Hard-Gate**: SafetyValidationAgent as non-bypassable final authority
+7. **Role-Based Confidence**: Different confidence thresholds per medical specialty
+
+## Technology Stack
+
+- **Language**: Rust (edition 2021)
+- **Async Runtime**: Tokio
+- **Web Framework**: Axum 0.7
+- **Graph Library**: petgraph
+- **Pattern Matching**: daachorse (double-array Aho-Corasick)
+- **Serialization**: serde + bincode + zstd
+- **HTTP Client**: reqwest with rustls-tls
+- **LLM Inference**: Python subprocess (transformers) + llama-cpp-2 (planned)
+- **Python Bindings**: PyO3/maturin
+- **Testing**: criterion (benchmarks), built-in test framework
+
+## Documentation Structure
+
+```
+.docs/
+  summary.md                    # This file
+  summary-crates-*.md           # Per-crate summaries
+  define/                       # Business scenarios, domain model
+  design/                       # Architecture, TDRs, implementation plans
+  develop/                      # Code architecture, roadmap, test plan
+  discovery/                    # Personas, risk scan, Wardley map, SOTA
+  research/                     # Competitive landscape, model evaluation
+  validation/                   # Phase 5 validation reports
+  verification/                 # Phase 4 verification reports
+docs/
+  ARCHITECTURE.md               # Mermaid diagrams and API reference
+  submission/technical-writeup.md
+```