The Committed Reference Architecture.
ארכיטקטורת הייחוס של קומיטד.
Engineer-to-engineer page. No marketing fluff. If you're an architect reviewing us, this is the page.
עמוד מהנדס למהנדס. בלי אוויר שיווקי. אם אתם ארכיטקטים שבוחנים אותנו - זה העמוד.
Why this stack
Amazon Bedrock + Claude Sonnet by default. We route to Haiku for latency-sensitive or cost-sensitive paths, and to Mistral / open weights when compliance requires self-hosting.
LangGraph for orchestration. Explicit state machines, tool contracts, and replayable decisions. MCP servers expose internal APIs to Claude Code / Claude.ai.
Kubernetes on EKS. We use ECS for simpler services; EKS for anything that needs autoscaling ML inference under load.
Observability per agent, per model, per latency percentile. CloudWatch for AWS-native, Prometheus + Grafana for cross-provider. Audit Trails are first-class.
ML ops done right. Time-based splits (never random for time series), Bayesian + Grid hyperparameter search, Early Stopping, Cross-Validation, drift monitoring, retraining pipelines.
למה ה־Stack הזה
Amazon Bedrock + Claude Sonnet כברירת מחדל. מנתבים ל־Haiku במסלולים רגישים ל־Latency או לעלות, ול־Mistral / משקלים פתוחים כשציות דורש Self-Hosting.
LangGraph לאורקסטרציה. מכונות מצב מפורשות, חוזי כלי והחלטות ניתנות להפעלה חוזרת. MCP servers חושפים APIs פנימיים ל־Claude Code / Claude.ai.
Kubernetes על EKS. ECS לשירותים פשוטים; EKS לכל דבר שדורש Autoscaling של Inference תחת עומס.
Observability לכל סוכן, לכל מודל, לכל אחוזון Latency. CloudWatch ל־AWS-Native, Prometheus + Grafana Cross-Provider. Audit Trails הם אזרחים ממדרגה ראשונה.
ML ops כמו שצריך. Splits לפי זמן (לעולם לא רנדומלי לסדרות זמן), חיפוש היפר־פרמטרים Bayesian + Grid, Early Stopping, Cross-Validation, ניטור Drift, Pipelines לאימון מחדש.