AI agent belleği ve harness katmanlarını gösteren soyut illüstrasyon

AI Agent Harness’ları ve Bellek Altyapısı

AI ajanları artık sadece modelle sınırlı değil. Yazılımı gerçekten çalıştıran katmanlar — harness’lar — giderek ürün haline geliyor. Bellek ise bu tasarımın en zorlaştığı nokta.

Öne Çıkanlar

Çalışma belleği oturum sonunda sıfırlanır, harici bellek ise kalıcıdır.

2026’da üretimde kullanılan belleğin neredeyse tamamı harici sistemlerde yaşıyor.

9 büyük harness’ın bellek yaklaşımları aynı sınırlamaları paylaşıyor: yerel kapsam, anahtar kelime araması ve taşınabilirlik eksikliği.

Harici bellek altyapısı olmadan ajanlar uzun vadeli görevlerde başarısız oluyor.

Bellek Türleri Neden Önemli?

Her AI ajanının üç temel bellek katmanı var. Bunları ayırt etmek kritik.

Çalışma belleği (working memory) sadece bağlam penceresiyle sınırlı. Oturum bittiğinde sıfırlanır ve sıkıştırma sorunuyla karşı karşıya kalır.

Harici bellek (external memory) ağırlıkların dışında kalıcı olarak saklanır. Vektör depoları, grafikler veya dosyalar şeklinde olur. 2026’da üretim belleğinin neredeyse tamamı bu katmanda yaşıyor.

Parametrik bellek (parametric memory) ise ağırlıklarda gradyan inişi ile kodlanır. 2026’da üretimde sıfır dağıtım var.

Bir araştırma makalesi, bağlamsal ajan belleğinin gerçek bellek değil, sadece bir not olduğunu belirtiyor. Geri getirme için Ω(k²) örnek gerekiyor, oysa parametrik güncellemeler O(d) ile yapılabiliyor.

Bellek türleri karşılaştırması infografik

Dokuz Büyük Harness’ın Bellek Yaklaşımları

Farklı harness’lar belleği farklı şekilde ele alıyor. Ortak sorunlar ise aynı.

Anthropic Claude Code

İnsan tarafından yazılan CLAUDE.md dosyası ve otomatik üretilen MEMORY.md (en fazla 200 satır / 25KB) kullanıyor. Dört kategoride düzenleniyor.

Geri getirme için daha küçük bir model dosya manifestinden en fazla 5 dosya seçiyor. Gömme (embedding) kullanılmıyor.

Sınırlama: Dosya adına dayalı seçim, sessiz kırpma ve sadece yerel/repo kapsamlı olması.

Anthropic Managed Agents

Sadece eklenen olay günlüğü ve dosya sistemi belle k montajları (/mnt/memory/, en fazla 8 depo, her biri ~100KB, değişmez sürümler) sunuyor.

Sınırlama: Çalışma alanı ile sınırlı, uzun vadeli kişisel bellek için tasarlanmamış.

OpenAI Codex

~/.codex/memories/ klasöründe markdown dosyaları: memory_summary.md, MEMORY.md, raw_memories.md. İki aşamalı konsolidasyon (6 saatlik boşta kalma eşiği) var.

Sınırlama: 5k token özet sınırı, sadece grep, yerel-only ve EEA/UK/CH’de başlangıçta kullanılamıyor.

GitHub Copilot

Dosya ve satır alıntılarıyla yapılandırılmış bellek nesneleri, otomatik doğrulama ve 28 günlük son kullanma tarihi.

Yayınlanan sonuç: PR birleşme oranı +7 puan (83%→90%), kesinlik +3%, hatırlama +4%.

Sınırlama: Repo ile sınırlı, tercihler ve temelsiz gerçeklerle mücadele ediyor.

OpenClaw

Markdown + SQLite + hibrit geri getirme (70% vektör + 30% BM25).

Sınırlama: Sessiz iç dönüş sıkıştırması modele bağlı ve tutarsız. Mem0 eklentisi güvenilir Auto-Recall/Auto-Capture ekliyor.

Nous Research Hermes Agent

Üç katman: MEMORY.md + USER.md (~1.3k token), beceriler, FTS5 oturum araması.

Sınırlama: Çok küçük kalıcı kapasite (~800 token), sadece anahtar kelime araması.

AWS Bedrock AgentCore

Üç asenkron çıkarıcı (semantik gerçekler, tercihler, anlatı), silme yerine geçersizleştirme.

Puanlar: LoCoMo 70.58, PrefEval 79, PolyBench-QA 83.02.

Sınırlama: AWS kilidi, LoCoMo’da önde gelen bellek sistemlerinin altında.

Windsurf (Cascade)

Motor tarafından üretilen, çalışma alanı kapsamlı yerel dosyalar.

Sınırlama: Geliştirici kontrolü veya projeler arası paylaşım yok.

Cognition Devin

İnsan tarafından düzenlenmiş Bilgi + DeepWiki (30 sayfa).

Sınırlama: Onay sürtünmesi nedeniyle birçok ekip hiçbir şey biriktiremiyor.

Benchmark Sorunları

Mevcut benchmark’lar yetersiz kalıyor.

LoCoMo en kötü ortak benchmark. Basit grep taban çizgisi ~74%, birçok soru bellek gerektirmiyor, düşmanca sorular yüzeysel eşleşmeye izin veriyor.

LongMemEval daha iyi (5 yetenekte 500 soru) ama hala hatırlama odaklı.

MemoryArena ve Anatomy of Agentic Memory, belleğin eylemi yönlendirmesi gerektiğinde doymuş sistemlerin başarısız olduğunu gösteriyor.

Üretim ölçeği: Çoğu benchmark 1.5M token’da duruyor. Gerçek ajanlar 10M+ token’a ulaşıyor. Sadece BEAM bu aralığı hedefliyor.

Açık Araştırma Sorunları

Dış bellekte kararlılık-plastisite ikilemi devam ediyor (ileri aktarım −9.5%).

Seçici unutma çözülmedi.

Güvenlik: %57–71 çapraz kullanıcı kirlenmesi; zehirleme başarısı %6–38.

Tüm Harness’larda Tekrarlanan Desen

Sınırlı/yerel depolama
Çoğunlukla anahtar kelime geri getirme
Harness kapsamlı (taşınabilirlik yok)
Zayıf veya eksik eskitme yönetimi
Kötü izolasyon

Harici Bellek Altyapısının Rolü

Bellek artık altyapı haline geldi. Harness’a özgü çözümler aynı sert sınırlara çarpıyor. Taşınabilir, semantik olarak aranabilir, ajanlar arası harici bellek gerekli.

Mem0 gibi sistemler hibrit mimari (vektör + bilgi grafiği + KV) sunuyor. v3 (Nisan 2026): tek geçişli ADD-only çıkarım, çok sinyalli geri getirme, vektör deposunda varlık bağlantısı.

Performans: ~6.9k token / 1.44s vs ~26k token / 17.12s tam bağlam için.

Tüm listelenen harness’lara ve 21 framework / 20 vektör deposuna eklenti olarak sunuluyor.

Sonuç ve Sonraki Adım

AI ajanlarının uzun vadeli görevlerde başarılı olması için harici bellek altyapısı artık zorunlu. Harness’ların yerel çözümleri yetersiz kalıyor.

Kendi ajanınızı geliştiriyorsanız, harici bellek katmanı eklemeyi deneyin. Mem0 gibi çözümler farklı harness’larla uyumlu çalışıyor.

Sık Sorulan Sorular

AI agent belleği neden harici olmalı?

Çalışma belleği oturum sonunda sıfırlanır. Harici bellek ise kalıcıdır ve ajanların önceki etkileşimleri hatırlamasını sağlar. 2026’da üretim sistemlerinin neredeyse tamamı harici katmanda çalışıyor.

Hangi harness en iyi belleği sunuyor?

Hiçbiri tam çözüm sunmuyor. Hepsi yerel kapsam, anahtar kelime araması ve taşınabilirlik sorunlarıyla karşılaşıyor. Harici altyapı ile desteklenmeleri gerekiyor.

Mem0 diğer harness’larla nasıl entegre oluyor?

Mem0, Claude Code, Codex, Copilot, Hermes Agent ve diğerlerine eklenti olarak kurulabiliyor. 21 framework ve 20 vektör deposuyla uyumlu.

Benchmark’lar neden yetersiz?

LoCoMo gibi testler basit grep ile bile yüksek puan veriyor. Gerçek üretim ölçeğindeki (10M+ token) görevleri test etmiyorlar. Daha iyi benchmark’lar geliştiriliyor.

Türkiye’de AI ajan belleği için ne yapılabilir?

Açık kaynaklı çözümler (Mem0, Zep, LangMem) ile başlayabilirsiniz. Lokal LLM kurulumlarında harici vektör deposu eklemek performansı artırır. Hermes Agent gibi araçlar FTS5 ile hızlı arama sunuyor. Yerel LLM inference hakkında daha fazla bilgi için yerel LLM inference rehberine bakabilirsiniz.

Get Newsletter