2 puan yazan ninebow 4 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

PyTorchKR🔥🇰🇷 🤔💭

Bu hafta seçilen 10 makaleye baktığımızda, büyük dil modeli (LLM) tabanlı ajanlarda durum yönetimi, çıkarım verimliliği ve gerçek ortamlarda güvenlik ile doğrulanabilirlik eksenlerinde hızlı bir yakınsama görüyoruz. Özellikle ajan verimliliğini en üst düzeye çıkaran yapısal değişikliklerden transformer mimarisinin köklü biçimde yeniden tasarlanmasına, ayrıca gerçek dünyanın dinamik ortamlarına uyum sağlayan sağlamlığın güvence altına alınmasına kadar uzanan ilgi çekici araştırma akışları öne çıkıyor.

:one: Ajan iş akışında yenilik: durumun dışsallaştırılması ve çıkarım mantığının içselleştirilmesi (Internalization) Bu haftaki makalelerde, ajanların karmaşık ve uzun görevleri yerine getirirken ortaya çıkan maliyet ve bağlam darboğazlarını çözmek için iki zıt ama birbirini tamamlayan yaklaşım dikkat çekti. Harness-1 ve AdaCoM, ajanın hatırlaması gereken durum veya bağlam yönetimi yükünü dış ortama ya da ayrı bir yönetim modeline aktararak uzun soluklu görevlerde kararlılığı artırdı. Buna karşılık Latent Agents ve ajanik iş akışının içselleştirilmesi (Subterranean Agents) araştırması, dış orkestratörü veya çoklu ajanlar arasındaki karmaşık iletişim sürecini doğrudan tek bir modelin ağırlıkları (Weights) içine derleyen bir sonradan eğitim yöntemi önerdi. Böylece model, prompt’a ya da dış koordinasyona bağlı kalmadan kendi kendine tartışma yürütebilir veya prosedürel çıkarım yapabilir hale geliyor; bu da frontier model düzeyindeki performansı korurken çıkarım maliyetini ve token kullanımını çarpıcı biçimde azaltan bir yön gösteriyor.

:two: Temel mimarinin yeniden tasarlanması: attention mekanizmasının birleşimi ve parametre optimizasyonu Transformer’ın temel hesaplama verimsizliğini aşmayı ve bellek kullanımını azaltmayı hedefleyen temel araştırmalar da güçlü bir eğilim oluşturuyor. SISA(Forget Attention) makalesi, durum uzayı modellerinin (SSM) sıralı önem sinyalini attention skorlarının hesaplanmasına doğrudan enjekte eden bir “skor düzeyi birleşimi” ile küresel arama yeteneğini ve sıralı öncelik değerlendirmesini aynı anda başardı. Ayrıca QKV varyantları araştırması (Do Transformers Need Three Projections?) sorgu, anahtar ve değerin tümünün ayrı tutulduğu mevcut fiili standardı sorgulayarak, anahtar ile değeri paylaşan projeksiyon biçiminin (Q-K=V) performans kaybını en aza indirirken KV cache’i büyük ölçüde azaltabildiğini ampirik olarak gösterdi. Mimari düzeydeki bu yapısal iyileştirmeler, yalnızca performans artışının ötesinde, sınırlı belleğe sahip edge cihazlar veya on-device AI ortamlarında pratik dağıtım olanağını da ciddi biçimde genişletiyor.

:three: Dinamik ortamlarda gerçek zamanlı uyum ve sistem düzeyinde sağlamlığın güvence altına alınması Sadece doğru yanıt üretmenin ötesine geçip değişen durumlara ve tehditlere aktif biçimde karşılık veren ve sistemin kendisini evrimleştiren çalışmalar dikkat çekiyor. MOSS, daha önce prompt değişikliğiyle sınırlı kalan öz-evrimi kaynak kod düzeyinde yeniden yazıma taşıyarak ajan sisteminin yapısal kusurlarını kendi kendine iyileştirmesini sağladı; FuzzingBrain V2 ise çoklu ajanları kullanarak gerçek yazılım açıklarını %100 yeniden üretilebilir biçimde tespit edip düzeltti. Ayrıca AdvGame, dil modellerinin güvenlik hizalamasını saldırgan ve savunmacı arasındaki gerçek zamanlı, işbirliksiz bir oyun olarak ele alarak dinamik savunma kabiliyetini artırdı; Plan, Watch, Recover çalışması ise kullanıcı belirlenen prosedürden saptığında gerçek zamanlı müdahale eden ve koçluk yapan proaktif bir asistan modeli sundu. Bu çalışmalar, yapay zekanın kontrollü laboratuvar ortamlarının dışına çıkıp öngörülemez gerçek dünyadaki hata ve güvenlik tehditleri içinde de güvenilir, proaktif sistemler haline geldiğini gösteriyor.

Makale bazında temel özet

  • Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses: Bellek yükünü politikanın değil harness’in üstlendiği, pekiştirmeli öğrenme tabanlı bir arama ajanı. 8 benchmark üzerinde ortalama 0.730 curated recall elde etti ve özellikle aktarım performansı güçlüydü.

  • Forget Attention: Importance-Aware Attention Is All You Need: Durum uzayı modeli (SSM) önem sinyalini attention skorlarına doğrudan enjekte eden SISA’yı öneriyor. Tek bir SDPA çağrısıyla uygulanabilirken arama performansını ve uzun mesafeli bağımlılıkların geri kazanımını belirgin biçimde iyileştiriyor.

  • Do Transformers Need Three Projections? Systematic Study of QKV Variants: QKV projeksiyonlarının ne ölçüde paylaşılabileceğini sistematik olarak inceleyen bir çalışma. Q-K=V, performansı neredeyse korurken KV cache’i büyük ölçüde küçülttü; GQA/MQA ile birleştirildiğinde bellek tasarrufu daha da arttı.

  • Compiling Agentic Workflows into LLM Weights: Dış orkestrasyon yerine görev prosedürünün doğrudan model ağırlıklarına derlenmesi yaklaşımını ele alıyor. Tekrarlı çağrıları ve uzun bağlam tüketimini azaltırken frontier’e yakın düzeyde kalite sağlıyor.

  • Learning Agent-Compatible Context Management for Long-Horizon Tasks: Sabit bir ajan için dış LLM’in bağlamı dinamik olarak düzenlediği AdaCoM’u öneriyor. Uzun süreli web araması ve araştırma görevlerinde gereksiz geçmiş bilgileri azaltırken görev kısıtlarını koruyor.

  • Latent Agents: A Post-Training Procedure for Internalized Multi-Agent Debate: Çoklu ajan tartışmasını tek bir LLM içine damıtan bir sonradan eğitim yöntemi. Token kullanımını %93’e kadar azaltmasına rağmen açık tartışmayla eşdeğer veya daha iyi performans gösterdi.

  • MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems: Prompt değil, kaynak kod düzeyinde öz-evrim gerçekleştiren bir ajan sistemi. Gerçek hata kanıtlarına dayanarak kod yapısını yeniden yazar ve doğrulamadan sonra geri alınabilir biçimde dağıtır.

  • Safety Alignment of LMs via Non-cooperative Games: Güvenlik hizalamasını, saldırgan LM ile savunmacı LM’nin karşılıklı uyum sağladığı işbirliksiz bir oyun olarak yeniden tanımlıyor. Tercih tabanlı pekiştirmeli öğrenmeyle güvenlik ve kullanışlılık Pareto sınırını aynı anda ileri taşıyor.

  • Plan, Watch, Recover: A Benchmark and Architectures for Proactive Procedural Assistance: Kullanıcı prosedürden çıktığında ne zaman müdahale edilmesi ve nasıl geri döndürülmesi gerektiğini öğrenen proaktif, çok kipli bir yardımcı sistem. EgoProactive ve Pro²Bench üzerinden gerçek geri yönlendirme koçluğu performansını değerlendiriyor.

  • FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction: Çoklu ajanlı LLM ile açık bulma ve yeniden üretimi otomatikleştiren bir güvenlik sistemi. OSS-Fuzz tabanlı doğrulama, hassas açık konumlandırma ve hiyerarşik fuzzing’i birleştirerek yüksek tespit oranı ve gerçek açık keşif başarısı elde etti.


Harness-1: Durum dışsallaştırmalı harness’lere sahip arama ajanları için pekiştirmeli öğrenme / Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

Makale tanıtımı

Arama ajanları çoğu zaman büyüyen bir transcript üzerindeki politika olarak eğitilir; model bir yandan nasıl arama yapacağına karar verirken, diğer yandan ne gördüğünü, hangi kanıtın yararlı olduğunu, hangi kısıtların hâlâ açık olduğunu ve hangi iddiaların gerçekten doğrulandığını hatırlamak zorundadır. Yazarlar, bu kurulumun politika (policy) içine aşırı derecede durum yönetimi yükü bindirdiğini ve pekiştirmeli öğrenmeyi hem anlamlı arama kararlarını hem de ortamın daha kararlı biçimde ele alabileceği geri alınabilir kayıt yönetimini aynı anda optimize etmeye zorladığını düşünüyor.

Bunu çözmek için, durum dışsallaştırmalı bir harness (state-externalizing harness) içinde pekiştirmeli öğrenmeyle eğitilmiş 20B arama ajanı Harness-1’i öneriyorlar. Bu harness; aday havuzu, önem etiketi verilmiş derlenmiş küme, sıkıştırılmış kanıt bağlantıları, doğrulama kayıtları, sıkıştırılmış ve yinelenenlerden arındırılmış gözlemler ve bütçeyi dikkate alan bağlam oluşturma gibi çevresel çalışma belleği görevlerini yönetiyor.

Reklam

Buna karşılık politika; neyin aranacağı, hangi belgelerin tutulup hangilerinin atılacağı, neyin doğrulanacağı ve ne zaman sonlandırılacağı gibi anlamsal kararları üstlenir. Web, finans, patent ve çok adımlı soru-cevap dahil 8 arama kıyaslamasında Harness-1, ortalama 0.730 curated recall elde ederek, ondan sonraki en güçlü açık kaynak arama alt ajanından 11.4 puan daha yüksek performans gösterdi. Özellikle eğitim alanı dışındaki transfer kıyaslamalarında performans artışı belirgindi; bu da açık arama durumu üzerinde pekiştirmeli öğrenmenin daha iyi genellenen arama davranışları üretebileceğini gösteriyor.

Özet(Abstract)

Arama ajanları çoğu zaman giderek büyüyen transcript'ler üzerindeki politikalar olarak eğitilir. Yani model, neyi arayacağına karar verirken aynı zamanda ne gördüğünü, hangi kanıtın yararlı olduğunu, hangi kısıtların hâlâ açık olduğunu ve hangi iddiaların gerçekten kontrol edildiğini de hatırlamak zorundadır.

Bu biçimselleştirmenin politika içine fazla miktarda rutin durum yönetimi yerleştirdiğini savunuyoruz. Başka bir deyişle, pekiştirmeli öğrenme (RL), anlamsal arama kararlarıyla birlikte, ortamın daha güvenilir biçimde tutabileceği geri kazanılabilir kayıt yönetimini de birlikte optimize etmeye zorlanmaktadır.

Durum bilgisine sahip bir arama harness'i içinde pekiştirmeli öğrenmeyle eğitilmiş 20B'lik arama ajanı (arama alt ajanı) Harness-1'i tanıtıyoruz. Bu harness; aday havuzu, önem etiketli seçilmiş küme, kompakt kanıt bağlantıları, doğrulama kayıtları, sıkıştırılmış ve tekrarları kaldırılmış gözlemler ile bütçe farkındalıklı bağlam oluşturma dahil olmak üzere ortam taraflı çalışma belleğini korur. Politika ise neyin aranacağı, hangi belgelerin tutulacağı ya da eleneceği, neyin doğrulanacağı ve ne zaman durulacağı gibi anlamsal kararları elinde tutar.

Web, finans, patentler ve çok adımlı QA'yı kapsayan 8 arama kıyaslamasının genelinde Harness-1, ortalama 0.730 curated recall elde ederek ikinci sıradaki açık arama alt ajanını +11.4 puan geride bıraktı ve çok daha büyük frontier model arayıcılarla da rekabet edebilen bir performans sergiledi. Özellikle görülmemiş transfer kıyaslamalarındaki kazanımları dikkat çekiciydi; bu da açık arama durumu üzerinde yapılan pekiştirmeli öğrenmenin eğitim alanlarının ötesine genellenebilen arama davranışları üretebildiğini gösteriyor. Kod: https://github.com/pat-jj/harness-1

Arama ajanları çoğu zaman giderek büyüyen transcript'ler üzerindeki politikalar olarak eğitilir: model, neyi arayacağına karar verirken aynı zamanda ne gördüğünü, hangi kanıtın yararlı olduğunu, hangi kısıtların açık kaldığını ve hangi iddiaların gerçekten kontrol edildiğini de hatırlamak zorundadır. Bu biçimselleştirmenin politika içine fazla miktarda rutin durum yönetimi yerleştirdiğini savunuyoruz: pekiştirmeli öğrenme, hem anlamsal arama kararlarını hem de ortamın daha güvenilir biçimde tutabileceği geri kazanılabilir kayıt yönetimini optimize etmeye zorlanmaktadır. Durum bilgisine sahip bir arama harness'i içinde pekiştirmeli öğrenmeyle eğitilmiş 20B'lik arama ajanı (retrieval subagent) Harness-1'i tanıtıyoruz. Harness, aday havuzu, önem etiketli seçilmiş küme, kompakt kanıt bağlantıları, doğrulama kayıtları, sıkıştırılmış ve tekrarları kaldırılmış gözlemler ve bütçe farkındalıklı bağlam oluşturma dahil olmak üzere ortam taraflı çalışma belleğini korur. Politika ise anlamsal kararları elinde tutar: neyin aranacağı, hangi belgelerin tutulacağı ya da atılacağı, neyin doğrulanacağı ve ne zaman durulacağı. Web, finans, patentler ve çok adımlı QA'yı kapsayan sekiz retrieval benchmark boyunca Harness-1, ortalama 0.730 curated recall elde ederek bir sonraki en güçlü açık arama alt ajanını +11.4 puan geride bırakmış ve çok daha büyük frontier-model arayıcılarla rekabetçi kalmıştır. Kazanımları özellikle elde tutulmuş transfer benchmark'larında güçlüdür; bu da açık arama durumu üzerinde yapılan pekiştirmeli öğrenmenin eğitim alanlarının ötesine genellenen retrieval davranışları üretebildiğini göstermektedir. Kodumuz https://github.com/pat-jj/harness-1 adresinde mevcuttur.

Makale bağlantısı

https://arxiv.org/abs/2606.02373

Daha fazlası

https://github.com/pat-jj/harness-1

https://huggingface.co/pat-jj/harness-1


Attention'ı unutun: Tek ihtiyacınız Importance-Aware Attention / Forget Attention: Importance-Aware Attention Is All You Need

Makale tanıtımı

Transformer ile durum uzayı modeli (State Space Model, SSM) birleştiren hibrit dil modellemesinde, bilgiyi küresel ölçekte tarama yeteneği ile dizide neyin önemli olduğunu ayırt etme yeteneğinin nasıl birlikte korunacağı temel bir sorun olarak öne çıkıyor. Mevcut transformer'lar her yere bakabilir, ancak önceliklendirme konusunda sınırlıdır; SSM'ler ise önemli sinyalleri biriktirebilir, fakat geçmiş bilgiyi yeniden ince ayrıntısıyla referanslamakta zorlanır. Bu açıdan ikisi birbirini tamamlar. Ancak mevcut hibrit yaklaşımlar çoğunlukla bu iki mekanizmayı blok ya da head düzeyinde paralel yerleştirmekle sınırlı kaldığından, attention skorları hesaplanırken SSM'nin önem sinyali doğrudan yansıtılamıyordu. Yazarlar bu sorundan hareketle SSM-Informed Softmax Attention (SISA) yöntemini öneriyor ve SSM'nin sağladığı ardışık önem sinyalini attention çıktısına değil, skorun kendisine enjekte eden yeni bir birleştirme biçimi tasarlıyor. Temel fikir, içerik benzerliğini gösteren standart iç çarpım terimine ek olarak, SSM'den türetilen önem vektörünün iç çarpım terimini de ekleyerek token'lar arası ilişkiyi yalnızca içerik eşleşmesiyle değil, aynı zamanda “şu anda ne önemli?” sorusunu da yansıtacak şekilde genişletmektir.

Özellikle bu yöntemin önemli yanı, ek yinelemeli durumlar ya da özel kernel'ler olmadan, genişletilmiş query ve key'ler oluşturularak tek bir Scaled Dot-Product Attention (SDPA) çağrısıyla uygulanabilmesidir. Başka bir deyişle SISA, matematiksel olarak SSM'nin ardışık bilgisinden yararlansa da uygulama açısından standart transformer işlem akışıyla iyi uyum sağlayacak biçimde tasarlanmıştır; böylece FlashAttention ailesi optimizasyonlarıyla uyumluluğunu da korur. Ayrıca SSM kanalı, girdiden decay ve rotation bileşenlerini hesaplayarak önem sinyalini oluşturur ve bu sinyalin attention'ın skor düzeyinde çalışmasını sağlayarak retrieval performansını doğrudan artırır. Deney sonuçları da bu tasarımın etkisini açıkça gösteriyor: 152M ölçek ve 5B token koşulunda SISA, LAMBADA-greedy'de %17.3 elde ederek standart transformer ve Mamba-3'ü geride bıraktı; NIAH(Needle-in-a-Haystack) testinde ise eğitimin 1K. adımından itibaren %100'e ulaşarak son derece hızlı bir retrieval yakınsaması gösterdi.

Dahası, SISA 369M ölçeğinde de tüm metriklerde tamamen baskın görünmese de, en azından önemli retrieval görevlerinde istikrarlı biçimde güçlü performansını korurken stock SDPA çalıştırılabilirliğini de kaybetmemesi bakımından büyük pratik önem taşıyor. Yazarlar bununla, blok düzeyi ve head düzeyinin ötesine geçen üçüncü bir tasarım ekseni olarak score-level fusion’ın hibrit dil modelleri için geçerli bir alternatif olduğunu ortaya koyuyor. Sonuç olarak bu makalenin katkısı, yalnızca iki model ailesini karıştırmakta değil; SSM’in sağladığı önem sinyalini attention skorlarının oluşumunun merkezine taşıyarak küresel retrieval ile sıralı önceliklendirme kararını tek bir işlem içinde bütünleştirmesinde yatıyor. Bu yaklaşım, uzun menzilli bağımlılıkların yeniden kurulması ve kritik bilginin izlenmesinin önemli olduğu dil modelleme görevlerinde, hibrit yapıların nasıl daha incelikli biçimde evrilebileceğini gösteren önemli bir örnek olarak görülebilir.

Özet(Abstract)

Attention’ın küresel retrieval yeteneği ile durum uzayı modellerinin (SSM) sıralı önem sinyalini birleştirmek, hibrit dil modellemesinin çözülmemiş problemidir. Transformer’lar her şeyi görebilir ama önceliklendiremez; SSM’ler neyin önemli olduğunu bilir ama geri dönüp tekrar bakamaz. Mevcut hibritler olan Jamba (blok düzeyi) ve Hymba (head düzeyi), bu iki mekanizmayı birbirinden ayrılmış bölmelere yerleştirdiği için attention hesaplamasının kendisinde taraflardan hiçbiri diğerine bilgi sağlayamaz. Biz SISA’yı (SSM-Informed Softmax Attention) öneriyoruz. Bu yöntem, SSM’den türetilen bir önem terimini doğrudan attention skoru içine ekler ve tüm işlemi genişletilmiş query/key vektörleri üzerinde yapılan tek bir SDPA çağrısıyla gerçekleştirir. Ne yinelemeli durum ne de özel kernel gerekir. 152M / 5B token ölçeğinde SISA, LAMBADA-greedy’de %17.3’e ulaştı (Transformer 13.9 ve Mamba-3 15.5’e karşı) ve 1K adımdan itibaren NIAH %100 elde etti; bu da Transformer’ın retrieval yakınsamasından 7 kat daha hızlıdır. 369M’de LAMBADA’da Mamba-3 önde olsa da, SISA kusursuz NIAH ve varsayılan SDPA yürütümünü korur. Böylece SISA, alana uzun süredir hakim olan blok düzeyi ve head düzeyi paradigmalarının ötesinde, SSM-attention hibritleri için üçüncü bir tasarım ekseni olan score-level fusion’ı sunar.

Combining attention's global retrieval with the sequential importance signal of state space models (SSMs) is the open challenge of hybrid language modeling. Transformers see everywhere but cannot prioritize; SSMs know what matters but cannot revisit. Existing hybrids -- Jamba (block level) and Hymba (head level) -- place the two in separate compartments, so neither informs the other during the attention computation itself. We propose SISA (SSM-Informed Softmax Attention), which adds an SSM-derived importance term directly inside the attention score and realizes the full operation as a single SDPA call on augmented query/key vectors -- no recurrent state, no custom kernel. At 152M / 5B tokens, SISA reaches LAMBADA-greedy 17.3% (vs. Transformer 13.9 and Mamba-3 15.5) and attains NIAH 100% from step 1K, 7x faster than Transformer's retrieval convergence; at 369M, Mamba-3 leads LAMBADA while SISA preserves perfect NIAH and stock-SDPA execution. SISA thus defines a third design axis for SSM-attention hybrids -- score-level fusion -- beyond the block-level and head-level paradigms that have dominated the field.

Reklam

Makale bağlantısı

https://arxiv.org/abs/2606.02332


Transformer’ların üç projeksiyona ihtiyacı var mı? QKV varyantlarının sistematik incelemesi / Do Transformers Need Three Projections? Systematic Study of QKV Variants

Makale tanıtımı

Transformer’ın performansını ayakta tutan temel bileşen, query, key ve value’dan oluşan QKV (query-key-value) attention’dır; ancak her projeksiyonun gerçekte ne kadar bağımsız olarak gerekli olduğu yeterince sistematik biçimde incelenmemiştir. Bu çalışma tam olarak bu boşluğu hedefleyerek, Q-K=V, Q=K-V ve Q=K=V olmak üzere üç projeksiyon paylaşımı kısıtı etrafında attention içindeki weight tying’in ifade gücü ve çıkarım verimliliği üzerindeki etkisini ayrıntılı biçimde analiz ediyor. Özellikle son iki varyantın attention map’i simetrik hale getirmeye yatkın olmasına dikkat çekerek, yönlülüğü telafi etmek için iki boyutlu konumsal kodlama (two-dimensional positional encoding) ekleyen bir tasarımı da birlikte inceleyip tartışmayı basit bir parametre azaltımının ötesine, ifade uzayının yapısını değiştiren bir meseleye taşıyor. Bu yaklaşım, projeksiyon paylaşımının performans düşüşüne yol açıp açmadığını sormakla yetinmiyor; hangi koşullarda kalitenin korunduğunu ve hangi koşullarda attention’ın yönlülüğü ile seçiciliğinin bozulduğunu birbirinden ayırarak açıklaması bakımından anlam taşıyor.

Deneyler; sentetik görevler, görsel görevler ve dil modelleme gibi farklı alanları kapsayacak şekilde tasarlanmış ve böylece projeksiyon paylaşımının etkisinin belirli bir veri alanına özgü bir olgu olmadığı doğrulanmıştır. Sentetik görevlerde sıra tersine çevirme, sıralama, yer değiştirme, takas ve kopyalama gibi işlemsel problemler kullanılarak modelin yapısal ilişkileri ne kadar iyi öğrendiği inceleniyor; görsel deneylerde ise MNIST, CIFAR, TinyImageNet ve anomali tespiti (anomaly detection) üzerinden uzamsal konum bilgisinin önemli olduğu ortamlardaki genelleme performansı değerlendiriliyor. Dil modellemede 300M ve 1.2B parametre ölçeğindeki modeller 10B token ile eğitilerek, aynı eğilimin büyük ölçekli ayarlarda da korunup korunmadığı kontrol ediliyor. Sonuç olarak Q-K=V yaklaşımı, temel QKV Transformer ile genel olarak eşdeğer, hatta kimi zaman daha iyi performans gösterdi; dil modellemede ise key-value (KV) cache’i %50 azaltırken perplexity kötüleşmesi yalnızca %3.1 ile sınırlı kaldı.

Daha da önemlisi, bu tasarruf etkisinin grouped query attention (GQA) ya da multi-query attention (MQA) ile birbirini tamamlayacak şekilde birleşebilmesidir. Q-K=V, GQA-4 ile birlikte kullanıldığında KV cache %87.5’e kadar azaltılabiliyor; MQA ile birleştirildiğinde ise bu oran %96.9’a kadar çıkıyor ve on-device inference için somut avantaj sağlıyor. Yazarlar bu sonuçlardan hareketle, key ile value’nun gerçekte benzer bir temsil uzayını paylaşabildiğini ve attention’ın düşük dereceli (low-rank) yapılarda çalıştığı için tam QKV ayrımının zorunlu olmayabileceğini öne sürüyor. Buna karşılık Q=K-V, query ile key’i aşırı ölçüde bağlayarak attention’ın yönlülüğünü zayıflattığı için performans ve kararlılık açısından daha dezavantajlı görünüyor.

Toparlamak gerekirse bu çalışma, Transformer’ın QKV yapısını kendiliğinden kabul edilen bir standart değil, yeniden değerlendirilebilir bir tasarım alanı olarak görmemizi sağlıyor ve hangi projeksiyonların paylaşılması, hangi rollerin ayrıştırılması gerektiğine dair ampirik bir ölçüt sunuyor. Özellikle performansı neredeyse korurken bellek kullanımını büyük ölçüde azaltabilmesi nedeniyle, bu sonuçlar edge device gibi kısıtlı ortamlarda verimli dağıtım için önemli bir tasarım rehberi olarak okunabilir.

Özet(Abstract)

Transformer'lar çeşitli yapay zeka görevleri için standart çözüm haline geldi ve sorgu(query), anahtar(key), değer(value) (QKV) attention formülasyonu burada merkezi bir rol oynuyor. Ancak bu üç projeksiyonun bireysel katkısı ve bazılarının çıkarılmasının etkisi hâlâ yeterince anlaşılmış değil. Biz üç projeksiyon paylaşım kısıtını sistematik olarak değerlendirdik: a) Q-K=V (paylaşılan key-value), b) Q=K-V (paylaşılan query-key) ve c) Q=K=V (tek projeksiyon). Son iki varyant simetrik attention haritaları ürettiği için, bunu ele almak amacıyla 2 boyutlu konum kodlamaları üzerinden asimetrik attention'ı da inceledik. Sentetik görevler, görsel alanı (MNIST, CIFAR, TinyImageNet, anomali tespiti) ve dil modelleme (10B token üzerinde 300M ve 1.2B parametreli modeller) boyunca yürüttüğümüz deneylerde, transformer'larımızın QKV transformer ile aynı düzeyde, bazen de daha iyi performans gösterdiğini gördük. Dil modellemede Q-K=V projeksiyon paylaşımı, perplexity'yi yalnızca %3,1 kötüleştirirken KV cache'i %50 azalttı. Kritik olarak, projeksiyon paylaşımı head sharing (GQA/MQA) ile birbirini tamamlıyor. Q-K=V ile GQA-4'ü birleştirmek cache'i %87,5 azaltabilirken, Q-K=V ile MQA'yı birleştirmek bunu %96,9'a kadar çıkararak pratik on-device inference'ı mümkün kılıyor. Q-K=V'nin kaliteyi koruduğunu gösterdik; çünkü key ve value benzer temsil uzaylarını paylaşabiliyor ve attention düşük rank'lı bir bölgede çalışıyor. Buna karşılık Q=K-V, attention'ın yönlülüğünü bozuyor. Sonuçlarımız, attention içinde yeterince araştırılmamış bir weight tying örneği olarak projeksiyon paylaşımını sistematik biçimde karakterize ediyor ve özellikle edge deployment için değerli, doğrudan ve nicel olarak ölçülebilir çıkarım belleği avantajları gösteriyor. Kodlar https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections adresinde açık olarak yayımlandı.

Transformer'lar çeşitli yapay zeka görevleri için standart çözüm haline geldi ve sorgu, anahtar ve değer (QKV) attention formülasyonu burada merkezi bir rol oynar. Ancak bu üç projeksiyonun bireysel katkısı ve bazılarının çıkarılmasının etkisi hâlâ yeterince anlaşılmış değildir. Biz üç projeksiyon paylaşım kısıtını sistematik olarak değerlendiriyoruz: a) Q-K=V (paylaşılan key-value), b) Q=K-V (paylaşılan query-key) ve c) Q=K=V (tek projeksiyon). Son iki varyant simetrik attention haritaları üretir; bunu ele almak için 2D konumsal kodlamalar aracılığıyla asimetrik attention'ı da inceliyoruz. Sentetik görevler, görsel alanı (MNIST, CIFAR, TinyImageNet, anomali) ve dil modelleme (10B token üzerinde 300M ve 1.2B parametreli modeller) boyunca yürütülen deneylerde, transformer'larımızın QKV transformer ile aynı düzeyde ya da zaman zaman daha iyi performans gösterdiğini gördük. Dil modellemede, Q-K=V projeksiyon paylaşımı yalnızca %3,1 perplexity bozulmasıyla %50 KV cache azalması sağlıyor. Kritik olarak, projeksiyon paylaşımı head sharing (GQA/MQA) ile tamamlayıcı ilişki içindedir: Q-K=V ile GQA-4'ün birleştirilmesi %87,5 cache azalması sağlarken, Q-K=V + MQA %96,9'a ulaşıp pratik on-device inference'ı mümkün kılar. Q-K=V'nin kaliteyi koruduğunu gösteriyoruz; çünkü key'ler ve value'lar benzer temsil uzaylarında yer alabilir ve attention düşük rank'lı bir rejimde çalışır; buna karşılık Q=K-V attention yönlülüğünü bozar. Sonuçlarımız, attention'da yeterince araştırılmamış bir weight tying örneği olarak projeksiyon paylaşımını sistematik biçimde karakterize ediyor; özellikle edge deployment için doğrudan, nicel olarak ölçülebilir inference bellek avantajları sunuyor. Kodlar https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections adresinde herkese açık olarak sunulmuştur.

Makale bağlantısı

https://arxiv.org/abs/2606.04032

Daha fazlası

https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections


Ajanik iş akışlarını LLM ağırlıklarına derlemek: 100 kat daha düşük maliyetle frontier seviyesine yakın kalite / Compiling Agentic Workflows into LLM Weights: Near-Frontier Quality at Two Orders of Magnitude Less Cost

Makale tanıtımı

Son dönemde ajan orkestrasyon çerçevelerinin yaygınlaşması, karmaşık işlerin büyük dil modelleri (Large Language Model, LLM) üzerinde harici bir düzenleyici tarafından kontrol edilmesi yaklaşımının fiili bir standart gibi kabul gördüğünü gösteriyor; ancak bu makale, prosedürel görevlerde böyle bir yapının her zaman en iyi seçenek olmayabileceğini sorguluyor. Harici orkestratörün her turda talimat ve yönlendirme kararları enjekte etmesi, kontrol ve hata ayıklama açısından avantaj sağlasa da, context window'u sürekli tüketiyor, her diyalogda frontier model çağrısı gerektiriyor ve prosedürün kendisinin üçüncü taraf sağlayıcılara açığa çıkmasına neden olabiliyor. Buna karşılık yazarlar, görev prosedürünü prompt içinde tutmak yerine doğrudan küçük bir fine-tuned modelin ağırlıklarına derleyerek, çalışma anında ayrı bir orkestrasyona ihtiyaç duymadan prosedürü içselleştirmiş bir ajan oluşturmayı öneriyor. Bu yaklaşım, prosedürü dışarıdan sürekli enjekte etmeyi gerektirmediği için maliyeti büyük ölçüde düşürüyor, uzun bağlam alanını işgal etmiyor ve hassas iş akışlarını harici hizmetlere göstermiyor; dolayısıyla yapısal avantajlar sunuyor. Yazarlar, prosedürün model içinde gizli şekilde çalıştığı bu tür ajanları subterranean agent olarak adlandırıyor ve bunları mevcut orkestrasyon merkezli tasarımlardan net biçimde ayırıyor.

Temel metodoloji, yalnızca basit bir kavram önermekten ibaret değil; geliştiricilerin bu yaklaşıma mesafeli durmasına yol açan üç algılanan engeli gerçek iş ortamlarında sınamaya dayanıyor. Birincisi, küçük modellerin frontier düzeyine yakın kalite üretip üretemeyeceğine dair performans kaygısını ele alıyor; ikincisi, ürün odaklı bilgi gibi sık değişen verilerin ağırlıklara yerleştirilip yerleştirilemeyeceğine ilişkin bilgi içselleştirme sorununu inceliyor; üçüncüsü ise, çok sayıda dal ve hub içeren büyük iş akışlarında bu yöntemin ölçeklenip ölçeklenemeyeceğini test ediyor. Bunun için araştırmacılar seyahat rezervasyonu, Zoom desteği ve sigorta tazminatı olmak üzere niteliği farklı üç alan seçerek, prosedürel derinlik ve alan bilgisinin gereksinim düzeyi değişen koşullarda derleme yaklaşımının faydasını karşılaştırıyor. Seyahat rezervasyonu, 14 düğümden oluşan standart bir prosedür akışı üzerinden durum geçişleri ile adım adım karar vermenin kararlılığını test ediyor; Zoom desteği ise benzer ölçekteki bir iş akışında bile ürüne özgü politika ve özellik bilgisinin birlikte gerektiğini vurguluyor. Sigorta tazminatı ise 55 düğüm ve 6 karar merkezi içeren daha karmaşık bir yapıyla, koşullu dallanma ve poliçe hesaplamasının aynı anda gerektiği gerçekçi bir stres testi görevi görüyor.

Deney sonuçlarının anlamı açık. Prosedürü ağırlıklarına içselleştiren küçük bir modelin, frontier modellere yakın kalite anlamına gelen near-frontier quality düzeyini korurken maliyeti onlarca kat azaltabildiği doğrulanıyor; bu da performans ile verimlilik arasındaki geleneksel dengeyi yeniden düşünmeyi gerektiriyor. Özellikle sigorta talebi örneğinde görüldüğü gibi model, yalnızca yanıt üretmekle kalmayıp doğrulama, dallanma, tazminat hesaplama ve ödeme yönlendirmesi dâhil prosedürel akıl yürütmeyi tutarlı biçimde gerçekleştirebiliyor. Bu sonuçlar, tekrar edilebilir ve yapısı görece istikrarlı işlerde her seferinde dış ayarlamadan geçen orkestrasyondan ziyade, prosedürün kendisini öğrenmiş derleme temelli yaklaşımın daha uygun olabileceğine işaret ediyor. Aynı zamanda, prosedür değiştiğinde yeniden eğitim gerekebileceği ve prompt tabanlı yaklaşımlara kıyasla anında düzeltme ile yorumlanabilirlik açısından dezavantajlı olabileceği de ortada; ancak çalışmanın katkısı, ajan tasarımındaki seçenekleri genişletmesinde yatıyor. Sonuç olarak bu makale, ajan iş akışlarının her zaman dışarıdan birleştirilmesi gerektiği yönündeki yerleşik kabule meydan okuyor ve prosedürü modelin içine taşıyan yaklaşımın pratik düzeyde de yeterince geçerli bir alternatif olabileceğini deneysel olarak ortaya koyuyor.

Özet (Abstract)

Ajan orkestrasyon çerçeveleri hızla yaygınlaştı; LangGraph, CrewAI, Google ADK, OpenAI Agents SDK, Semantic Kernel, Strands ve LlamaIndex toplamda 290 bini aşkın GitHub yıldızını geçti. Bunların tümü aynı kalıbı izliyor: LLM’in üstünde bir dış orkestratör bulunuyor ve her turda talimatlar ile yönlendirme kararları enjekte ediliyor. Son çalışmalar, prosedürel görevlerde bu mimarinin, prosedürü bir frontier modelin sistem prompt’una doğrudan vermeye kıyasla geride kaldığını gösterdi [Dennis et al., 2026a]. Ancak bu yaklaşım, bağlam penceresini tüketme, her konuşma için bir frontier model gerektirme ve özel prosedürleri üçüncü taraf sağlayıcılara ifşa etme bedelini taşıyor. Prosedürü küçük bir fine-tuned modelin ağırlıklarına derleyerek yeraltı ajanı (subterranean agent) oluşturmak bu sorunların tümünü çözebilmelidir ve önceki çalışmaların (SimpleTOD, FireAct, SynTOD, WorkflowLLM, Agent Lumos) bu tekniğin işe yaradığını gösterdiği de ortadadır. Buna rağmen geliştirici benimsemesi ezici biçimde orkestrasyondan yana oldu. Biz, algılanan üç engeli belirliyor ve bunların her birini seyahat rezervasyonu (14 düğüm), Zoom desteği (14 düğüm, ürüne özgü bilgi) ve sigorta talepleri (55 düğüm, 6 karar merkezi) olmak üzere üç alanda ampirik olarak ele alıyoruz.

Agent orchestration frameworks have proliferated, collectively exceeding 290,000 GitHub stars across LangGraph, CrewAI, Google ADK, OpenAI Agents SDK, Semantic Kernel, Strands, and LlamaIndex. All follow the same pattern: an external orchestrator above the LLM, injecting instructions and routing decisions every turn. Recent work has shown this architecture is dominated for procedural tasks by simply providing the procedure in a frontier model's system prompt [Dennis et al., 2026a], at the cost of consuming the context window, requiring a frontier model for every conversation, and exposing proprietary procedures to third-party providers. Compiling the procedure into the weights of a small fine-tuned model -- creating a subterranean agent -- should resolve all of these concerns, and prior work (SimpleTOD, FireAct, SynTOD, WorkflowLLM, Agent Lumos) has shown the technique works. Yet developer adoption has overwhelmingly favored orchestration. We identify three perceived barriers and address each empirically across travel booking (14 nodes), Zoom support (14 nodes, product-specific knowledge), and insurance claims (55 nodes, 6 decision hubs).

Makale bağlantısı

https://arxiv.org/abs/2605.22502

Reklam

Daha fazlası

https://discuss.pytorch.kr/t/llm-subterranean-agent/10501


Uzun ufuklu görevler için ajan uyumlu bağlam yönetimi öğrenimi / Learning Agent-Compatible Context Management for Long-Horizon Tasks

Makale tanıtımı

Büyük dil modeli (LLM) tabanlı ajanlar, web araması ya da derinlemesine araştırma gibi adımları uzun süren ve ara kararların biriktiği uzun ufuklu görevleri (long-horizon tasks) yerine getirirken, en büyük engellerden biri konuşma uzadıkça geçerli ipuçları ile gereksiz geçmiş bilginin birbirine karışması ve bunun akıl yürütmeyi sarsmasıdır. Mevcut bağlam yönetimi yöntemleri çoğu zaman ajan içi politikayı birlikte öğrenir ya da özetleme gibi sabit stratejilere dayanır; ancak bu yaklaşımlar kapalı kaynaklı (closed-source) ajanlara uygulanmakta zorlanır ve her ajanın farklı yönetim biçimlerine ihtiyaç duyabileceği gerçeğini yeterince yansıtmaz. Bunu çözmek için önerilen Adaptive Context Management (AdaCoM), sabitlenmiş bir ajanı (frozen agent) olduğu gibi bırakırken, dışarıdaki başka bir LLM’in bağlamı dinamik olarak düzenlemeyi öğrenmesine dayanan bir yaklaşım benimser. Buradaki kilit nokta, yalnızca uzun konuşmaları sıkıştırmak değil; mesaj düzeyinde silme, yeniden yazma ve birleştirme yaparken mevcut görev için gerekli kısıtları ve ilerleme durumunu koruyup eski gürültüyü ayıklayan esnek düzenleme eylemlerini öğrenmektir. Bu tasarım, bağlam yönetimini statik bir ön işleme adımı olmaktan çıkarıp, ajanın başarı oranını doğrudan iyileştiren bir politika öğrenimi problemi olarak yeniden tanımlaması bakımından önemlidir.

AdaCoM, önce bağlam yöneticisini yapılandırılmış çıktı biçimine alıştıran denetimli ince ayar (supervised fine-tuning, SFT) ile başlıyor; ardından gerçek görev performansını ödül olarak kullanıp Grup Göreli Politika Optimizasyonu (Group Relative Policy Optimization, GRPO) ile politikayı rafine ediyor. Bu süreçte yönetici, mevcut bağlamı prompt’a dönüştürülmüş şekilde girdi olarak alıyor ve Markov karar süreci (Markov decision process, MDP) perspektifinden her adımda hangi mesajların korunacağına ya da değiştirileceğine karar veriyor. Ayrıca yalnızca nihai doğru yanıta bakmak yerine, bağlam uzunluğu aşımı, tekrarlayan araç çağrıları, biçim hataları ve ara aşamalardaki görev sinyallerini yansıtan süreç ödülleri (process reward) de tasarlanarak, uzun görevlerde önemli olan yerel düzenleme kalitesinin de öğrenilmesi sağlanıyor. Böylece AdaCoM, basit bir özetleyici değil; ajanın düşünme sürecini istikrarlı biçimde sürdürebilmesine yardımcı olan uyarlanabilir bir düzenleme politikası olarak işliyor.

Deneysel olarak, web araması ve derinlemesine araştırma kıyaslamalarında çeşitli ajanlara uygulandığında performans artışı doğrulandı. Özellikle, özgün ReAct (Reasoning and Acting) yaklaşımında temel performansı yüksek olan ajanlarda daha yüksek sadakatli bağlam korumasının avantajlı olduğu; buna karşılık görece daha zayıf ajanlarda daha agresif sıkıştırmanın, istikrarlı akıl yürütme aralığında kalmayı kolaylaştırdığı ortaya çıktı. Yazarlar bunu fidelity-reliability trade-off olarak yorumluyor ve bağlam yönetiminin ajanın yetenek düzeyine göre değişmesi gerektiğini gösteriyor. Dahası, aktarım deneylerinde AdaCoM stratejisinin benzer yetenek özelliklerine sahip ajanlar arasında daha iyi taşınabildiği gözlemlendi; bu da tek bir evrensel özetleme kuralı yerine yeniden kullanılabilir harici bir bağlam yöneticisi yaklaşımının pratik olabileceğine işaret ediyor. Sonuç olarak bu çalışma, uzun ufuklu görevlerdeki başarısızlık nedenini yalnızca ajanın akıl yürütme yeteneğinde aramayarak, bu akıl yürütmeyi destekleyen bağlam yönetiminin kendisini de öğrenilebilir temel bir bileşen olarak ele alması bakımından önemli bir yöntemsel ilerleme sunuyor.

Özet (Abstract)

Büyük dil modeli (LLM) ajanları, web araması ve derin araştırma gibi uzun ufuklu görevlerle giderek daha fazla karşı karşıya kalıyor; gerçek dünya uygulamalarında biriken bağlam, uzun bağlam bozulmasına ve akıl yürütme hatalarına yol açabiliyor. Önceki çalışmalar bunu, ajan taraflı bağlam kontrolü veya özetleme gibi sabit stratejilerle yapılan bağlam yönetimiyle hafifletmeye çalıştı; ancak bu yöntemler uyum sağlamak için ajanın kendisinin eğitilmesini gerektiriyor, bu da kapalı kaynak ajanlar için pratik değil ve farklı ajanların farklı stratejilere ihtiyaç duyabileceğini de göz ardı ediyor.

Adaptive Context Management (AdaCoM) adlı yöntemi öneriyoruz. Bu yöntem, esnek düzenleme eylemleri ve uçtan uca pekiştirmeli öğrenme yoluyla sabit bir ajanın bağlamını yönetmesi için harici bir LLM eğitiyor. Web araması ve derin araştırma benchmark’larında farklı ajanlar üzerinde AdaCoM, eski içerikleri budarken görev kısıtlarını ve ilerlemeyi koruyarak performansı önemli ölçüde artırıyor. Öğrenilen stratejiler, Sadakat-Güvenilirlik ödünleşimini (Fidelity-Reliability Trade-off) ortaya koyuyor. Buna göre, temel ReAct performansı daha yüksek olan ajanlar daha yüksek sadakatli bağlam korumadan fayda sağlarken, daha düşük performanslı ajanlar güvenilir bir akıl yürütme rejimi içinde kalmak için daha agresif sıkıştırmaya ihtiyaç duyuyor. Aktarım deneyleri, AdaCoM’un genel ReAct performansıyla ölçülen yetenekleri benzer olan ajanlar arasında en etkili şekilde genellendiğini gösteriyor; bu da ajan sistemleri için yeniden kullanılabilir bağlam yöneticilerine giden pratik bir yol sunduğunu düşündürüyor.

LLM agents increasingly face long-horizon tasks such as web search and deep research in real-world applications, where accumulated context can cause long-context degradation and reasoning failures. Prior work mitigates this through context management with agent-side context control or fixed strategies such as summarization, which require training the agent itself for adaptation - making it impractical for closed-source agents and ignoring that different agents may require different strategies. We introduce Adaptive Context Management (AdaCoM), which trains an external LLM to manage the context of a frozen agent through flexible modification actions and end-to-end reinforcement learning. Across diverse agents on web search and deep research benchmarks, AdaCoM substantially improves performance by preserving task constraints and progress while pruning stale content. The learned strategies reveal a Fidelity-Reliability Trade-off: agents with higher vanilla ReAct performance benefit from higher-fidelity context preservation, whereas lower-performing agents require more aggressive compression to stay within a reliable reasoning regime. Transfer experiments show that AdaCoM generalizes most effectively across agents with similar capability (measured by vanilla ReAct performance), suggesting a practical path toward reusable context managers for agent systems.

Makale bağlantısı

https://arxiv.org/abs/2605.30785


Latent Agents: İçselleştirilmiş çoklu ajan tartışması için bir post-training prosedürü / Latent Agents: A Post-Training Procedure for Internalized Multi-Agent Debate

Makale tanıtımı

Büyük dil modellerinin (Large Language Models, LLMs) akıl yürütme performansını artırmak için kullanılan çoklu ajan tartışması (Multi-Agent Debate), güçlü bir yöntem olsa da birden fazla ajanın uzun tartışma kayıtlarını karşılıklı olarak paylaşmasını gerektirdiği için hesaplama maliyeti çok yüksektir. Latent Agents, bu verimsizliği gidermek amacıyla, dışarıda yürütülen çoklu ajan tartışmasını tek bir dil modelinin içine damıtan bir post-training prosedürü öneriyor. Temel fikir, yalnızca tartışmanın sonucunu sıkıştırmanın ötesine geçerek, modelin önce tartışmanın yapısını öğrenmesini ve ardından pekiştirmeli öğrenme (Reinforcement Learning, RL) yoluyla bu yapıyı içselleştirmesini sağlamaktır. Bunun için yazarlar önce 3 ajandan ve 2 turdan oluşan tartışma verileri oluşturdu ve nihai uzlaşının sağlandığı aritmetik problem tartışma kayıtlarına yapı etiketleri ekleyerek tutarlı bir biçim oluşturdu. Ardından gözetimli fine-tuning (Supervised Fine-Tuning, SFT) aşamasında, modelin tartışmanın ilerleyiş biçimini ve uzlaşma oluşum kalıplarını taklit etmesi için tüm tartışma izi olduğu gibi eğitildi.

Sonraki pekiştirmeli öğrenme aşaması ise basit biçim taklidini aşarak tartışmanın gerçekten içselleştirilmesi sürecine karşılık geliyor. Burada Group Relative Policy Optimization (GRPO) kullanılarak birden fazla aday çıktı karşılaştırılıyor ve doğru cevabın daha erken aşamada ortaya çıkmasını teşvik eden length clipping ödülüyle birleştiriliyor. Ayrıca <|Agent 1|>, <|Round 1|>, <|endofdebate|> gibi yapı etiketlerinin korunmasına yardımcı olan biçim ödülü kademeli olarak zayıflatılarak, modelin artık uzun dış tartışmalara dayanmak zorunda kalmadan yalnızca iç temsillerle sonuca ulaşması hedefleniyor. Bu dinamik ödül zamanlaması ve uzunluk azaltımı, tartışmanın hesaplamalı dış görünümünü küçültürken ajanlar arası etkileşimin ürettiği akıl yürütme avantajını korumada önemli rol oynuyor. Deney sonuçlarına göre önerilen model, GSM8K, MMLU-Pro ve Big-Bench Hard (BBH) üzerinde açık çoklu ajan tartışmasıyla aynı ya da daha iyi performans gösterdi; kullanılan token sayısı ise %93’e kadar azalarak çıkarım verimliliğini önemli ölçüde artırdı. Özellikle bazı ayarlarda yalnızca SFT ile bile mevcut tartışma yöntemlerinden daha iyi sonuçlar elde edilirken, RL eklendiğinde hem doğruluk hem de token tasarrufu daha da güçlendi ve içselleştirme prosedürünün etkisi açık biçimde ortaya çıktı.

Bu çalışmanın bir diğer önemli katkısı, içselleştirilmiş tartışmanın modelin temsil uzayını nasıl değiştirdiğini mekanik olarak incelemesidir. Activation steering deneyleri aracılığıyla yazarlar, içselleştirilmiş modelin içinde ajana özgü alt uzayların (agent-specific subspaces) oluştuğunu ve farklı ajan bakış açılarına karşılık gelen yorumlanabilir yönlerin bulunduğunu gösterdi. Bu, çoklu ajan tartışmasının avantajlarının yalnızca çıktı metninin ortalamasından kaynaklanmadığını; farklı akıl yürütme bakış açılarının gizil uzayda yapısal olarak ayrışıp birleşmesiyle ilgili olduğunu düşündürüyor. Dahası, kötü niyetli bir ajanın içselleştirilmesinin ardından negative steering ile bunun bastırıldığı deneyler, damıtılmış modelde zararlı davranışların daha yerelleşmiş ve daha kolay kontrol edilebilir hale gelebileceğini gösteriyor. Sonuç olarak Latent Agents, çoklu ajan akıl yürütmesini maliyet açısından verimli biçimde sıkıştıran bir yöntem sunarken, aynı zamanda içselleştirilmiş akıl yürütmenin yapısını ve denetlenebilirliğini de ortaya koyması bakımından önem taşıyor.

Özet (Abstract)

Çoklu ajan tartışmasının, büyük dil modellerinde (LLM) akıl yürütme performansını iyileştirdiği gösterildi. Ancak bu yaklaşım, soruları yanıtlamadan önce uzun konuşma kayıtları üretilmesini gerektirdiği için yüksek hesaplama maliyetine sahiptir. Bu verimsizliği gidermek için, tartışma yapısı öğrenimini dinamik ödül zamanlaması ve uzunluk kırpma yoluyla içselleştirmeyle birleştiren iki aşamalı bir fine-tuning hattı üzerinden çoklu ajan tartışmasını tek bir LLM'e damıtan bir çerçeve geliştiriyoruz. Birden fazla model ve benchmark genelinde, içselleştirilmiş modellerimiz açık çoklu ajan tartışması performansını en fazla %93 daha az token kullanarak yakalıyor veya aşıyor. Ardından activation steering aracılığıyla bu yeteneğin mekanik temelini inceledik ve içselleştirmenin ajana özgü altuzaylar, yani farklı ajan bakış açılarına karşılık gelen aktivasyon uzayındaki yorumlanabilir yönler oluşturduğunu bulduk. Ayrıca pratik bir uygulama örneği de gösterdik. İçselleştirilmiş tartışma yoluyla LLM'e kötü niyetli ajanlar yerleştirip ardından bunları bastırmak için negative steering uygulayarak, damıtmanın zararlı davranışları daha kolay yerelleştirip kontrol edilebilir hale getirdiğini ve temel modellere steering uygulamaya kıyasla genel performansta daha küçük düşüşlere yol açtığını gösterdik. Bulgularımız, damıtılmış modellerde çoklu ajan yeteneklerini anlamak için yeni bir bakış açısı sunuyor ve içselleştirilmiş akıl yürütme davranışlarını kontrol etmeye yönelik pratik yönergeler sağlıyor. Kod şu URL'de sunulmaktadır: https://github.com/johnsk95/latent_agents

Multi-agent debate has been shown to improve reasoning in large language models (LLMs). However, it is compute-intensive, requiring generation of long transcripts before answering questions. To address this inefficiency, we develop a framework that distills multi-agent debate into a single LLM through a two-stage fine-tuning pipeline combining debate structure learning with internalization via dynamic reward scheduling and length clipping. Across multiple models and benchmarks, our internalized models match or exceed explicit multi-agent debate performance using up to 93% fewer tokens. We then investigate the mechanistic basis of this capability through activation steering, finding that internalization creates agent-specific subspaces: interpretable directions in activation space corresponding to different agent perspectives. We further demonstrate a practical application: by instilling malicious agents into the LLM through internalized debate, then applying negative steering to suppress them, we show that distillation makes harmful behaviors easier to localize and control with smaller reductions in general performance compared to steering base models. Our findings offer a new perspective for understanding multi-agent capabilities in distilled models and provide practical guidelines for controlling internalized reasoning behaviors. Code available at https://github.com/johnsk95/latent_agents

Makale bağlantısı

https://arxiv.org/abs/2604.24881

Reklam

Daha fazlası için

https://github.com/johnsk95/latent_agents


MOSS: Otonom ajan sistemlerinde kaynak düzeyinde yeniden yazım yoluyla kendini evrimleştirme / MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

Makale tanıtımı

Dağıtımdan sonra da kendi kendine öğrenebilen ve tekrarlayan başarısızlıkları azaltabilen otonom ajan sistemleri uzun süredir önemli bir hedef olsa da, pratikte çoğu sistem metinle değiştirilebilen ayarlar ve prompt düzeyinde kalıyor ve yapısal kusurları kökten ele alamıyordu. Bu sınırlamaları aşmak için önerilen MOSS, kaynak düzeyinde uyarlamayı (source-level adaptation) kendini evrimleştirmenin aracı olarak kullanarak, ajanın çekirdek yürütme yapısının kendisini yeniden yazabilecek şekilde tasarlanmış bir sistemdir. Yazarlar, routing, hook sırası, durum değişmezleri ve dispatch gibi gerçek davranışı belirleyen unsurların kodun içinde bulunduğunu, bu nedenle yalnızca skill dosyalarını ya da prompt yapılandırmasını değiştirmenin erişemeyeceği başarısızlıkların kaçınılmaz olarak kaldığını vurguluyor. Buna karşılık kaynak kod, Turing-complete olması, metin tabanlı artifact'lerin üstkümesine karşılık gelmesi ve modelin yönergelere uyup uymamasına bağlı olmadan deterministik biçimde çalışması nedeniyle çok daha genel ve istikrarlı bir uyarlama aracı olarak sunuluyor.

MOSS'un metodolojisinin merkezinde, otomatik olarak toplanmış production-failure evidence'tan yola çıkıp buna göre çok aşamalı bir evrim hattını sabit biçimde yürütmek yer alıyor. Kod değişikliklerinin kendisi harici bir coding agent CLI'ına (command-line interface) devredilse de, MOSS aşamaların sırasını ve nihai kararı doğrudan kontrol ederek üretim ile doğrulamanın sorumluluğunu ayırıyor. Bu şekilde oluşturulan aday sürümler, tek seferlik trial worker'larda başarısızlık paketlerinin yeniden yürütülmesi (replay) ile doğrulanıyor; bunun önemi, yalnızca statik analiz değil, gerçek başarısızlık durumlarının yeniden üretilmesine dayalı bir değerlendirme yapılmasından geliyor. Doğrulamayı geçen adaylar, ancak kullanıcı onayı ön koşuluyla yapılan in-place container swap üzerinden terfi ettiriliyor ve sonrasında health probe koşullarını karşılayamazlarsa otomatik olarak rollback edilecek şekilde tasarlanıyor; böylece operasyonel güvenlik de sağlanmış oluyor.

Bu yaklaşım, mevcut kendini evrimleştiren ajanların çoğunlukla prompt, bellek şeması ve workflow graph gibi yalnızca metinle ifade edilebilen alanlarda iyileştirme denemesi yapmasından farklı olarak, gerçek execution harness dahil tüm sistemi evrim nesnesi haline getirmesiyle ayrışıyor. Bu nedenle MOSS, yalnızca daha iyi yanıt üreten bir model değil, çalışır durumdaki ajan sistemlerinin yapısal kusurlarını doğrudan düzelten bir uyarlama platformu olarak anlaşılabilir. Özellikle deterministik bir hat ile doğrulama-terfi-rollback prosedürlerini birleştirmesi, uzun bağlam kayması (long-context drift) karşısında kırılgan olan metin merkezli yaklaşımlara göre daha sağlam bir öz iyileştirme yolu sunuyor. Bu tasarım, otonom ajanların gerçek hizmet ortamlarında güvenli biçimde evrimleşebilmesi için yalnızca öğrenme yeteneğinin değil, dağıtım, doğrulama ve rollback'i de kapsayan sistem mühendisliği mekanizmalarının birlikte gerekli olduğunu açıkça gösteriyor.

Deneysel olarak MOSS, OpenClaw'da dört görev için ortalama grader score'u yalnızca tek bir evrim döngüsüyle 0.25'ten 0.61'e yükseltti ve bu iyileşmeyi insan müdahalesi olmadan sağladı. Bu sonuç, kaynak düzeyinde yeniden yazım yaklaşımının yalnızca teorik olarak daha genel olmakla kalmadığını, gerçek production ajan sistemlerinde de anlamlı performans artışlarına yol açabildiğini gösteriyor. Sonuç olarak bu makale, kendini evrimleştiren ajanların kapsamını metin ayarlamasından kod düzeyinde yeniden yapılandırmaya genişleterek, otonom sistemlerin tekrarlayan başarısızlıkları kendi başına düzeltmesine yönelik yeni bir olasılık sunuyor.

Özet (Abstract)

Dağıtımdan sonra otonom ajan tabanlı sistemler büyük ölçüde statiktir: kullanıcı etkileşimlerinden öğrenmezler ve tekrarlayan hatalar, bir sonraki insan güdümlü güncelleme düzeltmeyi dağıtana kadar sürer. Buna yanıt olarak kendi kendine evrilen ajanlar ortaya çıktı, ancak bunlar da evrimi yalnızca metinle değiştirilebilir artifaktlarla — beceri dosyaları, prompt yapılandırmaları, bellek şemaları, iş akışı grafikleri — sınırlar ve ajan harness’ini olduğu gibi bırakır. Yönlendirme, hook sıralaması, durum değişmezleri ve dispatch metin artifaktlarında değil kodun içinde bulunduğundan, yapısal hata sınıflarının tamamına metin katmanından fiziksel olarak erişilemez. Biz, kaynak düzeyinde uyarlamanın temelde daha genel bir ortam olduğunu savunuyoruz. Bu, Turing-complete’tir; metinle değiştirilebilir her kapsamın katı bir üst kümesidir; temel modelin uyumuna bel bağlamak yerine deterministik olarak etki eder ve uzun bağlam kaymasına karşı zayıflamaz. Üretim ortamındaki ajan tabanlı altyapılar üzerinde kaynak düzeyinde self-rewriting gerçekleştiren bir sistem olan MOSS’u sunuyoruz. Her evrim, otomatik olarak derlenmiş bir üretim hatası kanıtı grubuna dayanır ve deterministik, çok aşamalı bir pipeline üzerinden ilerler. Kod değişikliği, takılabilir harici bir coding-agent CLI’a devredilirken MOSS aşama sırasını ve kararları korur. Adaylar, grubu geçici deneme worker’larında aday imaja karşı yeniden oynatarak doğrulanır; ardından kullanıcı onayıyla kapılanmış yerinde container değişimi ve health probe tabanlı rollback ile yükseltilir. OpenClaw üzerinde MOSS, insan müdahalesi olmadan tek bir döngüde dört görevin ortalama değerlendirici puanını 0.25’ten 0.61’e çıkarır.

Otonom ajan tabanlı sistemler dağıtımdan sonra büyük ölçüde statiktir: kullanıcı etkileşimlerinden öğrenmezler ve tekrarlayan hatalar, bir sonraki insan güdümlü güncelleme düzeltme yayınlayana kadar sürer. Buna yanıt olarak kendi kendine evrilen ajanlar ortaya çıktı, ancak bunların tümü evrimi metinle değiştirilebilir artifaktlarla -- beceri dosyaları, prompt yapılandırmaları, bellek şemaları, iş akışı grafikleri -- sınırlar ve ajan harness’ini dokunulmadan bırakır. Yönlendirme, hook sıralaması, durum değişmezleri ve dispatch herhangi bir metin artifaktında değil kodda yer aldığından, yapısal hata sınıflarının tamamına metin katmanından fiziksel olarak erişmek mümkün değildir. Biz, kaynak düzeyinde uyarlamanın temelde daha genel bir ortam olduğunu savunuyoruz: Turing-complete’tir, metinle değiştirilebilir her kapsamın katı bir üst kümesidir, temel modelin uyumuna bağlı kalmak yerine deterministik biçimde etkisini gösterir ve uzun bağlam kayması altında aşınmaz. Üretimdeki ajan tabanlı altyapılar üzerinde kaynak düzeyinde kendi kendini yeniden yazma gerçekleştiren bir sistem olan MOSS’u sunuyoruz. Her evrim, otomatik olarak derlenmiş bir üretim hatası kanıtı grubuna bağlanır ve deterministik çok aşamalı bir pipeline üzerinden ilerler; kod değişikliği, takılabilir harici bir coding-agent CLI’a devredilirken MOSS aşama sırasını ve kararları elinde tutar. Adaylar, grubu geçici deneme worker’larında aday imaja karşı yeniden oynatarak doğrulanır, ardından kullanıcı onayıyla kapılanmış yerinde container değişimi ve health probe ile kapılanmış rollback üzerinden yükseltilir. OpenClaw üzerinde MOSS, insan müdahalesi olmadan tek bir döngüde dört görevlik ortalama değerlendirici puanını 0.25’ten 0.61’e yükseltir.

Makale bağlantısı

https://arxiv.org/abs/2605.22794

Daha fazlasını okuyun

https://github.com/dav-joy-thon/MOSS


İşbirliksiz Oyunlar Yoluyla Dil Modellerinin Güvenlik Hizalanması / Safety Alignment of LMs via Non-cooperative Games

Makale tanıtımı

Dil modellerinin (language models, LM) güvenlik hizalanması, faydayı korurken aynı zamanda kötü niyetli girdilere dayanıklılığı da güvence altına almak zorunda olması nedeniyle, son dönemde yapay zeka hizalama araştırmalarının temel konularından biri haline gelmiştir. Mevcut yaklaşımlar çoğunlukla saldırgan prompt’lar üretip ardından bunlara karşı savunma yapacak şekilde sıralı ince ayar uygulamakla sınırlı kalırken, bu makale güvenlik hizalanmasını saldırgan LM (Attacker LM) ile savunmacı LM’nin (Defender LM) birbirlerinin stratejilerine gerçek zamanlı uyum sağladığı sıfır toplamlı olmayan bir oyun (non-zero-sum game) olarak yeniden tanımlar. İki model, çevrim içi reinforcement learning (online reinforcement learning, RL) ile birlikte eğitilir; saldırgan daha sofistike red-teaming stratejileri keşfederken savunmacı da bu saldırılara karşı daha dayanıklı olacak şekilde evrilir. Bu karşılıklı uyum yapısı, statik bir veri kümesi üzerinde tek seferlik öğrenmeden ziyade, modeller arası rekabet tekrarlandıkça performans sınırlarının kendisini sürekli genişletmesi bakımından mevcut yöntemlerden açıkça ayrılır. Özellikle yazarlar, ödül sinyalini puan tabanlı (point-wise score) biçimde kurmak yerine ikili karşılaştırmadan (pairwise comparison) elde edilen tercih tabanlı (preference-based) sinyallerle tasarlayarak daha istikrarlı bir denetim sağlamayı ve reward hacking’e karşı kırılganlığı azaltmayı amaçlamıştır.

Bu metodolojinin merkezinde AdvGame adlı eğitim prosedürü yer alır ve bunun amacı güvenlik ile fayda arasındaki Pareto frontier’i daha dışarı taşımaktır. Somut olarak, saldırgan ile savunmacı birbirlerinin en güncel policy’lerini yansıtarak dönüşümlü biçimde güncellendiği için, savunmacı gerçekten daha güçlü saldırılar karşısında eğitilirken saldırgan da yalnızca belirli bir modelin zayıflıklarına sıkışmayan genel bir zafiyet tespit yeteneği öğrenir. Ek bölümdeki formül türetimleri, bu oyun tabanlı optimizasyon problemini fiilen öğrenilebilir bir biçime taşıyan temel süreci gösterir; saldırgan policy’sinin optimum dağılımı, referans policy’ye (reference policy) göre üstel yeniden ağırlıklandırma biçiminde ifade edildikten sonra, normalizasyon sabitini kaldırmak için iki adayın karşılaştırılmasıyla yeniden düzenlenir. Bu süreçte saldırganın eğitimi, mutlak puan regresyonu değil göreli tercih sırasını eşleştirme problemine dönüşür; bu da doğal olarak Direct Preference Optimization (DPO) ailesi amaç fonksiyonlarına bağlanır. Başka bir deyişle, saldırganın ürettiği prompt ile savunmacının verdiği yanıtın birlikte oluşturduğu trajectory’nin tamamı karşılaştırma nesnesi haline getirilerek, gerçek etkileşime dayanan daha zengin bir öğrenme sinyali elde edilir.

Ayrıca bu makale, tercih olasılığını Bradley-Terry modeliyle ilişkilendirerek saldırgan ile savunmacı arasındaki etkileşimi logit uzayında özetleyen marginalized preference kavramını tanıtır. Bu sayede tek tek yanıtların gürültüsünü ortalamaya alırken, yalnızca prompt’un kendisini değil prompt ile yanıtın birleşik etkisini yansıtan bir tercih yapısı öğrenmek mümkün olur. Sonuç olarak saldırgan güncellemesi, mevcut savunmacı policy’si tarafından sürekli yenilenen dinamik bir dağılım üzerinde yürütüldüğünden, sabit bir hedefe özelleşmiş saldırılara değil çeşitli modellere genellenebilen red-team yeteneklerine yakınsar. Özette vurgulandığı gibi, bu ortak optimizasyon daha faydalı ve aynı zamanda saldırılara daha dayanıklı bir savunmacı LM sunarken, gerçek dağıtım ortamlarında kullanılabilecek güçlü ve genel amaçlı bir saldırgan LM’yi de birlikte üretmesi bakımından anlamlıdır. Nihayetinde bu çalışma, güvenlik hizalanmasını basit bir savunma tekniği olmaktan çıkarıp modeller arası rekabet ve uyumu sistematik biçimde kullanan bir öğrenme problemine genişleterek, dil modellerinin güvenliğini ve faydasını aynı anda artırabilecek yeni bir metodolojik yön önerir.

Özet(Abstract)

Dil modellerinin (LM) faydasını korurken güvenliğini sağlamak, yapay zeka hizalamasında hâlâ kritik bir zorluk olmaya devam ediyor. Mevcut yaklaşımlar, sıralı adversarial eğitime dayanıyor: adversarial prompt’lar üretmek ve LM’leri bunlara karşı savunma yapacak şekilde ince ayar yapmak. Biz farklı bir paradigma öneriyoruz: güvenlik hizalamasını, çevrimiçi pekiştirmeli öğrenme yoluyla ortaklaşa eğitilen bir Saldırgan LM ile Savunmacı LM arasındaki sıfır toplamlı olmayan bir oyun olarak çerçeveliyoruz. Her LM, diğerinin gelişen stratejilerine sürekli uyum sağlayarak yinelemeli iyileştirmeyi teşvik ediyor. Yöntemimiz, noktasal puanlar yerine ikili karşılaştırmalardan türetilen tercih tabanlı bir ödül sinyali kullanıyor; bu da daha sağlam bir denetim sunarken ödül hack’ini potansiyel olarak azaltıyor. RL reçetemiz AdvGame, güvenlik ve fayda arasındaki Pareto sınırını kaydırarak aynı anda hem daha yardımcı hem de adversarial saldırılara karşı daha dayanıklı bir Savunmacı LM ortaya çıkarıyor. Buna ek olarak, ortaya çıkan Saldırgan LM güçlü, genel amaçlı bir red-teaming test ajanına yakınsıyor ve rastgele hedef modelleri doğrudan yoklamak için devreye alınabiliyor. Kodlar github.com/facebookresearch/advgame adresinde.

Dil modellerinin (LM) faydasını korurken güvenliğini sağlamak, yapay zeka hizalamasında kritik bir zorluk olmaya devam ediyor. Mevcut yaklaşımlar sıralı adversarial eğitime dayanır: adversarial prompt’lar üretmek ve bunlara karşı savunma yapmaları için LM’leri ince ayar yapmak. Biz farklı bir paradigma sunuyoruz: güvenlik hizalamasını, çevrimiçi pekiştirmeli öğrenme ile ortaklaşa eğitilen bir Saldırgan LM ile Savunmacı LM arasındaki sıfır toplamlı olmayan bir oyun olarak çerçevelemek. Her LM, diğerinin gelişen stratejilerine sürekli uyum sağlayarak yinelemeli iyileştirmeyi yönlendirir. Yöntemimiz, noktasal puanlar yerine ikili karşılaştırmalardan türetilen tercih tabanlı bir ödül sinyali kullanır; bu, daha sağlam denetim sağlar ve ödül hack’ini potansiyel olarak azaltır. RL tarifimiz AdvGame, güvenlik ve faydanın Pareto sınırını kaydırarak aynı anda hem daha faydalı hem de adversarial saldırılara karşı daha dayanıklı bir Savunmacı LM üretir. Ayrıca, ortaya çıkan Saldırgan LM güçlü, genel amaçlı bir red-teaming ajanına yakınsar ve rastgele hedef modelleri yoklamak için doğrudan devreye alınabilir. Kodlar github.com/facebookresearch/advgame adresindedir.

Makale bağlantısı

https://arxiv.org/abs/2512.20806

Reklam

Daha fazlasını okuyun

https://github.com/facebookresearch/advgame


Planla, Gözlemle, Kurtar: Proaktif Prosedürel Yardım için Bir Benchmark ve Mimariler / Plan, Watch, Recover: A Benchmark and Architectures for Proactive Procedural Assistance

Makale tanıtımı

Gerçek dünyadaki prosedürel görevlerde kullanıcılar belirlenmiş sırayı her zaman birebir izlemediği için, yardımcı sistemlerin yalnızca bir sonraki adımı tahmin etmenin ötesine geçip ne zaman müdahale etmeleri gerektiğine ve nasıl yönlendirme yapacaklarına da karar verebilmesi gerekir. Bu problem anlayışı üzerine kurulan öneri, kullanıcının birinci şahıs görsel bilgisi, diyalog geçmişi ve sorgu bağlamına dayanarak mevcut durumu yorumlayan ve hatta plan dışı (out-of-plan, OOP) bir duruma girilip girilmediğini gerçek zamanlı tespit eden proaktif prosedürel yardıma odaklanıyor. Özellikle bu çalışmanın kilit noktası, müdahale edilip edilmeyeceği ile müdahalenin içeriğini birbirinden ayrı ele almasıdır; çünkü zamanlama kararı ile koçluk üretiminin optimizasyon hedefleri farklıdır. Kullanıcı normal prosedürden saptığında sessizce beklemek yerine uygun anda kısa ve doğru geri dönüş talimatları vermek gerekir; bunun için sistemin prosedürel durumu ve görsel ipuçlarını birlikte izlemesi gerekir.

Bu hedefi desteklemek için yazarlar önce EgoProactive adlı büyük ölçekli giyilebilir birinci şahıs veri kümesini oluşturdu ve buna açık plan dışına çıkma açıklamaları ile geri dönüş adımlarını (recovery steps) birlikte ekledi. Bu veri kümesi, gerçek ortamlarda ortaya çıkan sapma ve hataların öğrenilebilir hâle gelmesini sağlaması bakımından büyük önem taşıyor ve yalnızca doğrusal adım ilerleyişini varsayan mevcut kaynakların sınırlamalarını tamamlıyor. Ayrıca Ego4D, EPIC-KITCHENS, EgoExo4D, HoloAssist, HowTo100M olmak üzere beş mevcut benchmark’ı tek bir proaktif yönlendirme çerçevesi altında yeniden yapılandıran Pro²Bench sayesinde, farklı alanlarda müdahale zamanlaması ve geri dönüş koçluğu yeteneklerini tutarlı biçimde karşılaştırmaya imkân veren bir değerlendirme ortamı oluşturuldu. Bu, prosedür anlayışını basit bir sonraki adım tahmini probleminden çıkarıp gerçek etkileşim kalitesini ölçen bir probleme dönüştürmesi açısından önemlidir.

Model tarafında ise planlamadan sorumlu bileşen ile etkileşimden sorumlu bileşeni ayıran bir decoupled planner-interaction architecture öneriliyor; böylece prosedürel durum takibi ile yanıt üretimi gevşek biçimde bağlanmak yerine kendi rollerine uygun şekilde optimize ediliyor. Buna ek olarak, plana sabitlenmiş (plan-anchored) klip seçimi uygulanarak tüm videonun ayrım gözetmeden işlenmesi yerine, mevcut adım ve geri dönüş kararıyla doğrudan ilgili görsel bölümlerin öncelikli kullanılması sağlanıyor. Bu yaklaşım, uzun birinci şahıs videolarda gereksiz gürültüyü azaltırken plan dışına çıkma belirtilerini ve geri dönüş için gerekli ipuçlarını daha net yakalamayı mümkün kılıyor. Başka bir deyişle, bu mimari hem “ne söylenecek” hem de “ne görülecek” sorularını plan merkezli şekilde hizalayan bir yapı olarak görülebilir.

Ayrıca sonradan eğitim (post-training) reçetesi sayesinde, bu yöntemin yalnızca belirli bir modele özgü özel bir işlem değil, farklı backbone’lara aktarılabilir genel bir prosedür olduğu da gösterildi. Nitekim Llama 4 ve Qwen-3.6-VL üzerinde çapraz backbone yeniden üretimi yapılarak yöntemin taşınabilirliği doğrulandı; bu da gelecekte daha güçlü multimodal modellere kolayca genişletilebileceğine işaret ediyor. Deney sonuçlarında, eğitilmiş Llama-4 sistemi Claude Opus 4.6, Gemini 3.1 Pro, GPT 5.2 ve Qwen3 VL 235B gibi güçlü baseline’lara kıyasla altı veri kümesinin genelinde daha yüksek nesnel müdahale kalitesi (objective intervention quality) gösterdi. Özellikle oracle plan koşulunda, plan kalitesi kontrol edildiğinde geri dönüş yönlendirme performansı belirgin biçimde iyileşti ve bu da plan takibi ile müdahale üretiminin ayrıldığı yapının geçerliliğini açıkça destekledi. Genel olarak bu çalışma, prosedürel görevleri yerine getiren kullanıcılara yönelik multimodal yardımcıyı adım tahmin eden bir sistem olarak değil, gerçek zamanlı müdahale eden bir koç olarak yeniden tanımlıyor; ayrıca gerçek koşullara daha yakın veri, mimari ve eğitim stratejilerini birlikte sunması bakımından önem taşıyor.

Özet (Abstract)

Hedef özetin yapısını ve terminolojisini eşleştirerek, ilk cümleyi doğrudan Türkçeye çevirip ardından tüm özeti doğal ve akademik bir dille düzenleyerek çevireceğim.
Kullanıcılara prosedürel bir görevde gerçek zamanlı, adım adım rehberlik sunan; ne zaman araya gireceğine ve nasıl koçluk yapacağına otonom biçimde karar veren proaktif bir çok modlu asistan sistemi öngörüyoruz. Ancak ilerleme, özellikle kullanıcıların beklenen adım sırasından saptığı yaygın durumu yansıtan gerçekçi koşulları kapsayan büyük ölçekli, alanlar arası kıyaslama setlerinin yokluğu nedeniyle sınırlı kalmaktadır. Bu boşluğu dört katkıyla ele alıyoruz: (1) açık Plan Dışı (Out-of-Plan, OOP) açıklamaları ve toparlanma adımları içeren, proaktif prosedürel yardım için büyük ölçekli giyilebilir-egosantrik veri kümesi EgoProactive'i yayımlıyoruz; (2) yerleşik beş kıyaslama setini (Ego4D, EPIC-KITCHENS, EgoExo4D, HoloAssist, HowTo100M), birleşik bir proaktif rehberlik şeması altında Pro^2Bench olarak genişletiyoruz; (3) prosedürel durum, görsel ipuçları ve toparlanma ekleme için özelleştirilmiş ayrıştırılmış planlayıcı--etkileşim mimarisini öneriyoruz; (4) model aileleri arasında aktarılabilen bir sonradan eğitim reçetesi sunuyor ve bunu Llama 4 ile Qwen-3.6-VL üzerinde omurga-arası çoğaltımla doğruluyoruz. Kapsamlı deneylerde, eğitilmiş Llama-4 sistemimiz altı veri kümesinin tamamında güçlü kapalı ticari temel modellere (Claude Opus 4.6, Gemini 3.1 Pro, GPT 5.2) ve açık ağırlıklı temel modellere (Qwen3 VL 235B) kıyasla nesnel müdahale kalitesini önemli ölçüde artırmaktadır. Oracle-plan deneyleri ayrıca, plan kalitesi kontrol edildiğinde, eğitilmiş duplex modelin yüksek kaliteli rehberlik ürettiğini ve Plan Dışı (OOP) toparlanmada büyük kazanımlar sağladığını göstermektedir.

Kullanıcılara prosedürel bir görevde gerçek zamanlı, adım adım rehberlik sunan; ne zaman araya gireceğine ve nasıl koçluk yapacağına otonom biçimde karar veren proaktif bir çok modlu asistan sistemi öngörüyoruz. Ancak ilerleme, özellikle kullanıcıların beklenen adım sırasından saptığı yaygın durumu yansıtan gerçekçi koşulları kapsayan büyük ölçekli, alanlar arası kıyaslama setlerinin yokluğu nedeniyle sınırlı kalmaktadır. Bu boşluğu dört katkıyla ele alıyoruz: \textbf{(1)}~açık Plan Dışı (Out-of-Plan, OOP) açıklamaları ve toparlanma adımları içeren, proaktif prosedürel yardım için büyük ölçekli giyilebilir-egosantrik veri kümesi \textbf{EgoProactive}'i yayımlıyoruz; \textbf{(2)}~yerleşik beş kıyaslama setini (Ego4D, EPIC-KITCHENS, EgoExo4D, HoloAssist, HowTo100M), birleşik bir proaktif rehberlik şeması altında \textbf{Pro\textsuperscript{2}Bench} olarak genişletiyoruz; \textbf{(3)}~prosedürel durum, görsel ipuçları ve toparlanma ekleme için özelleştirilmiş bir \textbf{ayrıştırılmış planlayıcı--etkileşim mimarisi} öneriyoruz; \textbf{(4)}~model aileleri arasında aktarılabilen bir sonradan eğitim reçetesi sunuyor ve bunu Llama~4 ile Qwen-3.6-VL üzerinde omurga-arası çoğaltımla doğruluyoruz. Kapsamlı deneylerde, eğitilmiş Llama-4 sistemimiz altı veri kümesinin tamamında güçlü kapalı ticari temel modellere (Claude Opus~4.6, Gemini~3.1~Pro, GPT~5.2) ve açık ağırlıklı temel modellere (Qwen3~VL~235B) kıyasla nesnel müdahale kalitesini önemli ölçüde artırmaktadır. Oracle-plan deneyleri ayrıca, plan kalitesi kontrol edildiğinde, eğitilmiş duplex modelin yüksek kaliteli rehberlik ürettiğini ve Plan Dışı toparlanmada büyük kazanımlar sağladığını göstermektedir.

Makale bağlantısı

https://arxiv.org/abs/2606.04970

Daha fazla okuma

https://huggingface.co/datasets/facebook/wearable-ai


FuzzingBrain V2: Otomatik Güvenlik Açığı Keşfi ve Yeniden Üretimi için Çok Ajanlı LLM Sistemi / FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction

Makale tanıtımı

Yazılım güvenlik açıklarının yol açtığı güvenlik tehditleri her geçen gün daha da ciddileşirken, yalnızca 2025 yılında yaklaşık 50.000 CVE (Common Vulnerabilities and Exposures) raporlandı. Büyük dil modelleri (LLM), otomatik güvenlik açığı tespitinde yeni olanaklar sunsa da mevcut LLM tabanlı yaklaşımlar hâlâ çözülmesi gereken temel sorunlar barındırmaktadır. Özellikle, LLM'lerin ürettiği güvenlik açığı raporları yüksek yanlış pozitif oranları gösterirken aynı zamanda yeniden üretilebilir doğrulama mekanizmalarından yoksundur; güvenlik açığının tam konumunu saptamak için işlev düzeyi veya satır düzeyi gibi optimal olmayan ayrıntı düzeyleri kullanır; ayrıca karmaşık işlevler arası bağımlılıklar ve çok katmanlı tetikleme koşulları içeren güvenlik açıklarını etkili biçimde ele almakta zorlanır. Bu çalışmada sunulan FuzzingBrain V2, bu zorlukları sistematik olarak çözmek üzere tasarlanmış çok ajanlı bir LLM sistemidir ve Google'ın OSS-Fuzz çerçevesini doğrulama arka ucu olarak kullanarak raporlanan tüm güvenlik açıkları için %100 yeniden üretilebilirlik garanti eder. Sistem ayrıca kontrol akışı bilgisini içeren yeni bir soyutlama olan Suspicious Point'i tanıtarak işlev düzeyi ile satır düzeyi arasında en uygun noktada hassas güvenlik açığı konumlandırması sağlar; mantık tabanlı hiyerarşik işlev analizi ile birlikte çift katmanlı fuzzing stratejisi aracılığıyla kaynak kısıtları altında işlev kapsamını artırır. Buna ek olarak, Model Context Protocol tabanlı statik ve dinamik analiz araçları ile gelişmiş bağlam mühendisliğini kullanarak karmaşık güvenlik açığı akıl yürütmesini güçlendirir. AIxCC 2025 final yarışmasının C/C++ veri kümesinde FuzzingBrain V2, %90 tespit oranına (40 güvenlik açığının 36'sı) ulaşmış; gerçek operasyon ortamlarında ise 12 açık kaynak projede daha önce bilinmeyen toplam 41 güvenlik açığı keşfetmiş, bunların 26'sı doğrulanmış, 23'ü düzeltilmiş ve 2'sine CVE tanımlayıcısı atanmıştır. Bu sonuçlar, anlamsal analiz yeteneği ile yürütme tabanlı tespiti birleştiren çok ajanlı yaklaşımın, yalnızca akademik bir başarı olmanın ötesine geçerek gerçek üretim yazılımlarının güvenliğini doğrudan iyileştirebildiğini açıkça göstermektedir.

Özet (Abstract)

Yazılım açıkları ciddi güvenlik tehditleri oluşturur ve 2025 yılında yaklaşık 50.000 CVE raporlandı. Büyük dil modelleri (LLM'ler) otomatik açık tespitinde umut vadediyor, ancak üç temel zorluk sürüyor. Birincisi, LLM tarafından üretilen açık raporları yüksek yanlış pozitif oranlarına sahip ve tekrarlanabilir doğrulamadan yoksun. İkincisi, mevcut LLM tabanlı yaklaşımlar açık konumlandırması için en uygun olmayan ayrıntı düzeylerini kullanıyor. Fonksiyon düzeyindeki analiz, bağlam geniş olduğunda hataları gözden kaçırırken, satır düzeyindeki analiz yeterli bağlam sağlayamıyor. Üçüncüsü, mevcut yaklaşımlar karmaşık fonksiyonlar arası bağımlılıklara ve tetikleme koşullarına sahip açıklar üzerinde akıl yürütmekte zorlanıyor. Bu boşlukları dört temel katkı üzerinden ele alan çok etmenli bir sistem olan FuzzingBrain V2'yi sunuyoruz: (1) Google'ın OSS-Fuzz altyapısı üzerine kurulu, raporlanan tüm açıkların fuzzer ile yeniden üretilebilir olmasını garanti eden tamamen otomatik açık analizi; (2) doğru açık konumlandırması için kontrol akışı tabanlı yeni bir soyutlama olan Suspicious Point; (3) kaynak kısıtları altında fonksiyon kapsamını artıran çift katmanlı fuzzing ile mantık odaklı hiyerarşik fonksiyon analizi; (4) karmaşık açıklar üzerindeki akıl yürütmeyi güçlendiren bağlam mühendisliğiyle MCP tabanlı statik ve dinamik analiz araçları. AIxCC 2025 Final Competition C/C++ veri kümesinde FuzzingBrain V2 %90 tespit oranına ulaştı (40 açığın 36'sı). Gerçek dünyadaki dağıtımda ise FuzzingBrain V2, 12 açık kaynak projede 29 zero-day açığı buldu; bunların tamamı bakımcılar tarafından doğrulanıp düzeltildi ve 2 tanesine CVE ID atandı.

Software vulnerabilities pose critical security threats, with nearly 50,000 CVEs reported in 2025. While Large Language Models (LLMs) show promise for automated vulnerability detection, three key challenges remain. First, LLM-generated vulnerability reports suffer from high false positive rates and lack reproducible verification. Second, existing LLM-based approaches use suboptimal granularities for vulnerability localization: function-level analysis overlooks bugs when context becomes extensive, while line-level analysis lacks sufficient context. Third, existing approaches have difficulty reasoning about vulnerabilities with complex cross-function dependencies and triggering conditions. We present FuzzingBrain V2, a multi-agent system that addresses these gaps through four key contributions: (1) fully automated vulnerability analysis built on Google's OSS-Fuzz, ensuring all reported vulnerabilities are fuzzer-reproducible; (2) Suspicious Point, a novel control-flow-based abstraction for precise vulnerability localization at the optimal granularity; (3) logic-driven hierarchical function analysis with dual-layer fuzzing enhancing function coverage under resource constraints; (4) MCP-based static and dynamic analysis tools with context engineering enhancing complex vulnerability reasoning. On the AIxCC 2025 Final Competition C/C++ dataset, FuzzingBrain V2 achieved 90% detection rate (36 of 40 vulnerabilities). In real-world deployment, FuzzingBrain V2 discovered 29 zero-day vulnerabilities across 12 open-source projects, all confirmed and fixed by maintainers, with 2 assigned CVE IDs.

Makale bağlantısı

https://arxiv.org/abs/2605.21779


⚠️Reklam⚠️: 🔥PyTorch Kore Kullanıcı Topluluğu🇰🇷 tarafından derlenen bu yazıyı faydalı buldunuz mu? Üye olursanız önemli yazıları size e-posta💌 ile gönderiyoruz! Yeni yazı bildirimlerini Telegram veya Slack/Discord/Teams/Dooray/GoogleChat vb. üzerinden de alabilirsiniz. :D

Henüz yorum yok.

Henüz yorum yok.