- Ollama, modellerin halüsinasyonlarını azaltmaya ve doğruluğu artırmaya yardımcı olmak için güncel web bilgisi arama özelliğini API olarak kullanıma sundu
- Ücretsiz hesaplara da cömert bir ücretsiz arama kotası dahil edilirken, sık kullanım ihtiyacı olanlar Ollama Cloud üzerinden daha yüksek limitlere erişebiliyor
- REST API tabanlı yapı, Python ve JavaScript kütüphaneleri ile entegre oluyor; böylece OpenAI’nin
gpt-oss gibi modelleri uzun süreli araştırma işleri yürütebiliyor
web_search ve web_fetch özellikleri, binlerce token düzeyinde sonuçlar döndürüyor ve MCP sunucusu üzerinden Cline, Codex, Goose gibi çeşitli araçlarla entegrasyon desteği sağlıyor
- Bu sayede doğrudan arama ajanları inşa etmek mümkün hale geliyor ve yapay zeka modellerinin güncel verilerle etkileşim kurma esnekliği büyük ölçüde genişliyor
Ollama web arama özelliğine giriş
- Ollama, web arama API’sini yayımlayarak yapay zeka modellerine anında güncel web bilgisi sunulabilen bir ortam sağlıyor
- Bu sayede halüsinasyon olgusunun azalması ile birlikte doğruluk artışı beklenebiliyor
- Bireysel kullanıcılara cömert bir ücretsiz arama kotası sunuluyor; daha yüksek kullanım gerektiğinde Ollama Cloud aboneliği üzerinden kota genişletilebiliyor
- REST API olarak sunuluyor ve Python ile JavaScript kütüphaneleri üzerinden gelişmiş araç entegrasyonları destekleniyor
- Bu yapı sayesinde gpt-oss gibi çeşitli modeller uzun soluklu araştırma ve arama görevleri yürütebiliyor
API kullanım örnekleri
- Ollama hesabından alınan API anahtarıyla
cURL, Python’da ollama.web_search(), JavaScript’te client.webSearch() çağrıları yapılabiliyor
- Sonuçlar, başlık, URL ve içerik özeti içeren bir JSON yapısı olarak dönüyor
web_fetch API’si kullanıldığında, URL bazında sayfa içeriği gövde metni ve bağlantı listesiyle birlikte alınabiliyor
Web arama tabanlı arama ajanı geliştirme
- Ollama API, Qwen3, gpt-oss gibi modellerle birleştirilerek otomatik çok turlu arama ajanları geliştirmeye imkan veriyor
- Örnek kodda Qwen3:4B modeli kullanılarak arama → çıkarım → sonuç özeti süreci otomatikleştiriliyor
- Arama sonuçlarına dayanarak "Thinking" sürecinden geçiliyor ve arama/fetch araç çağrılarının sonuçları tekrar tekrar kullanılarak karmaşık araştırma ya da keşif senaryoları yürütülüyor
- Ollama motorunun yeni güncellemesi; doğru bellek yönetimi, GPU/çoklu GPU optimizasyonu, performans artışı ve vision (multimodal) modellere yönelik kapsamlı desteği de içeriyor
Önerilen modeller ve performans notları
- Güçlü araç kullanım yeteneğine sahip bulut modelleri öneriliyor:
qwen3:480b-cloud, gpt-oss:120b-cloud, deepseek-v3.1-cloud
- Arama ve fetch araçları binlerce tokenlık veri döndürebildiği için modelin bağlam uzunluğunun yaklaşık 32000 token seviyesine çıkarılması tavsiye ediliyor
Tekil web sayfası fetch özelliği
- Web aramaya ek olarak, belirli bir web sayfasının metnini ve bağlantı yapısını doğrudan fetch edebilen API ve fonksiyonlar da sunuluyor
- Python, JavaScript veya cURL ile url parametresi basitçe iletilerek sayfanın
title, content ve bağlı bağlantıları çıkarılabiliyor
- Daha ayrıntılı örnek kodlar resmi GitHub deposunda bulunabiliyor
Araç ve ajan entegrasyonu
web_search, web_fetch binlerce token düzeyinde veri döndürdüğü için model bağlamının 32K ve üzerine çıkarılması öneriliyor
- MCP sunucusu desteğiyle Cline, Codex, Goose gibi yapay zeka geliştirme ortamlarıyla doğrudan entegrasyon mümkün
- Python ve JavaScript örnek kodları resmi GitHub deposunda sunuluyor
Başlarken
- Web arama, ücretsiz Ollama hesabı ile varsayılan olarak sunuluyor; daha yüksek kullanım için ücretli abonelik kullanılabiliyor
- Ollama web sitesinde hesap oluşturup API anahtarı alarak hizmet hemen kullanılabiliyor
3 yorum
Ücretsiz ollama ile bunun pratikte kullanılabilecek bir seviyede olacağını sanmıyorum..
Fiyatlandırma sayfasında da kota hakkında bir açıklama yok, bu yüzden buna değip değmeyeceğini kestiremiyorum.
Hacker News görüşleri