1 puan yazan GN⁺ 2025-02-25 | 2 yorum | WhatsApp'ta paylaş

Duyuru

  • Claude 3.7 Sonnet ve Claude Code duyuruldu. Claude 3.7 Sonnet, piyasadaki ilk hibrit akıl yürütme modeli olarak hızlı yanıtlar ve adım adım düşünme sunuyor. API kullanıcıları modelin düşünme süresini ayrıntılı biçimde ayarlayabiliyor.
  • Claude 3.7 Sonnet, özellikle kodlama ve frontend web geliştirmede güçlü performans gösteriyor. Claude Code ise terminalden doğrudan mühendislik işlerini devretmeye olanak tanıyan bir komut satırı aracı olarak sınırlı bir araştırma önizlemesi şeklinde sunuluyor.
  • Claude 3.7 Sonnet; tüm Claude planlarında, Anthropic API’de, Amazon Bedrock’ta ve Google Cloud’un Vertex AI hizmetinde kullanılabiliyor. Genişletilmiş düşünme modu, ücretsiz Claude katmanı hariç tüm platformlarda kullanılabiliyor.

Claude 3.7 Sonnet: pratik, son teknoloji akıl yürütme

  • Claude 3.7 Sonnet, mevcut akıl yürütme modellerinden farklı bir felsefeyle geliştirildi. İnsanların hızlı yanıt vermek ve derinlemesine düşünmek için tek bir beyin kullanması gibi, akıl yürütmenin de birleşik bir yetenek olması gerektiğine inanılıyor.
  • Claude 3.7 Sonnet, genel amaçlı LLM ile akıl yürütme modelini tek bir yapıda birleştirerek kullanıcıların normal yanıt ile derin düşünme arasında seçim yapabilmesini sağlıyor. Genişletilmiş düşünme modunda matematik, fizik ve kodlama gibi alanlarda performans artıyor.
  • Claude 3.7 Sonnet API üzerinden kullanıldığında, kullanıcılar düşünme için ayrılan bütçeyi ayarlayabiliyor. Bu da yanıtın hızını ve kalitesini kontrol etmeyi mümkün kılıyor.
  • Claude 3.7 Sonnet, matematik ve bilgisayar bilimi problemlerinden çok gerçek iş kullanım senaryolarına odaklanıyor. İlk testlerde özellikle kodlama yeteneğinde güçlü sonuçlar gösterdi.

Claude Code

  • Claude Code, geliştiricilerin kod araması yapmasına, dosya düzenlemesine, test çalıştırmasına ve GitHub’a kod commit edip push etmesine yardımcı olan bir araç.
  • Claude Code; test odaklı geliştirme, karmaşık sorunların debug edilmesi ve büyük ölçekli refactoring çalışmalarında özellikle kullanışlı. İlk testlerde geliştirme süresini önemli ölçüde kısalttı.
  • Claude Code’un amacı, geliştiricilerin Claude’u nasıl kullandığını anlayıp bunu gelecekteki model iyileştirmelerine yansıtmak.

Claude ile kod tabanı üzerinde çalışmak

  • Claude.ai’de kodlama deneyimi iyileştirildi. GitHub entegrasyonu artık tüm Claude planlarında kullanılabildiği için geliştiriciler kod depolarını doğrudan Claude’a bağlayabiliyor.
  • Claude 3.7 Sonnet, kişisel, iş ve açık kaynak projelerine dair derin anlayışı sayesinde hata düzeltme, özellik geliştirme ve dokümantasyon yazımında güçlü bir iş ortağı haline geliyor.

Sorumlu biçimde inşa etmek

  • Claude 3.7 Sonnet, güvenlik, emniyet ve güvenilirliği sağlamak için dış uzmanlarla birlikte kapsamlı test ve değerlendirmelerden geçirildi.
  • Yeni güvenlik sonuçlarını ele alan bir sistem kartı sunuluyor. Bu kart, diğer yapay zeka laboratuvarları ve araştırmacıların da uygulayabileceği sorumlu ölçeklendirme politikası değerlendirmelerini içeriyor.

Geleceğe doğru

  • Claude 3.7 Sonnet ve Claude Code, insan yeteneklerini artırabilen yapay zeka sistemlerine doğru atılmış önemli bir adım. Derin akıl yürütme, otonom çalışma ve etkili iş birliği yoluyla insan başarısını genişletiyorlar.
  • Yeni özelliklerin keşfedilmesi ve üretim yapılması heyecanla bekleniyor; sürekli iyileştirme için geri bildirimler memnuniyetle karşılanıyor.

2 yorum

 
GN⁺ 2025-02-25
Hacker News görüşleri
  • Claude 3.7 Sonnet, Aider çok dilli liderlik tablosunda %60,4 aldı

    • Düşünme olmadan da yüksek bir puan aldı ve Sonnet 3.5'in sonucunu geçti
    • Aider 0.75.0, 3.7 Sonnet'i destekliyor
    • Yakında düşünme desteği ve benchmark sonuçları gelecek
  • Claude Code ekibinden Boris, ürünle ilgili soruları yanıtlayacak

  • Kagi LLM benchmark'ı, Sonnet 3.7'nin genel amaçlı ve düşünme modu ile güncellendi

    • Gemini 2.0 pro'dan sonra en güçlü ikinci genel amaçlı LLM olarak değerlendiriliyor
    • Düşünme modunda o1-mini ve o3-mini ile benzer seviyede
    • Genel olarak aynı fiyata yüksek kalite ve hız sunuyor
    • 24 saat içinde Kagi Assistant'ta etkinleştirilecek
  • HN profilini analiz edebilen eğlenceli bir özellik var

    • Yeni modelin mizahını test etmek için kullanılıyor
  • OpenAI, LLM'lerin gerçek iş süreçlerinde nasıl kullanıldığına odaklanıyor

    • "En akıllı model" hedefleniyor, ancak pratikte daha çok öğrenme desteği, veri dönüştürme ve kod yazımı için kullanılıyor
    • "Zeka" ile "pratik fayda" arasındaki denge önemli
  • Anthropic'in koda odaklanması mantıklı görünüyor

    • Devin rakibinin nasıl olacağı merak ediliyor
  • Cursor en son sürüme güncellendi ve model listesine "claude-3.7-sonnet" eklendi

    • "claude-3.7-sonnet-thinking" de çalışıyor
    • Yakında düşünme süresi kontrol özelliği eklenecek
  • Claude 3.7 Sonnet ile ilk etkileşimde çok etkilendim

    • CloudFlare Pages Functions ile ilgili bir sorunun çözümünde yardım aldı
    • Claude 3.7 sorunu doğru şekilde tespit edip bir çözüm önerdi
  • Claude, 30 saniyede lisans tezinin yarısını yeniden yazdı

    • Gemini Flash 2 başarısız oldu
  • o1 pro birkaç kez şaşırtıcı performans gösterdi

    • Karmaşık MCU kodunu incelemede yardım aldı
    • o1 pro, SPI kullanan kodu anlayıp sorunu işaret etti
    • Claude 3.7'nin düşünme modu o kadar da faydalı değildi
    • o1 pro, IPsec VPN sorununu çözmede yardım etti
    • ChatGPT ve Claude karşılaştırılarak kullanılıyor
 
riskatcher 2025-02-25

flash 2 ile karşılaştırmak için fiyat farkı fazla büyük.. tam olarak o1pro ile o3-mini arasında bir seviye