mathstodon.xyz tanıtımı
- mathstodon.xyz, Mastodon tabanlı merkeziyetsiz sosyal ağın bir parçası olan, matematikle ilgili kullanıcılar için bir instance.
- Web arayüzünde LaTeX render etmeyi destekliyor.
- Yönetici: Christian Lawson-Perfect (@christianp)
- Sunucu istatistikleri: 3K aktif kullanıcı
Terence Tao'nun GPT-o1 deneyi
- GPT-o1: OpenAI'nin yeni GPT sürümü; LLM çalıştırılmadan önce ilk akıl yürütme aşamasını gerçekleştiriyor.
- Deney 1: Belirsiz bir matematik sorusuna verdiği yanıtta Cramer's theorem'ı doğru şekilde tanımladı ve tatmin edici bir cevap sundu.
- Önceki sürüm ilgili kavramlardan söz etmişti ancak ayrıntılar yanlıştı.
- Deney 2: Karmaşık bir analiz problemi karşısında çok sayıda ipucu ve yönlendirmeyle doğru çözüme ulaştı, ancak temel kavramsal fikri kendi başına üretemedi ve birkaç hata yaptı.
- Önceki modellere göre gelişmiş olsa da hâlâ yetersiz.
- Gelecekte birkaç iyileştirmeyle araştırma düzeyindeki işlerde faydalı olabilir.
- Deney 3: Sonucu Lean'de formelleştirme görevinde problemi iyi anladı ve başlangıç ayrıştırmasını iyi yaptı, ancak güncel Lean bilgisi eksik olduğundan kodda çeşitli hatalar vardı.
- Lean ve Mathlib'e özelleşmiş bir model, entegre bir IDE içinde çok faydalı olabilir.
Ek tartışma
- Yapay zeka araçlarının gelişimi: Çeşitli araştırma işlerini ele alabilen bir yapay zeka araçları ekosisteminin ortaya çıkması bekleniyor.
- Şu anda büyük, genel amaçlı LLM'ler ilgi görüyor; ancak belirli uygulamalara uyarlanmış hafif açık kaynak modellerin de önemli bir rol oynaması bekleniyor.
- Yapay zeka ve lisansüstü öğrenci karşılaştırması: Yapay zeka araçlarının lisansüstü öğrenci düzeyinde katkı sağlayıp sağlayamayacağına dair tartışma.
- Şu anda bir lisansüstü öğrenciden daha fazla emek gerektiriyor, ancak önümüzdeki birkaç yıl içinde bu oranın 1'in altına düşmesi mümkün olabilir.
# GN⁺ özeti
- Terence Tao, matematiksel problem çözme yeteneğini değerlendirmek için OpenAI'nin yeni GPT-o1 modelini test etti.
- GPT-o1, önceki sürümlere göre gelişmiş olsa da hâlâ bazı sınırlamalara sahip.
- Gelecekte birkaç iyileştirmeyle araştırma düzeyindeki işlerde faydalı olabilir.
- Çeşitli yapay zeka araçlarının araştırma çalışmalarını destekleyebileceği bir ekosistemin ortaya çıkması bekleniyor.
- Şu anda büyük, genel amaçlı LLM'ler öne çıkıyor; ancak belirli uygulamalara uyarlanmış hafif açık kaynak modellerin de önemli bir rol oynaması bekleniyor.
1 yorum
Hacker News görüşleri
GPT, Python gibi Lean (ispat yardımcısı) için de iyi ayarlanırsa araştırma düzeyindeki matematikte daha faydalı olabilir beklentisi var
2019'a dönüp Alexa ile etkileşim deneyiminin "vasat ama tamamen beceriksiz olmayan bir yüksek lisans öğrencisine akıl vermeye benzemesi" şeklinde anlatıldığını okuduğunuzu hayal edin
o1 modeli oldukça şaşırtıcı
O1 modeliyle ilgili deneyimler çok farklı
LLM'lerin çeşitli konularda "vasat ama tamamen beceriksiz olmayan bir yüksek lisans öğrencisine akıl vermeye benzemesi" yeni olan şey
İnsanlar da "düşünce zinciri" türü akıl yürütmeden fayda görebilir
Terence Tao'nun görüşüne katılıyorlar
Matematiği bağımsız bir hobi olarak yeniden çalışmak heyecan verici geliyor
Terence Tao'nun görüşü şaşırtıcı bulunuyor
Daniel Litt, o1-preview'dan etkilendi ama ilginç matematik problemlerini çözmede henüz şanslı değil