- Birim uzaklık problemi, düzlemdeki n nokta arasında aralarındaki mesafe 1 olan nokta çiftlerinin en büyük sayısını soran 1946 tarihli bir Erdős problemidir ve uzun süredir kabul gören temel bir sanı çürütüldü
- OpenAI’nin genel amaçlı akıl yürütme modeli, kare ızgara ailesinin fiilen en iyi olduğu inancını yıkan sonsuz bir örnek ailesi kurdu ve polinom düzeyinde bir iyileştirme sundu
- Yeni yapı, sonsuz sayıda n için
n^{1+δ}'den fazla birim uzaklıklı nokta çifti üretiyor; Will Sawin’in iyileştirmesi iseδ = 0.014alınabileceğini gösteriyor - İspat, Gauss tamsayılarının ötesine geçerek sonsuz class field tower ve Golod–Shafarevich teorisi gibi cebirsel sayı teorisi araçlarını bir geometri problemine uyguluyor
- Sonuç, yapay zekanın eski açık problemlerde özgün matematiksel keşiflere katkı sunabileceğini gösterirken, insan uzmanlığının problem seçimi ve yorumlamada daha da önemli hale geldiğini ortaya koyuyor
Birim uzaklık probleminde atılım
- Birim uzaklık problemi, düzlemde yer alan n nokta arasında aralarındaki tam mesafe 1 olan nokta çiftlerinden en fazla kaç tane kurulabileceğini soran bir kombinatorik geometri problemidir
- Paul Erdős tarafından 1946’da ortaya atıldı; Brass, Moser, Pach’ın 2005 tarihli Research Problems in Discrete Geometry kitabı bu problemi “kombinatorik geometrinin en bilinen ve açıklaması en kolay problemi olabilir” diye tanımlıyor
- Princeton’lı kombinatorikçi Noga Alon, bunu Erdős’ün özellikle sevdiği problemlerden biri olarak tanıttı; Erdős bu problemin çözümüne para ödülü de koymuştu
- Uzun süre, kare ızgara ailesi yapılarının birim uzaklıklı nokta çifti sayısını fiilen en üst düzeye çıkardığına inanılıyordu
- OpenAI’nin iç modeli, bu eski sanıyı çürüten sonsuz bir örnek ailesi üretti ve polinom düzeyinde iyileştirme sağladı
- İspat, dışarıdan bir matematikçi grubu tarafından incelendi; bu matematikçiler ayrıca argümanı, arka planı ve sonucun anlamını ele alan eşlikçi bir makale de yazdı
- İspadın aslı unit-distance-proof.pdf, eşlikçi makale unit-distance-remarks.pdf, modelin düşünce zincirinin kısaltılmış sürümü ise unit-distance-cot.pdf adresinde görülebilir
Yapay zekanın bulduğu yaklaşım
- İspat, matematik için özel eğitilmiş bir sistemden, ispat stratejisi arama iskelesinden ya da birim uzaklık problemine özel bir sistemden değil, genel amaçlı bir akıl yürütme modelinden çıktı
- Değerlendirme, gelişmiş modellerin ön cephe araştırmalara katkı sunup sunamayacağını ölçmeye yönelik daha geniş bir çalışmanın parçası olarak Erdős problem derlemesi üzerinde yapıldı; bu problemde ise açık bir sorunu çözen bir ispat üretildi
- Matematik, problemler kesin tanımlı olduğu, aday ispatlar doğrulanabildiği ve uzun argümanların baştan sona tutarlı kalması gerektiği için akıl yürütme yeteneğini sınamak adına net bir alandır
- İspat, görünüşte temel bir geometri problemine cebirsel sayı teorisinden beklenmedik ve incelikli fikirler uyguluyor
- Tim Gowers, eşlikçi makalede bu sonucu “AI matematiğinde bir dönüm noktası” olarak nitelendiriyor
- Sayı teorisyeni Arul Shankar, bunun mevcut AI modellerinin insan matematikçilerin yardımcısı olmanın ötesine geçip özgün ve sofistike fikirler üretebildiğini ve bunları sonuna kadar taşıyabildiğini gösterdiğini söylüyor
Birim uzaklık probleminin matematiksel içeriği
- u(n), düzlemdeki n nokta arasında mümkün olan birim uzaklıklı nokta çifti sayısının maksimumu olarak tanımlanır
- Basit bir yapıda n nokta tek bir doğru üzerine konularak n−1 nokta çifti elde edilebilir; kare ızgara ise yaklaşık 2n nokta çifti üretir
- Önceden bilinen en iyi yapı, yeniden ölçeklenmiş kare ızgaradan geliyordu ve bir sabit C için
n^{1 + C / log log(n)}adet birim uzaklıklı nokta çifti üretiyordu log log(n), n büyüdükçe arttığı için üssün ek terimi 0’a gider; dolayısıyla bu yapının büyümesi doğrusalın yalnızca biraz üzerindedir- Onlarca yıl boyunca bu oranın fiilen en iyi olabileceğine yaygın biçimde inanıldı; Erdős teknik olarak
n^{1+o(1)}üst sınırını sanmıştı - Yeni sonuç bu sanıyı çürütüyor: sonsuz sayıda n için sabit bir
δ > 0var ve en azn^{1+δ}birim uzaklıklı nokta çifti içeren n noktalı yapılar kurulabiliyor - İlk AI ispatı açık bir δ değeri vermiyordu, ancak Princeton matematik profesörü Will Sawin’in sonraki iyileştirmesi
δ = 0.014alınabileceğini gösterdi
Neden şaşırtıcı bir sonuç
- 1946’da Erdős’ün özgün yapısından bu yana bilinen en iyi alt sınır esasen neredeyse hiç değişmemişti
- Bilinen en iyi üst sınır
O(n^{4/3}), Spencer, Szemerédi ve Trotter’ın 1984 tarihli çalışmasından geldi ve daha sonra Székely ile Katz ve Silier, Pach, Raz, Solymosi gibi araştırmacıların iyileştirmeleri ve ilişkili yapı çalışmaları olsa da özünde korundu - Matoušek ile Alon-Bucić-Sauermann, problemi düzlemde Öklid-dışı uzaklıklar için inceledi ve “çoğu” Öklid-dışı uzaklığın belli bir anlamda Erdős sanısına uyduğunu gösteren sonuçlar ortaya koyarak sanıyı destekledi
- Yeni yapının temel bileşenlerinin, geometri ve uzaklıkla doğrudan ilgisiz gibi görünen cebirsel sayı teorisinden gelmesi özellikle şaşırtıcı
- Cebirsel sayı teorisi, cebirsel sayı cisimleri denilen tamsayı genişlemeleri içinde çarpanlara ayırma gibi kavramları inceleyen alandır
Cebirsel sayı teorisinden gelen yeni teknik
- Yeni ispat, tanıdık geometrik fikirlerden başlıyor ama beklenmedik bir yöne doğru genişliyor
- Erdős’ün özgün alt sınırı,
a + bibiçimindeki Gauss tamsayıları üzerinden anlaşılabilir - Burada a ve b birer tamsayıdır, i ise −1’in kareköküdür
- Gauss tamsayıları sıradan tamsayıları genişletir ve tamsayılar gibi asal çarpanlara tekil ayrışım gibi özellikler taşır
- Tamsayıların ya da rasyonel sayıların bu tür genişlemelerine cebirsel sayı cisimleri denir
- Yeni argüman, Gauss tamsayılarının yerine cebirsel sayı teorisinin daha karmaşık genelleştirmelerini kullanıyor; daha zengin simetriler de daha fazla birim uzunluklu fark üretmeyi mümkün kılıyor
- Kesin argüman, gereken sayı cisimlerinin gerçekten var olduğunu göstermek için sonsuz class field tower ve Golod–Shafarevich teorisi gibi araçlar kullanıyor
- Bu fikirler cebirsel sayı teorisyenleri için iyi biliniyordu, ancak Öklid düzlemindeki bir geometri problemine etki etmesi büyük bir sürpriz olarak karşılandı
Matematik açısından anlamı
- Bir AI sisteminin etkin bir alanın merkezinde duran eski bir açık problemi otonom biçimde çözmesi, AI ile matematik arasındaki etkileşim için önemli bir an oluşturuyor
- Dışarıdan matematikçilerin hazırladığı eşlikçi çalışma, özgün çözümün tek başına göstermediği daha zengin bir tablo sunuyor
- Thomas Bloom, eşlikçi makalede, AI tarafından üretilen bir ispatın önemini değerlendirirken bu ispatın problem hakkında gerçekten yeni bir şey öğretip öğretmediğini ve ayrık geometriyi daha iyi anlamamızı sağlayıp sağlamadığını sormak gerektiğini yazıyor
- Bloom’a göre bu sonuç, sayı teorik yapıların bu tür sorular hakkında beklenenden çok daha fazla şey söyleyebileceğini ve gerekli sayı teorisinin son derece derin olabileceğini gösteriyor
- Bloom, önümüzdeki aylarda birçok cebirsel sayı teorisyeninin ayrık geometrinin diğer açık problemlerine yakından bakacağını öngörüyor
- Cebirsel sayı teorisi ile ayrık geometri arasındaki bu beklenmedik bağlantı, yalnızca belirli bir sanının çözümüyle sınırlı kalmıyor; ilgili problemlerin daha fazla araştırılmasına imkân veren bir köprü işlevi görüyor
- Bu sonuç, AI’nın yalnızca çözümlere değil, daha sonra insan anlayışıyla anlamı daha açık ve daha zengin hale gelen matematiksel keşiflere de katkı sunabileceğini gösteriyor
Neden önemli
- Daha iyi matematiksel akıl yürütme, AI’yı daha güçlü bir araştırma ortağı haline getirebilir
- Zor düşünce akışlarını tutarlı biçimde sürdürebilir, uzak bilgi alanları arasındaki fikirleri bağlayabilir ve uzmanların önceliklendirmemiş olabileceği umut verici yolları ortaya çıkarabilir
- Aşırı karmaşık ya da çok zaman aldığı için ele alınması zor problemler üzerinde araştırmacıların ilerleme kaydetmesine yardımcı olabilir
- Bu tür yetenekler matematiğin ötesinde biyoloji, fizik, malzeme bilimi, mühendislik ve tıpta da yararlı olabilir
- Karmaşık argümanları tutarlı biçimde sürdürebilir, birbirinden uzak bilgi alanlarını bağlayabilir ve uzman incelemesinden geçen çıktılar üretebilirse, bu daha otomatik araştırma sistemlerine giden uzun vadeli yolun bir parçası olur
- AI’nın araştırmanın yaratıcı kısmında, özellikle de AI araştırmasının kendisinde, çok ciddi bir rol üstlenmeye başladığı öne sürülüyor
- Bu ilerleme, son derece zeki sistemlerin hizalanması sorununu, AI geliştirmedeki bir sonraki aşamayı ve insan-AI işbirliğinin geleceğini anlama konusundaki aciliyeti artırıyor
- Ancak bu gelecek hâlâ insan muhakemesine bağlı
- Uzmanlık daha az önemli hale gelmiyor; tersine daha da değerli oluyor
- AI, keşfetme, öneri geliştirme ve doğrulama konularında yardımcı olabilir; ancak önemli problemleri seçmek, sonuçları yorumlamak ve sırada hangi soruların izleneceğine karar vermek insanlara düşüyor
1 yorum
Hacker News görüşleri
Bu HN başlığı moral bozucuydu ve hâlâ neden böyle hissettirdiğini düşünüyorum
OpenAI’nin basın bülteni tonundaki övgüleri bir kenara bırakınca, matematik araştırmalarında LLM’lerin rolü hakkında ilginç ve incelikli pek çok soru kalıyor
Sonuçla birlikte yayımlanan matematikçi yorumlarını, özellikle de Tim Gowers’ın söylediklerini mutlaka okumanızı tavsiye ederim
Ama yorumlar, 2023’ten beri tekrar eden LLM tartışmaları, itirazlar ve öfkeli karşı itirazların savaş alanına dönmüş
3 yıl önce çekilmiş cephe hatları üzerinden aynı kavgayı tekrar tekrar vermenin üzücü olup olmadığını ve 2 yıl sonra da hâlâ böyle olup olmayacağını merak ediyorum
Nietzsche’nin şu ünlü sözünü akılda tutarsanız hayat daha iyi olabilir: “Çirkin olanla savaşmak istemiyorum. Suçlamak da istemiyorum. Suçlayanları bile suçlamak istemiyorum. Bakışımı başka yöne çevirmek benim tek inkârım olmalı.”
Yapay zekâ yeteneklerini kanıtladıkça, çok sağlam bir iş güvencesi olmayan herkes için rahatsız edici bir yöne doğru denge kayıyor
İnsanların, yapay zekânın insan zekâsından oldukça farklı bir yetenek kümesine sahip olduğunu ve onu epey iyi tamamladığını kabul etmesi zaman alacak
Büyük ölçekte insan zekâsını ezip geçme ihtimali düşük ve buna oynayan şirketler geride kalacak
Bu tür konularda gerçek bir tartışma yapmak istiyorum ama herkes yalnızca kendi gerçekliğinin gerçek, karşı tarafın gerçekliğinin sahte olduğuna inandığı için ortam sürekli daha da sertleşiyor
HN’ye gelip sadece öfkelendiğimi fark edip uzun ara verdiğim çok oluyor
Bunu neden kendimize yaptığımızı bilmiyorum; oysa temelde çoğumuzun aynı şeyleri istediğini düşünüyorum
“LLM’ler sadece eğitim verisini enterpole ediyor” diyenlere: Ayer ve erken dönem Wittgenstein farklı yollardan da olsa, matematiksel doğruların dünya hakkında yeni olgular bildirmediğini düşünüyordu
İspatın, aksiyomlar, tanımlar, semboller ve kurallar içinde zaten örtük olarak bulunan şeyi açığa çıkardığı fikri son derece ilginç; ama bu yine de matematikçiye keşfin payesini vermekte sorun yaratmaz
O hâlde mevcut malzemenin yeniden birleştirilmesi diskalifiye edici değildir; yoksa Fields Medal sahiplerinin epey büyük kısmının ödülünü iade etmesi gerekir
İnsanlar da her alanda her yıl yeni bir boyut açan yenilikler üretemiyor
LLM’lerin “sadece” yeniden birleştirdiği söylenebilir ama Newton/Leibniz öncesi tüm cebir, geometri ve trigonometri literatürüyle eğitilmiş bir LLM’nin kalkülüsü çıkarıp çıkaramayacağından yine de şüpheliyim
Bununla birlikte bu tür yenilikler LLM’lerin güçlü olduğu alanlardan biri ve bu, insanların da yeniden birleştirici yenilikte iyi olma ihtiyacını ortadan kaldırmıyor
Yeni fikirleri sentezleme konusunda hâlâ insanların yapabildiği, LLM’lerin ise yapamadığı çok şey var gibi görünüyor
Tüm bu noktaların etrafına büyük bir dışbükey kılıf çizdiğinizde, LLM bu yapının içinde eğitildiği için mevcut noktalar arasında enterpolasyon yapıp yeni ama yine de o kılıfın içinde kalan noktalara ulaşabilir
Kılıfın dışındaki noktalara LLM’lerin ulaşıp ulaşamayacağı tartışmalı
Yalnızca kılıf içindeki yeni noktalara ulaşmak bile son derece faydalı
Pek çok yeni keşif ve ispat, belki de faydalı yeni keşif ve ispatların çoğu, zaten elimizde olanlardan hareketle ulaşılabilecek bu tür noktalardır
Sadece henüz kimse zaman ve emek ayırmadığı için keşfedilmemiş çok şey var ve LLM’ler bunu büyük ölçüde hızlandırabilir
Öte yandan, mevcut noktalardan ekstrapolasyon ya da enterpolasyonla ulaşılamayan, gerçekten yeni bir sıçrama gerektiren kılıf dışı noktalar da var
Newton fiziğinden genel göreliliğe geçiş böyle bir örnek olabilir
Demis Hassabis bir keresinde, yalnızca 1915 öncesi fizik bilgisiyle eğitilmiş bir yapay zekâya Merkür’ün yörüngesini gösterip onun bağımsız biçimde genel göreliliğe ulaşıp ulaşamayacağını AGI testi olarak önermişti
Bugünkü LLM’lerin böyle bir sıçrama yapabileceğinden şüpheliyim; çoğu insan da zaten bunu yapamaz
Einstein’a dâhi dememizin nedeni, tek başına genel göreliliğe sıçrayabilmiş olmasıdır; insanlarda bunun ara sıra ortaya çıktığına dair bir varlık kanıtımız var ama yapay zekâ tarafında bunu henüz görmedik
Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, Galois gibi kişiler matematiği bilimden çok sanat gibi ele aldı
Örneğin birçok kişi Riemann Hypothesis’i çözmek için muhtemelen yeni bir matematik türü gerektiğini düşünüyor; LLM’nin bunu bir anda icat etmesi ise pek olası görünmüyor
Bu anlamsız ve çok da ilgili değil
Deep Blue Kasparov’u yendiğinde her şey değişmemişti; hayvanlar da makineler de bazı boyutlarda her zaman insanlardan “daha iyi” olmuştu
Zaten tek bir cetvel yok; olsa bile ne tek boyutludur ne lineerdir ve herkesin cetveliyle uç noktaları zaman içinde değişir
Bu, yapay zekâ üstünlükçülerine zafer vermek anlamına da gelmez
LLM’ler çok faydalı araçlar ve dramatik biçimde gelişmeye devam edecekler ama bazı insanların temel saydığı her boyutta insanı aşamayacaklar
Yapay zekânın sayısallaştırılmış metrikler listesindeki bir çizgiyi geçtiği anda evrensel olarak insandan üstün kabul edileceği bir an gelmeyecek
Çünkü “önemli olan şeyin” kendisi özneldir
“Zaten örtük olarak içeriliyor” iddiasının doğru olması için matematiğin kapalı bir sistem olması gerekir ama bunun öyle olmadığı zaten kanıtlandı
Matematik kullanarak matematiğin dışına çıkabildiğimiz için Zermelo-Fraenkel gibi çeşitli aksiyomatik sabitleme pimleri gerekli hâle geldi
Nesnel olarak “matematik” diyebileceğimiz şeyin ne kadar büyük olduğunu aslında pek anlamıyoruz; bildiğimizi sandığımız matematik, daha büyük bir matematiğin parçası da olabilir, ciddi biçimde yanlış da olabilir
O daha büyük matematiğin aynı kapalı sistem özelliklerine sahip olup olmadığını da bilmiyoruz
Kod yazarken LLM’leri yoğun kullanan biri için bu çok da şaşırtıcı değil; sadece zaman meselesiydi
Matematikçiler yeni keşifler yapmak için matematiksel araçları yeni şekillerde üretir ve uygular
Bu, sezgiyi takip edip bağlantıları araştırmayı gerektiren devasa miktarda yinelemeli iştir
LLM’lerin “keşif” denen şeyin ne olduğuna dair bir sezgisi yok; bu yüzden gerçek anlamda keşif yaptıklarını söylemek zor, ama dar bir hedef doğrultusunda tüm matematik araçlarını Monte Carlo tarzında deneyip işe yarayanı bulabilir, sonra bunun üzerine eklemeler yapabilir ya da iyileştirmeleri birleştirebilir
Yazıyı okuyunca bu keşfin de tam olarak böyle göründüğünü düşündüm; LLM, “şaşırtıcı bağlantılar” kullanarak beklenen sonucu aşmış
Ama insanın koyduğu hedef, yapay zekânın kullandığı yeni yolun değerini anlayan insan kavrayışı ve kavramları keşfetmeyi mümkün kılan insan yapımı matematik dili olmadan sonucun bir anlamı yok
Neden yalnızca insan anlayışı geçerli sayılıyor
Bilgi neden sadece insan için olsun
Başka bir tür yerçekimi ile kuantum mekaniği arasındaki çelişkiyi çözse, bize açıklayana ve biz anlayana kadar bunun anlamı olmayacak mı
İlginç olan, bu ispatın, daha doğrusu çürütmenin, Erdős’ün özgün varsayımına karşı bir karşı örnek bularak ilerlemiş olması
Bağlantı verilen PDF’teki bir matematikçinin tepkisinde de dendiği gibi, bu bana gerçek varsayımın doğru olduğunu kanıtlamaktan biraz daha az ilginç geliyor
Bir varsayımın doğru olduğunu kanıtlamak için daha fazla kuramsal inşa gerekir
Varsayımın neden doğru olduğunu daha büyük bir teori çerçevesinde açıklamanız gerekir; oysa karşı örnekte modelin yapması gereken, daha gelişmiş bir arama biçimiyle doğru yapıyı bulmaktır
Elbette bu arama basit değil ve etkileyici; ayrıca karşı örnekle bağlantıyı kanıtlamak için de çok sayıda adım gerekti
Yine de bu, yeni ve derin matematik geliştirmekten çok, mevcut fikirleri birbirine bağlamaya daha yakın görünüyor
Bunu bu olağanüstü başarıyı küçümsemek için söylemiyorum; gerçekten bir yere varıldığını düşünüyorum
Tamamen sezgisel bir his ama modellerin, yeni matematik geliştirilmesini gerektiren daha karmaşık varsayımları kanıtlayabilecek kadar teori inşa edebilmelerine çok uzak olmadığını ve bunun daha uzun zaman ufuklarında çalışabilme meselesi olduğunu düşünüyorum
Çoğu durumda sınırları azar azar kemirerek problemi sadeleştirmeye çalışırsınız
Örneğin bir şeyin imkânsız olduğunu göstermek için önce sadece 5 olası aile kaldığını ispatlayabilir, sonra bunların 4’ünün imkânsız olduğunu gösterebilirsiniz
Böylece problemin %80’i çözülmüş olur ve karşı örnek ararken de arama uzayı %80 daralır
Karşı örnekte tahmin yürütüp sıçrama yapabilirsiniz; doğru çıkarsa sorun olmaz, ama ispatta bunu yapamazsınız
Öte yandan karşı örnek bulunduğunda, çıkmaz sokaklar genelde görünmez olur
Eğitim verisindeki şeyleri ne kadar uzun süre birleştirirseniz birleştirin bu değişmez
Daha önce de dediğim gibi, yapay zekâ McDonald’s işletmeden önce Fields Medal kazanacak
Zor kısım, matematiğin oynanacağı satranç tahtasını, yani Lean gibi ortamları kurmaktı; şimdi mesele desen tanıma ve hesaplama
LLM’ler sadece başlangıç; yakında Stockfish’e benzeyen daha uzmanlaşmış matematik yapay zekâları göreceğiz
Tamamen doğal dil girdi ve çıktısıyla yapılmış ve birçok açıdan bunun tam tersini gösteren oldukça ilginç bir gösterim bence
Doğrulama, ispat denetimini de bilgisayara bırakmak istediğiniz noktada devreye girer
Bu ispat şu anda ilgili alandaki bir grup matematikçi tarafından elle doğrulandı
Orada çok sayıda “ters kentor” otomasyonu vardı
Manna her an yapılması gereken işler listesine sahipti ve kasadan sipariş geldiğinde çalışanlara o yemeği hazırlamalarını söylüyordu
Tuvalet temizliği, yer silme, masa silme, kaldırım süpürme, ekmek çözme, stok döndürme, cam silme gibi yüzlerce işi takip ediyor ve çalışanlara teker teker atıyordu
Vardiya bitince Manna her zaman “bugünlük işiniz bitti. Yardımınız için teşekkür ederiz” derdi; sonra kulaklığı çıkarıp şarj yuvasına koyardınız
6-8 saat boyunca kafanızın içindeki bir ses size çok ayrıntılı biçimde ne yapmanız gerektiğini söylediği için, kulaklığı çıkardıktan sonraki ilk birkaç dakika hep kafam karışırdı; restorandan çıkabilmek için beynimi yeniden çalıştırmam gerekirdi
[0] https://en.wikipedia.org/wiki/Manna_(novel)
Fields Medal ise bunların da epey sonrasında gelir
Saçmalık olup olmadığını anlamak için insan uzman doğrulaması gerekiyor
Lean burada özel bir şey değil; biraz sürü psikolojisi gibi
Ayrıca Lean eğitiminin bu spesifik modele ne kadar yardımcı olduğunu da bilmiyoruz
Bu ispat, cebirsel sayı teorisinden gelen beklenmedik ve incelikli fikirleri temel bir geometri sorusuna uyguluyor
Bu tür sonuçları okudukça, modelin gücünün önemli bir kısmının, mümkün olan tüm alanlar hakkında önbilgiye sahip olmasından ve bunu yeni alanlara aktarmakta zorlanmamasından geldiği hissi oluşuyor
Bu araçların potansiyel güzelliği, bugün bilimde insanların yaşadığı aşırı uzmanlaşma bariyerlerini aşmamıza yardımcı olabilmeleri
Aşırı uzmanlaşma bir yandan önemli ama öte yandan insanların erişebileceği araçları ve ilham kaynaklarını da sınırlıyor
Ne kadar aşırı uzmanlaşırsak, LLM’ler de farklı ufukları birleştirmede o kadar değerli bir araç oluyor
Eskiden buna erişmenin maliyeti yüksekti ama artık öyle değil
Harika olan şu ki, biri bu kolektif zekâya bir şey kattığında, bu hemen başkalarının üzerinde çalıştığı herhangi bir probleme uygulanabilir hâle geliyor
Belki de LLM’ler ilgili alana dair daha yatay bir anlayış geliştirmeye yardımcı olabilir
Bu genel amaçlı bir model olduğu için fizik, biyoloji, tarih vb. alanlarda da doktora üstü düzeyde bilgiye sahip
Bu kadar çok alan bilgisini içselleştirmiş tek bir “zihnin” neler yapabileceğini henüz tam olarak kavrayamadığımızı düşünüyorum
OpenAI modelin “doktora düzeyinde zekâ” kazanacağını söylediğinde herkes gülüyordu; şimdi çıtanın yeni matematik yapabilmek seviyesine taşınmış olması ilginç
Yani mesele doktora düzeyi değil, Leibniz, Euler, Galois düzeyini istemek olmuş
Blog yazısında bağlantı verilen bu çalışmanın özetlenmiş düşünce süreci 125 sayfa
Bu, Anthropic’in Mythos ile ima ettiği şeye oldukça benzeyen, akıl almaz ölçekte bir çıkarım ölçeklenmesi
Neden hep Erdős problemlerini çözdüğüne dair haberler duyduğumuzu merak ediyorum
Matematikte bir sürü çözülmemiş problem var ama r/singularity ve r/accelerate’te gördüğüm ChatGPT “matematik atılımlarının” hepsi Erdős problemi gibi görünüyor
İnsanların dikkatini çekecek kadar ünlüler ama aynı zamanda insanların büyük emek harcayacak kadar ilginç bulmadığı problemler de olabiliyorlar
Birinin zaten ortaya koyduğu problemi çözmek, matematik araştırmasında biraz niş bir faaliyet
Daha yaygın olan, ilginç bir nesneyi inceleyip bunu elinizdeki araçlarla çözülebilecek şekilde çerçevelemek ve sonra çözüm aramaktır
İdeal durumda hem problem kurulumu hem de çözüm kendi başına ilginç olur
Bir asır önceki Hilbert problemleri gibi
Bunun etkileyici olduğu kesin
Ama bu modelin neyle eğitildiğini bilmiyorsak, ne kadarına gerçekten “kendi başına” ulaştığını değerlendirmek çok zor
Yapay zekâ sektörü genelinde, birçok alandaki uzmanlara para ödenip büyük miktarda yeni eğitim verisi üretildi
Bunlar başka hiçbir yerde bulunmayan yeni eğitim verileri ve şirketler bunları biriktiriyor; içlerinde gerçekten özgün fikirler de olabilir
Birinin bu problemi çözüp doğrudan eğitim verisine koymuş olması düşük ihtimal ama dürüst olmak gerekirse, konu OpenAI olunca bunun kesinlikle yapılmadığını da söyleyemem
Daha ilginç ihtimal, bu ispatta “özgün” görünen temel önermelerin çoğunu ya da tamamını temas eden eğitim verilerinin zaten üretilmiş olması
Elbette bunu bilemeyiz
Ama bu tür şeyler gizli kapaklı olmayan bir biçimde üretilene kadar bu soru hep ortada kalacak