OpenAI modeli ayrık geometrinin temel sanısını çürüttü

(openai.com)

1 puan yazan GN⁺ 2026-05-21 | 2 yorum | WhatsApp'ta paylaş

Birim uzaklık problemi, düzlemdeki n nokta arasında aralarındaki mesafe 1 olan nokta çiftlerinin en büyük sayısını soran 1946 tarihli bir Erdős problemidir ve uzun süredir kabul gören temel bir sanı çürütüldü
OpenAI’nin genel amaçlı akıl yürütme modeli, kare ızgara ailesinin fiilen en iyi olduğu inancını yıkan sonsuz bir örnek ailesi kurdu ve polinom düzeyinde bir iyileştirme sundu
Yeni yapı, sonsuz sayıda n için n^{1+δ}'den fazla birim uzaklıklı nokta çifti üretiyor; Will Sawin’in iyileştirmesi ise δ = 0.014 alınabileceğini gösteriyor
İspat, Gauss tamsayılarının ötesine geçerek sonsuz class field tower ve Golod–Shafarevich teorisi gibi cebirsel sayı teorisi araçlarını bir geometri problemine uyguluyor
Sonuç, yapay zekanın eski açık problemlerde özgün matematiksel keşiflere katkı sunabileceğini gösterirken, insan uzmanlığının problem seçimi ve yorumlamada daha da önemli hale geldiğini ortaya koyuyor

Birim uzaklık probleminde atılım

Birim uzaklık problemi, düzlemde yer alan n nokta arasında aralarındaki tam mesafe 1 olan nokta çiftlerinden en fazla kaç tane kurulabileceğini soran bir kombinatorik geometri problemidir
Paul Erdős tarafından 1946’da ortaya atıldı; Brass, Moser, Pach’ın 2005 tarihli Research Problems in Discrete Geometry kitabı bu problemi “kombinatorik geometrinin en bilinen ve açıklaması en kolay problemi olabilir” diye tanımlıyor
Princeton’lı kombinatorikçi Noga Alon, bunu Erdős’ün özellikle sevdiği problemlerden biri olarak tanıttı; Erdős bu problemin çözümüne para ödülü de koymuştu
Uzun süre, kare ızgara ailesi yapılarının birim uzaklıklı nokta çifti sayısını fiilen en üst düzeye çıkardığına inanılıyordu
OpenAI’nin iç modeli, bu eski sanıyı çürüten sonsuz bir örnek ailesi üretti ve polinom düzeyinde iyileştirme sağladı
İspat, dışarıdan bir matematikçi grubu tarafından incelendi; bu matematikçiler ayrıca argümanı, arka planı ve sonucun anlamını ele alan eşlikçi bir makale de yazdı
İspadın aslı unit-distance-proof.pdf, eşlikçi makale unit-distance-remarks.pdf, modelin düşünce zincirinin kısaltılmış sürümü ise unit-distance-cot.pdf adresinde görülebilir

Yapay zekanın bulduğu yaklaşım

İspat, matematik için özel eğitilmiş bir sistemden, ispat stratejisi arama iskelesinden ya da birim uzaklık problemine özel bir sistemden değil, genel amaçlı bir akıl yürütme modelinden çıktı
Değerlendirme, gelişmiş modellerin ön cephe araştırmalara katkı sunup sunamayacağını ölçmeye yönelik daha geniş bir çalışmanın parçası olarak Erdős problem derlemesi üzerinde yapıldı; bu problemde ise açık bir sorunu çözen bir ispat üretildi
Matematik, problemler kesin tanımlı olduğu, aday ispatlar doğrulanabildiği ve uzun argümanların baştan sona tutarlı kalması gerektiği için akıl yürütme yeteneğini sınamak adına net bir alandır
İspat, görünüşte temel bir geometri problemine cebirsel sayı teorisinden beklenmedik ve incelikli fikirler uyguluyor
Tim Gowers, eşlikçi makalede bu sonucu “AI matematiğinde bir dönüm noktası” olarak nitelendiriyor
Sayı teorisyeni Arul Shankar, bunun mevcut AI modellerinin insan matematikçilerin yardımcısı olmanın ötesine geçip özgün ve sofistike fikirler üretebildiğini ve bunları sonuna kadar taşıyabildiğini gösterdiğini söylüyor

Birim uzaklık probleminin matematiksel içeriği

u(n), düzlemdeki n nokta arasında mümkün olan birim uzaklıklı nokta çifti sayısının maksimumu olarak tanımlanır
Basit bir yapıda n nokta tek bir doğru üzerine konularak n−1 nokta çifti elde edilebilir; kare ızgara ise yaklaşık 2n nokta çifti üretir
Önceden bilinen en iyi yapı, yeniden ölçeklenmiş kare ızgaradan geliyordu ve bir sabit C için n^{1 + C / log log(n)} adet birim uzaklıklı nokta çifti üretiyordu
log log(n), n büyüdükçe arttığı için üssün ek terimi 0’a gider; dolayısıyla bu yapının büyümesi doğrusalın yalnızca biraz üzerindedir
Onlarca yıl boyunca bu oranın fiilen en iyi olabileceğine yaygın biçimde inanıldı; Erdős teknik olarak n^{1+o(1)} üst sınırını sanmıştı
Yeni sonuç bu sanıyı çürütüyor: sonsuz sayıda n için sabit bir δ > 0 var ve en az n^{1+δ} birim uzaklıklı nokta çifti içeren n noktalı yapılar kurulabiliyor
İlk AI ispatı açık bir δ değeri vermiyordu, ancak Princeton matematik profesörü Will Sawin’in sonraki iyileştirmesi δ = 0.014 alınabileceğini gösterdi

Neden şaşırtıcı bir sonuç

1946’da Erdős’ün özgün yapısından bu yana bilinen en iyi alt sınır esasen neredeyse hiç değişmemişti
Bilinen en iyi üst sınır O(n^{4/3}), Spencer, Szemerédi ve Trotter’ın 1984 tarihli çalışmasından geldi ve daha sonra Székely ile Katz ve Silier, Pach, Raz, Solymosi gibi araştırmacıların iyileştirmeleri ve ilişkili yapı çalışmaları olsa da özünde korundu
Matoušek ile Alon-Bucić-Sauermann, problemi düzlemde Öklid-dışı uzaklıklar için inceledi ve “çoğu” Öklid-dışı uzaklığın belli bir anlamda Erdős sanısına uyduğunu gösteren sonuçlar ortaya koyarak sanıyı destekledi
Yeni yapının temel bileşenlerinin, geometri ve uzaklıkla doğrudan ilgisiz gibi görünen cebirsel sayı teorisinden gelmesi özellikle şaşırtıcı
Cebirsel sayı teorisi, cebirsel sayı cisimleri denilen tamsayı genişlemeleri içinde çarpanlara ayırma gibi kavramları inceleyen alandır

Cebirsel sayı teorisinden gelen yeni teknik

Yeni ispat, tanıdık geometrik fikirlerden başlıyor ama beklenmedik bir yöne doğru genişliyor
Erdős’ün özgün alt sınırı, a + bi biçimindeki Gauss tamsayıları üzerinden anlaşılabilir
Burada a ve b birer tamsayıdır, i ise −1’in kareköküdür
Gauss tamsayıları sıradan tamsayıları genişletir ve tamsayılar gibi asal çarpanlara tekil ayrışım gibi özellikler taşır
Tamsayıların ya da rasyonel sayıların bu tür genişlemelerine cebirsel sayı cisimleri denir
Yeni argüman, Gauss tamsayılarının yerine cebirsel sayı teorisinin daha karmaşık genelleştirmelerini kullanıyor; daha zengin simetriler de daha fazla birim uzunluklu fark üretmeyi mümkün kılıyor
Kesin argüman, gereken sayı cisimlerinin gerçekten var olduğunu göstermek için sonsuz class field tower ve Golod–Shafarevich teorisi gibi araçlar kullanıyor
Bu fikirler cebirsel sayı teorisyenleri için iyi biliniyordu, ancak Öklid düzlemindeki bir geometri problemine etki etmesi büyük bir sürpriz olarak karşılandı

Matematik açısından anlamı

Bir AI sisteminin etkin bir alanın merkezinde duran eski bir açık problemi otonom biçimde çözmesi, AI ile matematik arasındaki etkileşim için önemli bir an oluşturuyor
Dışarıdan matematikçilerin hazırladığı eşlikçi çalışma, özgün çözümün tek başına göstermediği daha zengin bir tablo sunuyor
Thomas Bloom, eşlikçi makalede, AI tarafından üretilen bir ispatın önemini değerlendirirken bu ispatın problem hakkında gerçekten yeni bir şey öğretip öğretmediğini ve ayrık geometriyi daha iyi anlamamızı sağlayıp sağlamadığını sormak gerektiğini yazıyor
Bloom’a göre bu sonuç, sayı teorik yapıların bu tür sorular hakkında beklenenden çok daha fazla şey söyleyebileceğini ve gerekli sayı teorisinin son derece derin olabileceğini gösteriyor
Bloom, önümüzdeki aylarda birçok cebirsel sayı teorisyeninin ayrık geometrinin diğer açık problemlerine yakından bakacağını öngörüyor
Cebirsel sayı teorisi ile ayrık geometri arasındaki bu beklenmedik bağlantı, yalnızca belirli bir sanının çözümüyle sınırlı kalmıyor; ilgili problemlerin daha fazla araştırılmasına imkân veren bir köprü işlevi görüyor
Bu sonuç, AI’nın yalnızca çözümlere değil, daha sonra insan anlayışıyla anlamı daha açık ve daha zengin hale gelen matematiksel keşiflere de katkı sunabileceğini gösteriyor

Neden önemli

Daha iyi matematiksel akıl yürütme, AI’yı daha güçlü bir araştırma ortağı haline getirebilir
Zor düşünce akışlarını tutarlı biçimde sürdürebilir, uzak bilgi alanları arasındaki fikirleri bağlayabilir ve uzmanların önceliklendirmemiş olabileceği umut verici yolları ortaya çıkarabilir
Aşırı karmaşık ya da çok zaman aldığı için ele alınması zor problemler üzerinde araştırmacıların ilerleme kaydetmesine yardımcı olabilir
Bu tür yetenekler matematiğin ötesinde biyoloji, fizik, malzeme bilimi, mühendislik ve tıpta da yararlı olabilir
Karmaşık argümanları tutarlı biçimde sürdürebilir, birbirinden uzak bilgi alanlarını bağlayabilir ve uzman incelemesinden geçen çıktılar üretebilirse, bu daha otomatik araştırma sistemlerine giden uzun vadeli yolun bir parçası olur
AI’nın araştırmanın yaratıcı kısmında, özellikle de AI araştırmasının kendisinde, çok ciddi bir rol üstlenmeye başladığı öne sürülüyor
Bu ilerleme, son derece zeki sistemlerin hizalanması sorununu, AI geliştirmedeki bir sonraki aşamayı ve insan-AI işbirliğinin geleceğini anlama konusundaki aciliyeti artırıyor
Ancak bu gelecek hâlâ insan muhakemesine bağlı
Uzmanlık daha az önemli hale gelmiyor; tersine daha da değerli oluyor
AI, keşfetme, öneri geliştirme ve doğrulama konularında yardımcı olabilir; ancak önemli problemleri seçmek, sonuçları yorumlamak ve sırada hangi soruların izleneceğine karar vermek insanlara düşüyor

2 yorum

GN⁺ 2026-05-21

Lobste.rs görüşleri

Bu sonuç ve son dönemdeki gidişat, artık en yeni yapay zekanın son derece yenilikçi ve özgün işler yapabildiği konusunda hiç şüphe bırakmıyor
1 yıl önce olsaydı karşı çıkardım, ama hâlâ şüpheciyseniz bu ispatın temas ettiği alanda önde gelen matematikçilerin yazdığı açıklamaları okumanızı öneririm
Yapay zeka etrafında pek çok haklı kaygı olsa da, artık tuhaf yeni bir dünyaya girdiğimizi kabul etmemiz gerektiğini düşünüyorum
- Yapay zekaya itirazım “iyi çalışmıyor” değil. Aksine, ne kadar iyi çalışırsa kurmakta olduğumuz dünya o kadar kötü geliyor
  Şu anda inşa edilen geleceğin insanlar için iyi bir yönde olduğunu düşünmüyorum
- Bu sonucun, LLM'lerin özgün işler yapabildiği iddiası için gereken kanıt eşiğini karşılayıp karşılamadığından hâlâ emin değilim
  Matematikçiler bu çalışmanın doğru olduğunu söylüyorsa o kısmına güvenirim, ama LLM'lerin özgün fikir üretip üretemeyeceği konusunda uzman olmayabilirler; bu yüzden o yöndeki değerlendirmelerini temkinle dinlerim
  X alanında çok ünlü uzmanların Y konusu hakkında, özellikle de LLM'ler hakkında, güçlü konuşup utandıracak kadar yanıldığı pek çok örnek zaten oldu. Bunun bu örnek olduğunu söylemiyorum, sadece öyle olma ihtimali var diyorum
- OpenAI sitesinde kopyala-yapıştır çalışmadığı için, ilgilenenler adına yazıda geçen matematikçileri buraya bırakıyorum
  https://en.wikipedia.org/wiki/Noga_Alon
  https://en.wikipedia.org/wiki/Arul_Shankar
  https://en.wikipedia.org/wiki/Timothy_Gowers
  https://en.wikipedia.org/wiki/Jacob_Tsimerman
  Alanı pek bilmiyorum ama bana güvenilir görünüyorlar. Belki de LLM'ler kodlamadan ziyade matematiksel ispatlarda çok daha büyük katkı yapacak, ama açıkçası emin değilim
  Ne olursa olsun, yazıyı yayımlayan OpenAI ve her şeyi iddia edebilir. Matematik ve makine öğreniminde önde gelen araştırmacıları bir araya getirdiğinizde, işin ne kadarını onların yaptığı, sonucun ne kadarını “modelin” bulduğu, kaç başarısız deneme olduğu gibi şeyleri merak ediyorum
  Ayrıca zamanın testine dayanıp dayanmayacağı da şüpheli. Çünkü “Geriye dönüp bakınca X ay önceki gösterişli duyuru aslında o kadar da büyük bir şey değilmiş” türü başlıklar neredeyse hiç, hatta hiç çıkmıyor
- Modeller matematikte daha iyi oldukça, aday matematikçilerin öğrenmek, ilk makalelerini yazmak ve düşünme biçimlerini keskinleştirmek için kullandığı basit ispatların hepsini yutabilirler
  Bu, aday programcıların artık kodu elle yazmadığı bir duruma benziyor
  Matematik öğrenmek için çok pratik gerekir; genel bir önermeyi ispatlamak için zihni yeni şekillerde düşünmeye zorlamak gerekir; cevabın P mi yoksa not-P mi olduğunu bilmeden ispat yapmaya çalışmak ise ciddi bir belirsizliği kabullenmeyi gerektirir
  Bu yüzden matematiğin geleceği konusunda biraz endişeliyim. İlk ispat için ölçüt “sınırdaki bir milyon yapay zeka modeli tarafından ispatlanamamış olmak” hâline gelirse, gerçekten yetkin matematikçilerin sayısı azalmaz mı diye düşünüyorum
- Ben o açıklamaları farklı okudum. “Son derece yenilikçi ve özgün bir iş” denmişti, ama Thomas Bloom'dan yapılan uzun alıntı şunu söylüyor
  “Bilginin ön cephesi çok sivri ve pürüzlüdür. Önümüzdeki aylarda ve yıllarda matematiğin çeşitli başka alanlarında da benzer başarılar göreceğiz. Eski çözülmemiş problemler, yapay zekanın beklenmedik bağlantıları ortaya çıkarması ve mevcut teknik araçları sınırlarına kadar zorlamasıyla çözülecek. Yapay zeka, yüzyıllardır inşa ettiğimiz matematik katedralini daha eksiksiz biçimde keşfetmemize yardımcı oluyor. Perdenin arkasında daha hangi görünmez harikalar bizi bekliyor olabilir?”
  Burada en dikkat çekici kısımlar “beklenmedik bağlantıları ortaya çıkarması”, “mevcut teknik araçları sınırlarına kadar zorlaması”, “daha eksiksiz biçimde keşfetmemize yardımcı olması”
  Düşünmenin ne olduğu, yeniliğin ne olduğu, keşfin ne olduğu tartışılabilir; ama OpenAI'ın bizzat seçtiği bu alıntı açıkça o yöne gitmiyor
  Bilimsel araştırmada bilgi ve alan genişliği çok uzun zamandır bir kısıt, hatta bazen bir kaygıydı. Alanlar arasında bağlantı kurmak araştırma dışında da her zaman değerliydi; LLM'ler buna yardımcı olabiliyorsa güzel, ama ben yine de buna yenilik demezdim
Merak ettiğim birkaç şey var. Birilerinin cevap bulmama yardımcı olmasını isterim
1. Ayrık geometriyi iyi bilmeyenler için bu ispatın kolay bir açıklaması bir yerde var mı merak ediyorum
2. Hangi model kullanıldı? Sadece “genel muhakemeye optimize edilmiş” bir model deniyor
3. Düşünce sürecini kim yeniden yazdı ve ne tür düzenlemeler yapıldı?
4. Açıklama yapanlar özgün düşünce zincirini (CoT) görebildi mi?
- Bugünlerde düşünme özelliği olan frontier modeller, muhtemelen DeepSeek gibiler token çalmasın diye, düşünce izlerini yayımlamıyor
  Daha uzman akademik/araştırma amaçlı modeller de muhtemelen aynı şekilde dağıtılacaktır
Özette şöyle deniyor
“Erdős birim uzaklık sanısına ilişkin yakın tarihli OpenAI üretimi karşı örneğin kısa, düzenlenmiş ve insanlar tarafından doğrulanmış bir sürümünü ve buna dair bir dizi değerlendirmeyi sunuyoruz. Argüman, en azından sonradan bakıldığında, özünde Ellenberg-Venkatesh, Golod-Shafarevich ve Hajir-Maire-Ramakrishna'ya atfedilebilecek fikirlere dayanıyor.”
Bu yüzden bana, modelin eğitim verisinde bulunan önceki çalışmaları temel alarak bu noktaları birbirine bağladığı gibi geliyor
- Matematikte bu oldukça tipik görünüyor
  Sonuçta her şey aksiyomlardan çıkıyor ya da yeni aksiyomların sonuçlarını araştırmak anlamına geliyor denebilir

GN⁺ 2026-05-21

Hacker News görüşleri

Bu HN başlığı moral bozucuydu ve hâlâ neden böyle hissettirdiğini düşünüyorum
OpenAI’nin basın bülteni tonundaki övgüleri bir kenara bırakınca, matematik araştırmalarında LLM’lerin rolü hakkında ilginç ve incelikli pek çok soru kalıyor
Sonuçla birlikte yayımlanan matematikçi yorumlarını, özellikle de Tim Gowers’ın söylediklerini mutlaka okumanızı tavsiye ederim
Ama yorumlar, 2023’ten beri tekrar eden LLM tartışmaları, itirazlar ve öfkeli karşı itirazların savaş alanına dönmüş
3 yıl önce çekilmiş cephe hatları üzerinden aynı kavgayı tekrar tekrar vermenin üzücü olup olmadığını ve 2 yıl sonra da hâlâ böyle olup olmayacağını merak ediyorum
- 2 yıl sonra da burada ve tüm internet forumlarında durum aynı olacak
  Nietzsche’nin şu ünlü sözünü akılda tutarsanız hayat daha iyi olabilir: “Çirkin olanla savaşmak istemiyorum. Suçlamak da istemiyorum. Suçlayanları bile suçlamak istemiyorum. Bakışımı başka yöne çevirmek benim tek inkârım olmalı.”
- İnsanlar geçimlerini dert ettiği için bu gayet doğal bir tepki
- Anlaşılır bir durum. İnsan zekâsı ile yapay zekâyı sıfır toplamlı rekabet olarak değerlendirmek çok yaygın; işverenler de genelde böyle görüyor, dil modeli sağlayıcıları da pazarlamalarını buna göre yapıyor
  Yapay zekâ yeteneklerini kanıtladıkça, çok sağlam bir iş güvencesi olmayan herkes için rahatsız edici bir yöne doğru denge kayıyor
  İnsanların, yapay zekânın insan zekâsından oldukça farklı bir yetenek kümesine sahip olduğunu ve onu epey iyi tamamladığını kabul etmesi zaman alacak
  Büyük ölçekte insan zekâsını ezip geçme ihtimali düşük ve buna oynayan şirketler geride kalacak
- Taraflardan biri taş atmaya başlayınca yazının içeriği önemini yitiriyor ve mesele yazının iyi mi çöp mü olduğu kavgasına dönüşüyor
  Bu tür konularda gerçek bir tartışma yapmak istiyorum ama herkes yalnızca kendi gerçekliğinin gerçek, karşı tarafın gerçekliğinin sahte olduğuna inandığı için ortam sürekli daha da sertleşiyor
  HN’ye gelip sadece öfkelendiğimi fark edip uzun ara verdiğim çok oluyor
  Bunu neden kendimize yaptığımızı bilmiyorum; oysa temelde çoğumuzun aynı şeyleri istediğini düşünüyorum
- 2 yıl sonra böyle olmayacak. O zamana kadar benim tarafım kazanmış olacak
“LLM’ler sadece eğitim verisini enterpole ediyor” diyenlere: Ayer ve erken dönem Wittgenstein farklı yollardan da olsa, matematiksel doğruların dünya hakkında yeni olgular bildirmediğini düşünüyordu
İspatın, aksiyomlar, tanımlar, semboller ve kurallar içinde zaten örtük olarak bulunan şeyi açığa çıkardığı fikri son derece ilginç; ama bu yine de matematikçiye keşfin payesini vermekte sorun yaratmaz
O hâlde mevcut malzemenin yeniden birleştirilmesi diskalifiye edici değildir; yoksa Fields Medal sahiplerinin epey büyük kısmının ödülünü iade etmesi gerekir
- Bence işlevsel yetişkinlerin çoğu, Fields Medal’in ve neredeyse tüm yıllık “ödüllerin” hem yeniden birleştirici yeniliklere hem de “yeni boyutta düşünme” türü yeniliklere verildiğini anlıyor
  İnsanlar da her alanda her yıl yeni bir boyut açan yenilikler üretemiyor
  LLM’lerin “sadece” yeniden birleştirdiği söylenebilir ama Newton/Leibniz öncesi tüm cebir, geometri ve trigonometri literatürüyle eğitilmiş bir LLM’nin kalkülüsü çıkarıp çıkaramayacağından yine de şüpheliyim
  Bununla birlikte bu tür yenilikler LLM’lerin güçlü olduğu alanlardan biri ve bu, insanların da yeniden birleştirici yenilikte iyi olma ihtiyacını ortadan kaldırmıyor
  Yeni fikirleri sentezleme konusunda hâlâ insanların yapabildiği, LLM’lerin ise yapamadığı çok şey var gibi görünüyor
- İnsan bilgisinin tüm parçalarını, devasa yüksek boyutlu bir bilgi uzayı içindeki ayrık noktalar gibi düşünebilirsiniz
  Tüm bu noktaların etrafına büyük bir dışbükey kılıf çizdiğinizde, LLM bu yapının içinde eğitildiği için mevcut noktalar arasında enterpolasyon yapıp yeni ama yine de o kılıfın içinde kalan noktalara ulaşabilir
  Kılıfın dışındaki noktalara LLM’lerin ulaşıp ulaşamayacağı tartışmalı
  Yalnızca kılıf içindeki yeni noktalara ulaşmak bile son derece faydalı
  Pek çok yeni keşif ve ispat, belki de faydalı yeni keşif ve ispatların çoğu, zaten elimizde olanlardan hareketle ulaşılabilecek bu tür noktalardır
  Sadece henüz kimse zaman ve emek ayırmadığı için keşfedilmemiş çok şey var ve LLM’ler bunu büyük ölçüde hızlandırabilir
  Öte yandan, mevcut noktalardan ekstrapolasyon ya da enterpolasyonla ulaşılamayan, gerçekten yeni bir sıçrama gerektiren kılıf dışı noktalar da var
  Newton fiziğinden genel göreliliğe geçiş böyle bir örnek olabilir
  Demis Hassabis bir keresinde, yalnızca 1915 öncesi fizik bilgisiyle eğitilmiş bir yapay zekâya Merkür’ün yörüngesini gösterip onun bağımsız biçimde genel göreliliğe ulaşıp ulaşamayacağını AGI testi olarak önermişti
  Bugünkü LLM’lerin böyle bir sıçrama yapabileceğinden şüpheliyim; çoğu insan da zaten bunu yapamaz
  Einstein’a dâhi dememizin nedeni, tek başına genel göreliliğe sıçrayabilmiş olmasıdır; insanlarda bunun ara sıra ortaya çıktığına dair bir varlık kanıtımız var ama yapay zekâ tarafında bunu henüz görmedik
- Keşiflerin çoğu gerçekten aksiyomların sonuçlarıdır ama bazen, daha iyi ifade edemediğimiz için yeni matematik yaratıldı diyebileceğimiz anlar olur
  Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, Galois gibi kişiler matematiği bilimden çok sanat gibi ele aldı
  Örneğin birçok kişi Riemann Hypothesis’i çözmek için muhtemelen yeni bir matematik türü gerektiğini düşünüyor; LLM’nin bunu bir anda icat etmesi ise pek olası görünmüyor
- LLM yeteneklerini bir ucunda “insan değil”, diğer ucunda “insanüstü” yazan keyfî tek boyutlu bir cetvelle ölçme aşamasını neredeyse geride bırakmış olmayı umuyorum
  Bu anlamsız ve çok da ilgili değil
  Deep Blue Kasparov’u yendiğinde her şey değişmemişti; hayvanlar da makineler de bazı boyutlarda her zaman insanlardan “daha iyi” olmuştu
  Zaten tek bir cetvel yok; olsa bile ne tek boyutludur ne lineerdir ve herkesin cetveliyle uç noktaları zaman içinde değişir
  Bu, yapay zekâ üstünlükçülerine zafer vermek anlamına da gelmez
  LLM’ler çok faydalı araçlar ve dramatik biçimde gelişmeye devam edecekler ama bazı insanların temel saydığı her boyutta insanı aşamayacaklar
  Yapay zekânın sayısallaştırılmış metrikler listesindeki bir çizgiyi geçtiği anda evrensel olarak insandan üstün kabul edileceği bir an gelmeyecek
  Çünkü “önemli olan şeyin” kendisi özneldir
- İnsanların matematiksel keşif hızına dair ana fikri beğendim ama Ayer saçmalıyordu ve geç dönem Wittgenstein, erken dönem Wittgenstein’ı çürütmüştü
  “Zaten örtük olarak içeriliyor” iddiasının doğru olması için matematiğin kapalı bir sistem olması gerekir ama bunun öyle olmadığı zaten kanıtlandı
  Matematik kullanarak matematiğin dışına çıkabildiğimiz için Zermelo-Fraenkel gibi çeşitli aksiyomatik sabitleme pimleri gerekli hâle geldi
  Nesnel olarak “matematik” diyebileceğimiz şeyin ne kadar büyük olduğunu aslında pek anlamıyoruz; bildiğimizi sandığımız matematik, daha büyük bir matematiğin parçası da olabilir, ciddi biçimde yanlış da olabilir
  O daha büyük matematiğin aynı kapalı sistem özelliklerine sahip olup olmadığını da bilmiyoruz
Kod yazarken LLM’leri yoğun kullanan biri için bu çok da şaşırtıcı değil; sadece zaman meselesiydi
Matematikçiler yeni keşifler yapmak için matematiksel araçları yeni şekillerde üretir ve uygular
Bu, sezgiyi takip edip bağlantıları araştırmayı gerektiren devasa miktarda yinelemeli iştir
LLM’lerin “keşif” denen şeyin ne olduğuna dair bir sezgisi yok; bu yüzden gerçek anlamda keşif yaptıklarını söylemek zor, ama dar bir hedef doğrultusunda tüm matematik araçlarını Monte Carlo tarzında deneyip işe yarayanı bulabilir, sonra bunun üzerine eklemeler yapabilir ya da iyileştirmeleri birleştirebilir
Yazıyı okuyunca bu keşfin de tam olarak böyle göründüğünü düşündüm; LLM, “şaşırtıcı bağlantılar” kullanarak beklenen sonucu aşmış
Ama insanın koyduğu hedef, yapay zekânın kullandığı yeni yolun değerini anlayan insan kavrayışı ve kavramları keşfetmeyi mümkün kılan insan yapımı matematik dili olmadan sonucun bir anlamı yok
- “İnsan niyeti ve anlayışı olmadan anlamı yok” demek bana biraz insanmerkezcilik gibi geliyor
  Neden yalnızca insan anlayışı geçerli sayılıyor
  Bilgi neden sadece insan için olsun
  Başka bir tür yerçekimi ile kuantum mekaniği arasındaki çelişkiyi çözse, bize açıklayana ve biz anlayana kadar bunun anlamı olmayacak mı
- O konuda bir matematikçinin yazdığı uzun ve ilginç yakın tarihli bir deneme var: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- Bu sadece şaşırtıcı değil; zaten uzun zamandır beklenen bir şeydi. Programlar ile ispatlar arasında fark yoktur; ikisi aynı şeydir
İlginç olan, bu ispatın, daha doğrusu çürütmenin, Erdős’ün özgün varsayımına karşı bir karşı örnek bularak ilerlemiş olması
Bağlantı verilen PDF’teki bir matematikçinin tepkisinde de dendiği gibi, bu bana gerçek varsayımın doğru olduğunu kanıtlamaktan biraz daha az ilginç geliyor
Bir varsayımın doğru olduğunu kanıtlamak için daha fazla kuramsal inşa gerekir
Varsayımın neden doğru olduğunu daha büyük bir teori çerçevesinde açıklamanız gerekir; oysa karşı örnekte modelin yapması gereken, daha gelişmiş bir arama biçimiyle doğru yapıyı bulmaktır
Elbette bu arama basit değil ve etkileyici; ayrıca karşı örnekle bağlantıyı kanıtlamak için de çok sayıda adım gerekti
Yine de bu, yeni ve derin matematik geliştirmekten çok, mevcut fikirleri birbirine bağlamaya daha yakın görünüyor
Bunu bu olağanüstü başarıyı küçümsemek için söylemiyorum; gerçekten bir yere varıldığını düşünüyorum
Tamamen sezgisel bir his ama modellerin, yeni matematik geliştirilmesini gerektiren daha karmaşık varsayımları kanıtlayabilecek kadar teori inşa edebilmelerine çok uzak olmadığını ve bunun daha uzun zaman ufuklarında çalışabilme meselesi olduğunu düşünüyorum
- İspat araması ile çürütme araması bazen o kadar da farklı değildir
  Çoğu durumda sınırları azar azar kemirerek problemi sadeleştirmeye çalışırsınız
  Örneğin bir şeyin imkânsız olduğunu göstermek için önce sadece 5 olası aile kaldığını ispatlayabilir, sonra bunların 4’ünün imkânsız olduğunu gösterebilirsiniz
  Böylece problemin %80’i çözülmüş olur ve karşı örnek ararken de arama uzayı %80 daralır
  Karşı örnekte tahmin yürütüp sıçrama yapabilirsiniz; doğru çıkarsa sorun olmaz, ama ispatta bunu yapamazsınız
  Öte yandan karşı örnek bulunduğunda, çıkmaz sokaklar genelde görünmez olur
- Daha fazla zaman vermek, LLM’lerin insanların yaptığı türden ve yoktan sayı ya da hatta karmaşık sayılar icat eden bir matematiğe geçmesini sağlamayacak
  Eğitim verisindeki şeyleri ne kadar uzun süre birleştirirseniz birleştirin bu değişmez
Daha önce de dediğim gibi, yapay zekâ McDonald’s işletmeden önce Fields Medal kazanacak
Zor kısım, matematiğin oynanacağı satranç tahtasını, yani Lean gibi ortamları kurmaktı; şimdi mesele desen tanıma ve hesaplama
LLM’ler sadece başlangıç; yakında Stockfish’e benzeyen daha uzmanlaşmış matematik yapay zekâları göreceğiz
- Ama bu Lean ile doğrulanmış değil
  Tamamen doğal dil girdi ve çıktısıyla yapılmış ve birçok açıdan bunun tam tersini gösteren oldukça ilginç bir gösterim bence
  Doğrulama, ispat denetimini de bilgisayara bırakmak istediğiniz noktada devreye girer
  Bu ispat şu anda ilgili alandaki bir grup matematikçi tarafından elle doğrulandı
- McDonald’s işletme kısmında, hamburger zincirinde kullanılan kurgusal “Manna” yönetim sistemi [0] yüzünden biraz distopik bir hava var
  Orada çok sayıda “ters kentor” otomasyonu vardı
  Manna her an yapılması gereken işler listesine sahipti ve kasadan sipariş geldiğinde çalışanlara o yemeği hazırlamalarını söylüyordu
  Tuvalet temizliği, yer silme, masa silme, kaldırım süpürme, ekmek çözme, stok döndürme, cam silme gibi yüzlerce işi takip ediyor ve çalışanlara teker teker atıyordu
  Vardiya bitince Manna her zaman “bugünlük işiniz bitti. Yardımınız için teşekkür ederiz” derdi; sonra kulaklığı çıkarıp şarj yuvasına koyardınız
  6-8 saat boyunca kafanızın içindeki bir ses size çok ayrıntılı biçimde ne yapmanız gerektiğini söylediği için, kulaklığı çıkardıktan sonraki ilk birkaç dakika hep kafam karışırdı; restorandan çıkabilmek için beynimi yeniden çalıştırmam gerekirdi
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- Katılmıyorum. Yapay zekâ McDonald’s işletmeden önce Fields Medal seviyesinde işler yapabilir ama bence bu ikisinden de önce McDonald’s’ı iyi işletmeyi başarır
  Fields Medal ise bunların da epey sonrasında gelir
- İspat Lean’da yazılmadı; İngilizce yazıldı
  Saçmalık olup olmadığını anlamak için insan uzman doğrulaması gerekiyor
- Matematiğin oynanacağı “satranç tahtası” zaten 40 yılı aşkın süredir vardı
  Lean burada özel bir şey değil; biraz sürü psikolojisi gibi
  Ayrıca Lean eğitiminin bu spesifik modele ne kadar yardımcı olduğunu da bilmiyoruz
Bu ispat, cebirsel sayı teorisinden gelen beklenmedik ve incelikli fikirleri temel bir geometri sorusuna uyguluyor
Bu tür sonuçları okudukça, modelin gücünün önemli bir kısmının, mümkün olan tüm alanlar hakkında önbilgiye sahip olmasından ve bunu yeni alanlara aktarmakta zorlanmamasından geldiği hissi oluşuyor
Bu araçların potansiyel güzelliği, bugün bilimde insanların yaşadığı aşırı uzmanlaşma bariyerlerini aşmamıza yardımcı olabilmeleri
Aşırı uzmanlaşma bir yandan önemli ama öte yandan insanların erişebileceği araçları ve ilham kaynaklarını da sınırlıyor
- Çok isabetli ve iyi açıklanmış bir nokta
  Ne kadar aşırı uzmanlaşırsak, LLM’ler de farklı ufukları birleştirmede o kadar değerli bir araç oluyor
- İnsan bilgisinin toplamı bir tür kolektif zekâ gibi görünüyor
  Eskiden buna erişmenin maliyeti yüksekti ama artık öyle değil
  Harika olan şu ki, biri bu kolektif zekâya bir şey kattığında, bu hemen başkalarının üzerinde çalıştığı herhangi bir probleme uygulanabilir hâle geliyor
- Matematikte LLM’lerin rolüne hep şüpheyle yaklaşmıştım ama bu argümanı ilk kez görüyorum ve oldukça ikna edici geldi
  Belki de LLM’ler ilgili alana dair daha yatay bir anlayış geliştirmeye yardımcı olabilir
- Evet. İnsanlar muhtemelen perspektif sınırlamaları nedeniyle derinliğe çok, genişliğe ise daha az odaklanıyor
  Bu genel amaçlı bir model olduğu için fizik, biyoloji, tarih vb. alanlarda da doktora üstü düzeyde bilgiye sahip
  Bu kadar çok alan bilgisini içselleştirmiş tek bir “zihnin” neler yapabileceğini henüz tam olarak kavrayamadığımızı düşünüyorum
OpenAI modelin “doktora düzeyinde zekâ” kazanacağını söylediğinde herkes gülüyordu; şimdi çıtanın yeni matematik yapabilmek seviyesine taşınmış olması ilginç
Yani mesele doktora düzeyi değil, Leibniz, Euler, Galois düzeyini istemek olmuş
- Yine de kod yazarken tüm Stack Overflow’u ezberlemiş bir junior geliştirici gibi davranıyor
Blog yazısında bağlantı verilen bu çalışmanın özetlenmiş düşünce süreci 125 sayfa
Bu, Anthropic’in Mythos ile ima ettiği şeye oldukça benzeyen, akıl almaz ölçekte bir çıkarım ölçeklenmesi
- Merak edenler için bağlantı burada: https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- Bugün SQL modelindeki eksik 3 satırı düzeltip bir PR açmak için iki cilt LOTR kadar metin ürettim; o yüzden +1
Neden hep Erdős problemlerini çözdüğüne dair haberler duyduğumuzu merak ediyorum
Matematikte bir sürü çözülmemiş problem var ama r/singularity ve r/accelerate’te gördüğüm ChatGPT “matematik atılımlarının” hepsi Erdős problemi gibi görünüyor
- Erdős problemleri, açıkça formüle edilmiş ama çözülmemiş matematik problemlerinin önemli bir bölümünü oluşturuyor
  İnsanların dikkatini çekecek kadar ünlüler ama aynı zamanda insanların büyük emek harcayacak kadar ilginç bulmadığı problemler de olabiliyorlar
  Birinin zaten ortaya koyduğu problemi çözmek, matematik araştırmasında biraz niş bir faaliyet
  Daha yaygın olan, ilginç bir nesneyi inceleyip bunu elinizdeki araçlarla çözülebilecek şekilde çerçevelemek ve sonra çözüm aramaktır
  İdeal durumda hem problem kurulumu hem de çözüm kendi başına ilginç olur
- Erdős problemleri anlatması kolay olduğu için yapay zekâ matematiğinin ilk yılı için harika bir kıyas noktası oluşturuyor
- Bildiğim kadarıyla bunun etrafında bir topluluk ve veritabanı da var
- Sadece Erdős problemleri değil: https://news.ycombinator.com/item?id=48213189
- Erdős büyük bir matematikçi olduğu için bunlar meşhur
  Bir asır önceki Hilbert problemleri gibi
Bunun etkileyici olduğu kesin
Ama bu modelin neyle eğitildiğini bilmiyorsak, ne kadarına gerçekten “kendi başına” ulaştığını değerlendirmek çok zor
Yapay zekâ sektörü genelinde, birçok alandaki uzmanlara para ödenip büyük miktarda yeni eğitim verisi üretildi
Bunlar başka hiçbir yerde bulunmayan yeni eğitim verileri ve şirketler bunları biriktiriyor; içlerinde gerçekten özgün fikirler de olabilir
Birinin bu problemi çözüp doğrudan eğitim verisine koymuş olması düşük ihtimal ama dürüst olmak gerekirse, konu OpenAI olunca bunun kesinlikle yapılmadığını da söyleyemem
Daha ilginç ihtimal, bu ispatta “özgün” görünen temel önermelerin çoğunu ya da tamamını temas eden eğitim verilerinin zaten üretilmiş olması
Elbette bunu bilemeyiz
Ama bu tür şeyler gizli kapaklı olmayan bir biçimde üretilene kadar bu soru hep ortada kalacak
- Oldukça komplo teorisivari bir yorum gibi görünüyor

OpenAI modeli ayrık geometrinin temel sanısını çürüttü

Birim uzaklık probleminde atılım

Yapay zekanın bulduğu yaklaşım

Birim uzaklık probleminin matematiksel içeriği

Neden şaşırtıcı bir sonuç

Cebirsel sayı teorisinden gelen yeni teknik

Matematik açısından anlamı

Neden önemli

İlgili okumalar

2 yorum

Lobste.rs görüşleri

Hacker News görüşleri