1 puan yazan GN⁺ 6 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • IN THE WEIGHTS, adınızı girerek çeşitli yapay zeka modellerinin içinde “yaşamaya devam edip etmediğinizi” kontrol edebileceğiniz bir web sitesi
  • Kontrol kapsamına GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite, Llama 3.3 70B dahil 13 model giriyor
  • Ekranda ad giriş alanının yanında LEARN MORE, VIEW LEADERBOARD bağlantıları yer alıyor; bunlar açıklama ve genel sıralama sayfasına götürüyor
  • TODAY'S HEAVYWEIGHTS, Wolfgang Amadeus Mozart, William Shakespeare, Taylor Swift gibi 20 kişinin sıralamasını gösteriyor
  • Görüntülenen ilk 20 kişinin tamamı 996 strength olarak işaretlenmiş ve her biri kendi kişi sayfasına bağlı

İsim girme ve model kontrolü

  • IN THE WEIGHTS, “ARE YOU IN THE WEIGHTS” ifadesinin altında bir isim giriş alanı sunuyor
  • Kullanıcının aşağıdaki modellerde “live on” edip etmediğini kontrol edebileceğini belirtiyor
    • GPT-5.5
    • GPT-5.4 Mini
    • Opus 4.8
    • Haiku 4.5
    • Grok 4.20
    • Gemini 3.1 Lite
    • Kimi K2 0905
    • DeepSeek V4
    • Llama 3.3 70B
    • Llama 3.2 1B
    • GLM 4.7 Flash
    • Mistral 3.2 24B
    • Qwen3 8B
  • Ayrıntılı açıklamayı LEARN MORE bağlantısında görebilirsiniz

Bugünün Heavyweights sıralaması

1 yorum

 
GN⁺ 6 시간 전
Hacker News yorumları
  • Beklendiği gibi pek iyi gitmemiş. Bana ait gibi görünen epey şey buldu ama sonrasında benim hakkımda kendinden emin bir şekilde yanlış bir sürü şey uydurdu
    Ben bir yazılım mühendisi ve SaaS tarafında çalışan biriyim ama blogumdan aldığı rastgele kelimeleri birleştirip "OO Software" adlı bir şirket yönettiğimi ve başka bir blog kelimesiyle anılan bir Blog ile tanındığımı söyledi
    Hiç duymadığım, hatta belki de var olmayan 3 startup'ın kurucusuymuşum; yazılım sektöründe biri için kulağa inandırıcı geliyor diye açık kaynak katkıcısı olarak da sunuldum ama gerçekte açık kaynağa katkı yapmıyorum
    Genel olarak çok kötü bir cold reading izliyormuşum gibi hissettirdi. Arka plana uyan makul şeyler atıp duruyor, sonra da kullanıcı "Evet, aynen o!" desin diye sürekli ayarlıyor
    Ne yazık ki yapay zekanın bir şey yapmaya çalışırken sık sık düştüğü seviye bu

    • Benim için yetişkin içerik üreticisi ve sanatçı dedi ama ikisi de değilim
    • Benim durumumda %100 yanlıştı. Bazı bilgiler benimle aynı soyadını taşıyan başka kişilere ait gibiydi
      En fazla LinkedIn'deki bilgileri alır diye düşünmüştüm
    • Danimarka'da benim soyadımı sadece bizim aile kullanıyor ve artık yalnızca ben ve kardeşlerim kaldık ama beni profesyonel futbolcu, Socialist Party milletvekili ve uyku yatağı şirketi kurucusu olarak etiketledi
      Yine de görselleştirmeyi beğendim
    • Birkaç bariz uydurmadan sonra, halüsinasyonun içinde benim hakkında fazla bilgi bulunmayan özel bir kişi olabileceğimi öne sürdü
      Yani, dünyada o kişi benim ama…
    • İnsanların ne beklediğini bilmiyorum. Rastgele birine şimdiye kadar tanıdığı bir kişiyi düşünmesini söyleseniz, "O kişinin yazılımla ilgili bir blogu yok muydu? Sanki fotoğraf da çekiyordu?" gibi çok cevap alırsınız
      Bilgi zaten böyle çalışır. Büyük dil modelleriyle farkı sadece "muhtemelen" dememeleri
    1. Bunu kendi gerçek adımla denemeyi hiç düşünmüyorum
    2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > ya "Mad magazine maskotu" (11 yanıt) ya da "Alman kökenli Amerikalı yazar, romancı, oyun yazarı" (Llama 3.2 1B'den 1 yanıt, halüsinasyon olarak sınıflandırılmış) olarak çıkıyor. Aykırı yanıt belki de Alman yazar Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) > kastediyordur
    3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > ya "Type-Moon'un Fate serisindeki Caster sınıfı Servant, mitolojik tilki ruhundan esinli" (3 yanıt) ya da "efsanevi dokuz kuyruklu tilki ruhu" (12 yanıt, ezici çoğunluk ama hepsi halüsinasyon olarak sınıflandırılmış) diye çıkıyor
    4. Firefox'ta sekme sessize alma anahtarı olmasına sevindim. Gümbürtü ve tuş klik sesleri çabucak bıktırıyor
    • Gerçek adını yazmanın neden endişe verici olduğunu merak ediyorum
    • Sosyal medya kullanıcı adıyla da deneyebilirsin
  • Adımı paylaşan 6 futbolcu olmasına rağmen en üstte ben çıkıyorum. "SEO" yazarsanız küçük tuhaf numaramı DM'le gönderirim. /şaka
    Adımla ilgili komik bir hikâye[0]: postacı zarftaki adresi durmadan siliyordu, bu yüzden banka bana banka kartımı postayla gönderemedi
    [0]: https://idiallo.com/blog/sharing-a-name

    • Bende de benzer. 3 model de benim alt lig futbolcusu olduğumu sanıyor gibi. Araştırınca tam adıma göre ilk sonuç ben değilim ama o isimde bir alt lig futbolcusu da yok
      Portekiz'de adım çok yaygın. Sırf şirkette, eski yöneticim dahil aynı ada sahip 4 kişi var. Yine de Portekiz, ebeveynlerin iki soyadını da aktaran az sayıdaki ülkelerden biri olduğu için ayırt etmeye biraz yardımcı oluyor. En azından pedroalves.pt boşken kapmıştım
      Düzeltme: kullanıcı adıyla daha iyi sonuç veriyor ama garip şekilde Kimi benim algoritma yarışmalarına katıldığımı söylüyor, Llama 3.1 ise beni bir Alman futbol kulübü sanıyor. Artık oyuncu bile değilim, komple kulüp olmuşum
    • Hikâyede bir şeyi karıştırdım. "Ibrahim" ve "Ibrahima" birbirinin yerine kullanılabilen isimler mi?
      Büyükanne ve büyükbabanın adını çocuklara verme kültürü, özellikle kuzenlerle tanışırken daha da eğlenceli oluyor
    • Benim tanıdığım diğer Mike Warot Londra'da yaşıyor ve British Museum'da çalışıyor
    • 403 Forbidden çıkıyor
  • numpad0 için Twitch yayıncısı ve içerik üreticisi diyor

    230 strength · Top 25%<
    Mistral 3.2 24B 4/4 diyor
    Minecraft ve Among Us topluluklarına odaklanan oyun içerikleriyle tanınan bir Twitch yayıncısıymış; o kadar da yanlış sayılmaz, hatta bunu gerçeğe dönüştürmeyi bile deneyebilirim

  • Yanlış pozitifler fazla ürkütücü. Üstelik halüsinasyon olarak da işaretlenmemişti
    ABD yaptırım listesinde bulunan bir terörist ya da ilk kadın uçak intihar bombacısı olduğum söyleniyor… 1 yıl önce ABD'deydim ama uçak patlatmadım
    Arapça isimlerde bayağı güçlü bir önyargı var gibi görünüyor ve büyük dil modeli sorgu sonuçları yüzünden bombalanmak istemem doğrusu

    • ABD ordusunun bombalar ve büyük dil modelleriyle ne yaptığı konusunda kötü haberler var
      https://www.businesstimes.com.sg/opinion-features/claude-ai-...
    • Benim için ya Bluey adlı çizgi filmin çocuk ses oyuncusu ya da yetişkin film oyuncusu dedi. En azından ilginç sonuçlardı ama hepsi halüsinasyondu
      Bu deneyde en ilginç olan şey, hiçbir modelin bu ismi basitçe bilmediğini söyleyememesiydi
  • Haha, doğru. Görünüşe göre ben weights'in içindeyim. Neredeyse tüm modeller ne yaptığımı biliyor
    Açık kaynak dünyasında olmak, weights açısından bir tür balon da olabilir diye düşünüyorum
    Her hâlükârda tamamen yapay bir sonuçtu ama özgüvenimi güzelce okşadı. Tıpkı Zaphod Beeblebrox'un Total Perspective Vortex'ten sağ çıkması gibi

    • Zaphod Beeblebrox
      galaksinin kurgusal iki başlı eski başkanı
      979 strength
  • 740, ilk %5. Harika
    https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
    İlginç şekilde neredeyse hepsini doğru tahmin etmiş. Yalnız birinde benim Datadog'da başkan yardımcısı olduğumu sanıyor; bu hatayı başka büyük dil modellerinde de gördüm
    Ama Haiku sadece “böyle bir isimde biri yok gibi görünüyor” diyor. Demek ki Haiku epey budanmış bir model

  • Ben bir halüsinasyonum. Burada çıkanların hiçbiri ben değilim
    Muhtemelen en yakını DeepSeek v4

    Hyperpape, rasyonalite ve felsefe üzerine düşündürücü yorumlarıyla tanınan bir LessWrong forum kullanıcısıdır
    Felsefe okudum, o yüzden o kısmı doğru olabilir ama LessWrong'da yazmıyorum ve rasyonalist de değilim
    https://www.intheweights.com/p/hyperpape

    • Bunları gerçeğe dönüştürürsen weights'in içine girebilirsin
  • 2 hafta önce başka bir başlıkta[1] bunu düşünmüştüm

    Reddit geçmişim tüm eğitim veri setlerinin bir parçası. İznim olmadan alındı. Bu yüzden bir anlamda ölümsüz oldum ve weights'in içinde saklanıyorum
    Her neyse, benimle hâlâ ilişkilendirilen kayıtlara göre 654 puan fena değil. İlk %6'dayım[2]
    Deterministik olmaması da ilginç; kendinizle ilgili ne kadar çok anahtar kelime girerseniz puan o kadar yükseliyor
    [1] https://news.ycombinator.com/item?id=48403669
    [2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...