171 bin İngilizce kelimeden kaçını biliyorsunuz?
(vocabowl-870366514258.us-west1.run.app)- VocabOwl, 171.476 İngilizce kelimeyi temel alarak kullanıcının gerçekten bildiği kelime sayısını tahmin eden bir Scientific Word Count aracı
- Sonucu görmek için 100 soruluk meydan okumayı tamamlamak gerekiyor; bu, kısa bir testle toplam kelime dağarcığı büyüklüğünü tahmin etme yöntemi
- Soru yapısında katmanlı örnekleme (stratified sampling) yönteminin kullanıldığı belirtiliyor
- Site, Gemini 3 Flash AI kullandığını vurgulayarak kelime testi oluşturma ve işletme sürecine yapay zekayı dahil ediyor
- Proje, The Rest Is Science podcast'inden ve Prof. Hannah Fry ile Michael Stevens'tan ilham almış
VocabOwl'un sunduğu test
- VocabOwl, “How many of the 171,476 English words do you actually know?” sorusu etrafında şekillenen bir İngilizce kelime dağarcığı tahmin hizmeti
- Kullanıcılar, 100 sorudan oluşan meydan okumayı çözerek bildikleri İngilizce kelime sayısını görebiliyor
- Test sorularının scientifically stratified bir yöntemle oluşturulduğu belirtiliyor
Uygulama yöntemi ve ilham kaynakları
- Sitede Stratified Sampling temel yöntem olarak gösteriliyor
- Kullanılan teknoloji olarak Gemini 3 Flash AI belirtiliyor
- İlham kaynakları olarak The Rest Is Science podcast'i, Prof. Hannah Fry ve Michael Stevens gösteriliyor
1 yorum
Hacker News yorumları
Her bir kelime için çok fazla tıklama gerekiyor. Bu tür “kaç kelime biliyorsun” testlerini sevdiğim için sonuna kadar yaptım ama genel olarak sınıflandırma şüpheli görünüyor
İlk kelimelerin kolay, sonrakilerin zor olduğu genel bir akış var ama orta zorluk seviyesi epey karışmış.
breviary, orta seviye denemeyecek kadar daha nadir;Hippopotomonstrosesquippedaliophobiagibi fobi kelimeleri de gerçekten kullanılan sözcüklerden çok, ilkokul çocuğunun sözlükte bulup göstereceği türden bir şaka gibi.metamorphosisvekinetici expert seviyesine koymaları da ikna edici değilTanımlar da genel olarak tanınabilir durumdaydı ama
lethargyyi “enerjisiz bir durum” diye vermeleri fazla bariz,complacenti “kendinden memnun bir böbürlenme” olarak görmeleri aşırı,magnanimousiçin “rakip” unsuru şart değil vegaucheiçin yalnızca “sosyal olarak beceriksiz” demektactlessnüansını kaçırıyor“Bilimsel” olduğunu söylerken kabaca bir formül verip kelimeleri başta nasıl tabakalandırdıklarını açıklamıyorlar. Eğer tabakalı örnekleme bunun için resmen kabul edilen bir yöntemse, gerçek kaynak bağlantıları görmek isterdim. Çok kelime bildiğimi düşünüyorum ama bu uygulamanın verdiği 75k+ tahminine inanmak zor
Hippopotomonstrosesquippedaliophobiaiçin de mesele tüm kelimeyi bilmekten çok, bileşenlerine bakıp anlamı çıkarabilmek gibi görünüyor.sesquippedalianı biliyordum,phobiayı ayırt etmek de kolaydı;hipponun da hayvandan çok Latince kök açısından “büyük” anlamına yaklaşabileceği tahmin edilebilircomplacentvegaucheiçin de bu kullanımları duydum; sözlükte olsa en kötü ihtimalle ikinci ya da üçüncü tanım olurdu diye düşünüyorum, o yüzden rahatsız etmedi. Eskiden spelling bee'de iyi sonuçlar almıştım; hafta sonları saatlerce sözlük çalışacak disiplinim olsaydı daha da yükseğe çıkabilirdimZenzizenzizenzici ilk kez duydum ama sanırım doğru bildimSeçtiğim yanıtlarla yanlış yaptıklarımın doğrusunu gösteren bir özet olsa çok daha iyi olurdu
complacentin özünde smug olmadığı görüşüne katılıyorum ama tuhaf biçimde hem dictionary.com hem de Wiktionary,smugu eşanlamlı ya da tanımın bir parçası olarak veriyorAma oralarda
smugdaself-satisfiedya daself-complacente yakın şekilde çözümleniyor; yani beklenenden farklı olan taraf belki desmugun anlamı olabilir. Benim hissiyatıma göresmug, sadece “öz-” niteliği taşıyan bir şeyden çok ilişkisel; birinden üstün olduğu bir durumdan keyif alma hissi veriyor.complacentise temelde kendi durumundan memnun olmayı anlatıyor ama çoğu zaman daha iyi olmak için harekete geçmesi gerekirken geçmemek gibi olumsuz bir ima da taşıyorHippopotomonstrosesquippedaliophobiayı bilmeseniz bile dört seçenek arasından doğruyu bulmak çok kolayHer kelimede çok fazla tıklama gerektiği için bitirmesi uzun sürdü; ayrıca seçenekler yüzünden bilmediğiniz kelimelerde tahmin etmek de fazla kolaydı
Fikir ilginç ama 100 kelime çözmek epey fazla. Baştaki kolay kelimeleri geçmek sıkıcı olduğu için, ilginç kelimeler gelmeden bıktım
Böyle bir sistem, içeride puan ve güven düzeyi tutarak çok daha hızlı ayarlanabilir. Başta güven düşüktür ve zamanla yükselir; ilk aşamada doğru/yanlış yanıtlar puanı hızlı oynatır, sonra giderek dengelenir
Pratikte önce giderek daha az yaygın kelimeler gelir, yanlış yapınca daha kolay kelimelere dönülür; tekrar doğru yapmaya başlayınca da sonunda kendi seviyenize yakın kelimeler etrafında dolaşır. Ayrıca kelime başına tıklama sayısı da fazla. Düşük riskli bir test olduğu için tanıma bir kez tıklayınca doğrudan ilerleyebilir; yanlış tıklama endişesi varsa bir geri al düğmesi yeterli olur
Her seçeneğe harf ya da sayı verip klavyeden seçilebilir hale getirmek iyi olurdu. Eskiden bunu yapan bir form servisi vardı ve oldukça iyi çalışıyordu; sanırım Typeform'du. Kontrol etmek için baktım ama şimdi her yer AI söylemiyle kaplanmış, doğrulama hevesim kaçtı
Diğer eleştirilere ek olarak, yapısal bir hata yüzünden hesaplama ancak yarı yarıya doğru. Sayım yöntemine göre %100 yanlış olduğu bile söylenebilir
Anadili İngilizce olan, çok kitap okuyan bir inek ve SAT’de tam puan alan biri olarak, arama yapmadan 100 sorunun hepsini doğru bildim. Buna rağmen “SCIENTIFIC ESTIMATE” kısmında 170.000 içinden yalnızca 85.000 kelime bildiğim yazınca kafam karıştı
Sondaki “How is this calculated” sayfasına bakınca, Oxford English Dictionary Second Edition’a göre şu anda kullanılan kelimelerin yaklaşık 171.476 olduğu söyleniyor ve zorluk aralıkları Core Basics 3.000, Intermediate 7.000, Advanced 10.000, Expert 25.000, The Obscure 40.000+ olarak ayrılıyor. Toplam puanın da her aralıktaki doğruluk oranı × aralık büyüklüğünün toplamı olduğu belirtiliyor
Ama bu aralıkların toplamı 85.000 ediyor; yani kusursuz puan alsanız bile sonuç yalnızca %50 çıkıyor. Üstelik dilin çok sınırlı ve zorluk açısından pek temsil gücü olmayan bir alt kümesini kullanıyor. Sevimli ama birçok açıdan hatalı
İngilizce kelime testlerinde sıkça olduğu gibi, Yunanca biliyorsanız zor bölümde avantaj sağlıyorsunuz
Uzmanlık gerektiren bazı kelimeler var ama çoğu, Radio 4’te sıradan bir sohbette bile duyulabilecek türden
78.000 aldım; ikinci dil için oldukça iyi. Bu testteki üst sınır 85.000 gibi görünüyor
Şıklar LLM üretimi gibi duruyor; “now” ve “forever”ın sık görünmesi gibi bazı örüntüler var
Birkaç yıl önce benzer bir oyun oynamıştım; art arda yeterince doğru yapınca seviye yükseliyor, bir tane yanlış yapınca düşüyordu ve böylece oynamaya devam edebiliyordunuz. Çok yüksek seviyelerde oyun aslında kolaylaşıyordu, çünkü araya Eski İngilizce kelimeler giriyordu ve bunlar benim anadilim Felemenkçeyle fiilen aynıydı. Galiba işin içinde bir yardım kampanyası unsuru da vardı ve muhtemelen https://freerice.com/ buydu, ama şimdi oyun sadeleştirilmiş gibi görünüyor
Belçika’daki Ghent University’de de ilginç bir test vardı; belli eğitim düzeylerindeki ortalama puanlarla karşılaştırıp yetkinliği değerlendiriyordu. Orada yaklaşık 41.000 almıştım ve bu, üniversite düzeyinde anadili İngilizce olanların ortalaması sayılmıştı galiba. https://languagehat.com/ghent-vocabulary-test/ bağlantısının altındaki güncellemede o testin nereye gittiği ve birkaç alternatif yer alıyor
Oldukça eğlenceli
Gönder düğmesi kaldırılıp, tıklayınca doğru mu yanlış mı olduğunu gösterse ve yaklaşık 1 saniye sonra sonraki soruya geçse daha iyi olurdu. İki kez gönderme akışı içine girmek akıcılığı bozuyor
Ayrıca benim gördüğüm kelimelerde dört şıktan biri doğru, biri doğrunun zıttıydı; kalan ikisi ise neredeyse rastgeleydi. Pratikte, zıt anlamlısı birlikte gelmeyen seçenekler atlanabilir
Öncelikle, kelimeyi yaygın İngilizce sözcüklere ayıran cevapları eleyebiliyordum. Çünkü bir kelime bu kadar kolay parçalanabiliyorsa zaten obscure olması beklenmez
Çoktan seçmeli sorularda çeldirici yazmak zordur. Bildiğim sınavlar arasında, hesaplama ya da ezber gerektirenler hariç, Polonya’daki doktorluk ulusal sınavı LEK bunu neredeyse zalimce iyi yapıyor. Alan dışından biri için, hissiyatla işaretleyip rastgele olasılığın üstüne çıkmak neredeyse imkânsız
“Bilmiyorum” diye cevap verebilmek gerek. Gerçekten bilmediğiniz bir şeyi %25 şansla doğru yapmak adil değil; üstelik yaygın çoktan seçmeli çözme taktikleriyle daha da yüksek isabet sağlanabiliyor
Yanlış saysın diye razı olduğum birkaç kelime bile doğru hanesine yazıldı
Zorluk seviyesi de biraz karıştırılmalı. Son 30 kadar soru sıkıcı bir angarya gibi hissettirdi. Fikir olaraksa güzel
En kötü durumda bile, tesadüfen doğru yapma ihtimali olan %25 düzeltilebilir
Sorular ipuçlarıyla epey kolay çözülebiliyor. Birçok seçenek kelime tanımı gibi görünmüyor, “doğru cevap + zıt anlamlısı + alakasız 2 seçenek” yapısı sık tekrar ediyor ve son kısımda en uzun cevabın doğru olduğu durumlar çok fazla. Çeldirici tasarımı iyi değil
Kelime örneklemi de kelimeler, konuşma, konuşmacı ve ikna ile ilgili kavramlara aşırı derecede kaymış. Muhtemelen LLM, kelime seçme görevine uygun bir prompt alırken “kelime”yle ilgili kelimeleri seçmeye yöneldi
Arka plan olarak, ikinci dil konuşuruyum, dilbilim meraklısıyım ve İngilizceyi çoğunlukla akademik/profesyonel ortamlarda kullanıyorum. Bu ipuçlarını karıştırarak 75.400 aldım ama gerçekte 10~15k’ye daha yakın olabilirim
Tasarım da herkesin fark edeceği gibi Duolingo’ya acı verecek kadar benziyor
Belli bir yaşın üstündeki insanlar çoğu dilde bu tür ağrıyı anlatan bir kelime bulunduğuna herhalde katılır
100 soruda 88 doğru yaptım ama bundan öğrendiğim tek şey, tahmin işinde epey iyi olduğum oldu. Yaklaşık 20 tanesinde, pek inandırıcı olmayan şıkları eleyerek ya da kelimenin parçalarının anlamından çıkarım yaparak doğruyu bulabildim
Gerçekte bildiğim kelime sayısıyla doğru çıkarabildiğim kelime sayısını daha dürüstçe ölçmek için bir “Bilmiyorum” seçeneği olmasını isterdim
Seviyeyi daha hızlı bulmak için ELO puanı kullanılmalı. Temel 100 kelimeyi zar zor çözmenin pek anlamı yok
OED’nin 171.476 sayısı hatalı biçimde kullanılıyor ve bu, sözlük ile dili ciddi şekilde yanlış anlayan bir yaklaşım
Bu sayı, Oxford English Dictionary’nin 20 ciltlik Second Edition’ında “current use” olarak tanımlanan sözcüklerin tam madde sayısını ifade eder. Kelime sayısı anlamına gelmez. Ayrıca OED’nin farklı yazım biçimlerini, çekimli biçimlerini, ifadeleri ve run-on maddeleri de kapsamaz
Üstelik OED, İngilizcenin eksiksiz bir listesi de kesinlikle değildir. Hatta güncelleme döngüsü çok yavaş olduğu için yüz binlerce kelimenin eksik olması muhtemeldir. Bir sözlük editörü ve sözlükbilimci olarak OED’yi her gün kullanıyorum; onu hazırlayanlar da bunun farkında