PMF’den Önce Model-Pazar Uyumunu (Model-Market Fit) Doğrulayın

(nicolasbustamante.com)

5 puan yazan GN⁺ 2026-02-06 | 1 yorum | WhatsApp'ta paylaş

AI girişimlerinde ürün-pazar uyumundan (PMF) önce, mevcut modelin yeteneklerinin pazarın taleplerini gerçekten çözüp çözemediğini ifade eden model-pazar uyumunun (MMF) doğrulanması şarttır
GPT-4’ün çıkışından sonra hukuk AI pazarı patlayıcı biçimde büyüdü; Claude 3.5 Sonnet’in ardından kodlama asistanlarının gerçek bir iş akışına yerleşmesi MMF’ye ulaşılmasının tipik örnekleridir
Matematiksel ispat, yüksek riskli finansal analiz ve otonom ilaç keşfi gibi alanlarda pazar talebi vardır, ancak model yetenekleri kritik eşiği aşamadığı için MMF yoktur
Human-in-the-loop yardımcı bir araç değil de, insanın tamamlayıcı değil çekirdek işi bizzat üstlenmesi gerekiyorsa, bu durum MMF’nin olmadığını gösterebilir
AI stratejisinin özü, MMF → PMF → başarı sırasını kavramakta ve neyi ne zaman inşa edeceğine soğukkanlı biçimde karar vermektedir

Marc Andreessen’in çerçevesi ve yeni değişken

2007’de Marc Andreessen, girişimlerin üç unsuru (ekip, ürün, pazar) arasında pazarın en önemli unsur olduğunu savunan bir makale yayımladı
- Buna göre iyi bir pazar, ürünü girişimin dışına doğru çeker; ürünün kusursuz olması gerekmez, temel olarak çalışması yeterlidir
Aradan 19 yıl geçtikten sonra, pazarın gerçekten bir şeyi çekip çekemeyeceğini belirleyen yeni değişken olarak model ortaya çıktı
AI girişimlerinde ürün-pazar uyumundan önce, mevcut model yeteneklerinin pazarın istediği işi yapıp yapamayacağı şeklinde bir ön koşul vardır
MMF varsa Andreessen’in çerçevesi işler ve pazar ürünü çeker; yoksa UX, GTM stratejisi ve mühendislik ne kadar iyi olursa olsun müşteri benimsenmesi sağlanamaz

MMF kilidi açıldığında pazarın patlaması

Hukuk AI: GPT-4 (Mart 2023)
- GPT-4 öncesinde hukuk teknolojisi AI girişimleri ölçeklenmeyi başaramadı; belge inceleme araçları, sağladıkları tasarruftan daha fazla insan denetimi gerektiriyordu
- BERT gibi önceki transformer modelleri belge sınıflandırma veya sözleşme türü tespiti gibi sınıflandırma görevlerinde güçlüydü, ancak hukuk işinin merkezindeki üretim ve akıl yürütmeyi yerine getiremiyordu
  - Bir sözleşmeyi “istihdam” ya da “NDA” diye sınıflandırabiliyorlardı, ama Kaliforniya hukukuna göre rekabet yasağı maddesinin neden uygulanamaz olduğunu açıklayan tutarlı bir hukuki değerlendirme yazamıyorlardı
- GPT-4’ün çıkışını izleyen 18 ayda Silikon Vadisi girişimleri yüz milyonlarca dolar topladı; Thomson Reuters, Casetext’i 650 milyon dolara satın aldı ve onlarca yeni hukuk AI girişimi ortaya çıktı
- Hukuk AI pazarı, önceki 10 yılın tamamından yalnızca 12 ay içinde daha fazla unicorn çıkardı
- Pazar talebi aynı kaldı; değişen tek şey model yeteneğinin kritik eşiği aşmış olmasıydı
Kodlama: Claude 3.5 Sonnet (Haziran 2024)
- GitHub Copilot gibi kodlama asistanları daha önce de vardı, ancak zaman zaman faydalı olan otomatik tamamlama ile kod tabanını gerçekten anlayan AI arasında açık bir fark vardı
- Claude 3.5 Sonnet’ten önce Cursor kullanımı ilginç bir demo düzeyinde kalıyor, günlük iş akışının parçası hâline gelemiyordu
- Sonnet’in çıkışından sonra ise yalnızca bir hafta içinde Cursor olmadan çalışmak imkânsız hâle geldi; deneyim, tüm kod tabanını anlayan biriyle pair programming yapmaya dönüştü
- Cursor’un büyümesinin dikey sıçrama yapmasının sebebi özellik yeniliği değil, temel modelin gerçek kullanım eşiğini aşmasıydı
Desen analizi
- Asıl mesele MMF’nin var olup olmamasıdır; kazanan girişimler her zaman ilk çıkanlar değil, model yeteneğinin eşiği aşacağı ana hazırlanmış ekiplerdir
- Hem kodlama hem hukuk alanında kazanan yerleşik oyuncular olmadı; pazarı her zaman yeni oyuncular ele geçirdi
- Bugünün önde gelen hukuk AI girişimleri, avukatların gerçek iş akışlarını, gereken çıktı biçimlerini, regülasyon gerekliliklerini ve yardımcı avukatların araştırma yöntemlerini önceden aylar boyunca biriktirmişti
- Yarışı ilk başlayan değil, MMF oluştuktan sonra PMF’ye ilk ulaşan taraf kazanır

MMF olmadığında ortaya çıkan sorunlar

Matematiksel ispat
- Matematikçiler yeni teoremleri ispatlayabilen bir AI istiyor; araştırma kurumları, savunma yüklenicileri ve teknoloji şirketleri gerçek matematiksel akıl yürütme için milyonlarca dolar ödemeye hazır
- Ancak en gelişmiş modeller bile bunu istikrarlı biçimde yapamıyor; bilinen ispatların doğrulanması, mekanik adımlara destek ya da sınırlı problemlerde içgörü sunmakla yetiniyor
- Açık problemlere yeni ispat üretmek henüz mümkün değil; GPT-5, o1, o3 gibi nesiller boyunca kademeli ilerleme olsa da açık varsayımlar için titiz ispat bekleme aşamasında değiliz
Yüksek riskli finans
- Yatırım bankaları ve hedge fonlar, kapsamlı finansal analiz yapabilen AI’ı büyük bir istekle bekliyor; tek bir başarılı işlem veya M&A anlaşması bile yüz milyonlarca dolarlık ücret yaratabilir
- Buna rağmen AI, çekirdek görevlerde hâlâ şaşırtıcı derecede düşük performans gösteriyor
  - Karmaşık finansal modellerle uğraşırken Excel çıktısına bile güvenmek zor
  - 200 sayfalık belgeleri okuyup nicel analizle nitel içgörüyü birleştirmek, AI için en büyük zorluklardan biri
- İnsan analistler earnings call’ları, regülasyon bildirimlerini ve sektör raporlarını okuyup bunları spreadsheet modelleriyle birleştirerek yatırım kararı verir; AI ise bu iş akışının yalnızca bir bölümünü yapabiliyor
- İnsanın döngü içinde kalmasının nedeni sadece denetim değil, hâlâ çekirdek karar verici rolünün gerekli olmasıdır
Benchmark farkı
- Vals.ai benchmark karşılaştırmaları, MMF’nin bulunduğu dikeylerle bulunmadığı dikeyler arasındaki performans farkını çarpıcı biçimde gösteriyor
- LegalBench (hukuki akıl yürütme görevleri): en iyi model %87 doğruluk, Gemini 3 Pro %87,04 ile önde ve birçok model %85’in üzerinde
  - Hafif bir gözden geçirmeyle avukatların çıktıya güvenebileceği prodüksiyon seviyesi performans
- Finance Agent (çekirdek finans analisti görevleri): en iyi model %56,55 doğruluk; GPT-5.1 güçlükle yarıyı aştı, Claude Sonnet 4.5 extended thinking ise %55,32’de kaldı
- Yaklaşık 30 puanlık fark, hukukta MMF olduğunu ama finans tarafında olmadığını gösteriyor
- Bugün hukuk AI ürünleri piyasaya sürülebilir; ancak analistin gerçek işini yapan finans AI ürünü yakın gelecekte mümkün olsa da şu anda mümkün değil
Otonom ilaç keşfi
- İlaç sektörü, AI tabanlı ilaç keşfine milyarlarca dolar yatırım yapıyor; tek bir başarılı ilaç onlarca milyar dolarlık değer yaratabilir
- AI, aday molekül tespiti, protein yapısı tahmini (AlphaFold’un devrimi) ve klinik deney tasarımının optimizasyonu gibi tekil aşamaları hızlandırmada katkı sağlıyor
- Ancak bugünkü değerlemeleri haklı çıkaracak ölçüde uçtan uca otonom ilaç keşfi henüz yok
- İnsanın döngü içinde kalmasının nedeni iş akışı tasarımı tercihi değil, AI’ın henüz gerçek işi yapamıyor olmasıdır

MMF eksikliği nasıl tespit edilir

MMF’nin olmadığını anlamanın en güvenilir sinyali, human-in-the-loop’un hangi rolde konumlandığına bakmaktır
MMF varsa human-in-the-loop bir özellik olarak çalışır; kaliteyi koruma, güven inşa etme ve edge case’leri ele alma rolü üstlenir
- Çekirdek işi AI yapar, insan ise gözetim ve onay sağlar
MMF yoksa human-in-the-loop bir koltuk değneğine daha yakındır ve AI’ın çekirdek işi yapamadığı gerçeğini gizler
- İnsan artırıcı değil tamamlayıcı bir rol üstlenir; insanı çıkarırsanız ürün anında çalışmaz hâle gelir
Basit ölçüt şudur: Bu iş akışında insanın tüm düzeltmelerini kaldırsanız müşteri yine de ödeme yapar mı?
- Cevap hayırsa MMF yoktur; geriye kalan şey yalnızca demodur

Stratejik ikilem: Bugün için mi inşa etmeli, gelecek için mi?

Beklemenin gerekçesi
- Şu anda MMF olmayan bir alanda girişim kurmak, başkalarının yol haritasındaki model iyileştirmelerine bahis yapmak anlamına gelir
- O yeteneklerin ne zaman geleceğini kontrol edemezsiniz; Anthropic ve OpenAI karar verirken runway tükenmeye devam eder
- Gerekli yeteneğe dair yargının kendisi de yanlış olabilir
  - Dikeyin gerektirdiği %80 ile %99 doğruluk arasındaki fark ancak 5 yıl sonra kapanabilir ya da varsayılan biçimde hiç kapanmayabilir
- AGI’a inanıyorsanız modellerin bir gün neredeyse her şeyi yapabileceğini düşünebilirsiniz; fakat kritik olan olasılık değil, zamanlamadır
  - Mesele AI’ın problemi çözüp çözemeyeceği değil, o zamana kadar girişimin hayatta kalıp kalamayacağıdır; bu da doğrudan runway meselesidir
Erken başlamanın gerekçesi
- Y Combinator’da sık dile getirilen bir karşı argüman var ve oldukça ikna edici
- MMF kilidi açıldığında gerekli olan tek şey model yeteneği değildir
  - Alana özgü veri pipeline’ları
  - Düzenleyici kurumlarla ilişkiler
  - Yıllar içinde birikmiş müşteri güveni
  - Derin biçimde entegre iş akışları
  - Uzmanların gerçekte nasıl çalıştığına dair anlayış
- Hukuk girişimleri GPT-4’ü yalnızca sisteme eklemedi; önceden gerekli iskeleyi kurmuşlardı ve model geldiğinde hemen harekete geçebildiler
- Probleme en yakın ekipler, modelin değerlendirme ölçütleri, fine-tuning yönü ve dağıtım biçimi üzerinde doğrudan etki sahibi olur
  - Yetenekleri pasif biçimde beklemek yerine, o dikeyde neyin gerçekten yetenek sayılacağını tanımlayan taraf olurlar
Çözüm
- Asıl soru erken başlayıp başlamamak değil, ne kadar erken başlayacağınız ve beklerken neyi inşa edeceğinizdir
- En riskli bölge orta alandır
  - MMF’ye 24-36 ay sonra ulaşılacak gibi görünen durumlar
  - Çok yakında olacakmış gibi hissettirir, ama birkaç finansman turunu tüketecek kadar da uzaktır
- Bu bölgede inanç düzeyi ve runway her şeyi belirler
  - İki yıldan daha uzaktaki bir MMF’ye bahis yapıyorsanız, bunun beklemeye değecek devasa bir pazar olması gerekir
- Sağlık ve finansal hizmetler, bugünkü sonuçlar karışık olsa da Anthropic ve OpenAI’ın tüm gücüyle yüklendiği trilyon dolarlık pazarlardır
  - Potansiyel yukarı yön çok büyük olduğu için erken konumlanma rasyonel görülebilir
- Değerlendirme formülü basittir
  Beklenen değer = MMF’nin gelme olasılığı × pazar büyüklüğü × beklenen pay

MMF nasıl ölçülür

Ürün-pazar uyumunun kesin ölçümü zordur; Andreessen bunu nitel biçimde tarif etmişti
- “PMF gerçekleşmediğinde bunu her zaman hissedersiniz; gerçekleştiğinde de her zaman hissedersiniz”
MMF de özünde sezgisel bir kavramdır, ancak daha net ölçütlerle somutlaştırılabilir
MMF testi
- Temel soru: Model, insan uzmanın aldığı aynı girdileri aldığında, kayda değer insan düzeltmesi olmadan müşterinin para ödeyeceği bir çıktı üretebiliyor mu?
- Üç bileşen vardır
  - 1. Aynı girdi
    - Model, insanın aldığıyla aynı belge, veri ve bağlamı girdi olarak kullanmalıdır
    - Gerçek iş akışında sunulamayacak sihirli ön işleme kabul edilmez
  - 2. Müşterinin ödeme yapacağı çıktı
    - Demo veya proof-of-concept değil, gerçek problemi çözen prodüksiyon kalitesinde sonuç
  - 3. Kayda değer insan düzeltmesi olmadan
    - İnsan gözden geçirebilir, düzeltebilir, onaylayabilir; ancak çıktının %50’si yeniden yazılmak zorundaysa modelin işi yaptığı söylenemez
80/99 farkı
- Regüle olmayan dikeylerde %80 doğruluk bazen yeterli olabilir
  - Pazarlama metni taslağı hazırlayan bir AI, insan ciddi biçimde düzenlese bile değer yaratabilir
- Regüle dikeylerde (finans, hukuk, sağlık) %80 doğruluk fiilen işe yaramaz
  - Kritik maddelerin %20’sini kaçıran bir sözleşme inceleme aracı avukata yardımcı olmaz, sorumluluk riski üretir
  - Beş teşhisten birinde hata yapan tıbbi tanı sistemi ürün değil, dava riskidir
- %80 ile %99 doğruluk arasındaki fark, gerçek operasyonlarda çoğu zaman sonsuza yakın olabilir
  - “Umut veren demo” ile “prodüksiyon sistemi” arasındaki belirleyici ayrım budur
- Birçok AI girişimi bu farkta sıkışıp kalıyor; demolarla fon toplarken ürünün gerçekten çalışmasını sağlayacak yeteneği bekliyor

Agentic eşik

MMF tartışmalarının çoğunda gözden kaçan ikinci yetenek sınırı, uzun süre boyunca otonom biçimde çalışabilme becerisidir
Bugün MMF’nin oluştuğu örnekler (hukuki belge inceleme, kodlama desteği) özünde kısa ufuklu işlerdir
- Prompt girilir, çıktı alınır; birkaç araç çağrısıyla saniyeler ya da dakikalar içinde faydalı sonuç üretilir
Oysa en yüksek değerli bilgi işi bu şekilde işlemez
- Finans analisti tek bir soruyu yanıtlamaz; günler boyunca model kurar, varsayımları stres testinden geçirir ve onlarca kaynaktan bilgiyi sentezler
- Strateji danışmanı tek bir slayt hazırlamaz; haftalar süren araştırma, görüşmeler ve analizler yürütür
- İlaç keşfi araştırmacısı tek bir deney değil, aylar süren bir kampanya tasarlar ve yürütür
Bu iş akışları, modellerin henüz güvenilir biçimde yerine getiremediği yetenekler gerektirir; bunun özü sürdürülebilir otonom operasyondur
Agentic eşik sadece “araç kullanabiliyor mu” sorusu değildir
- Süreklilik: Hedefi ve bağlamı saatler veya günler boyunca koruyabiliyor mu
- İyileşme: Başarısızlığı fark edip nedenini teşhis ederek farklı bir yaklaşım deneyebiliyor mu
- Koordinasyon: Karmaşık hedefleri alt görevlere bölüp sıralı biçimde uygulayabiliyor mu
- Muhakeme: Ne zaman devam edilmesi, ne zaman durulup insandan yönlendirme istenmesi gerektiğini ayırt edebiliyor mu
Bugünün ajanları dakikalar süren görevleri yönetebiliyor; ama bir sonraki aşamadaki ajanlar günler süren işleri üstlenmek zorunda
- Bu, kademeli performans iyileşmesi değil, yetenek düzeyinde bir faz değişimidir
Finansın, “belgeleri iyi okuyor” denmesine rağmen neden MMF’ye ulaşamadığı da burada yatıyor
- 10-K okumak 30 saniyelik iş olabilir; ama yatırım tezi kurmak günler süren bir iş akışıdır
- Veri toplama, model kurma, senaryo testi ve sonuç sentezinin tamamında tutarlı akıl yürütme gerekir
MMF kilidini açacak bir sonraki dalga, yalnızca daha akıllı modellerden değil, günler boyunca aynı işi otonom biçimde sürdürebilen modellerden doğacak

Yapısal kilit noktalar

Andreessen’in temel içgörüsü, pazarın ekipten ya da üründen daha önemli olmasının sebebinin, iyi bir pazarın ürünü girişimin dışına doğru çekmesi olduğudur
AI’daki kaçınılmaz sonuç ise, bu çekim kuvvetinin başlaması için ön koşulun model yeteneği olmasıdır
Pazar ne kadar büyük ve istek ne kadar güçlü olursa olsun, çalışmayan bir ürünü çekemez
- AI’da “çalışmıyor” ölçütünü mühendislik ya da tasarım değil, modelin kendisi belirler
- En güzel arayüz, en zarif iş akışı, en gelişmiş veri pipeline’ı bile olsa, temel model çekirdek işi yapamıyorsa hepsi anlamsızdır
MMF → PMF → başarı sırası atlanırsa ikinci aşama kurulamaz
Kurucular için bu, yeteneklerin gerçekte nereye kadar geldiğiyle nerede olmasını istediklerini ayırıp acımasız bir dürüstlükle değerlendirmek anlamına gelir
Yatırımcılar içinse yalnızca pazar büyüklüğünü ve ekip kalitesini değil, mevcut model yetenekleriyle pazar talepleri arasındaki boşluğu da değerlendirmek gerekir
AI üreten herkes için geriye kalan soru, pazarın bunu isteyip istemediği değil, modelin bunu gerçekten sunup sunamayacağıdır
Önemli olan tek şey budur

1 yorum

xguru 2026-02-06

Yazılım Hayatta Kalma 3.0 – Hayatta Kalmak İçin Ne Yapmalı?
Son birkaç gündür nasıl hayatta kalınması gerektiğine dair yazılar sıkça göze çarpıyor.

PMF’den Önce Model-Pazar Uyumunu (Model-Market Fit) Doğrulayın

Marc Andreessen’in çerçevesi ve yeni değişken

MMF kilidi açıldığında pazarın patlaması

Hukuk AI: GPT-4 (Mart 2023)

Kodlama: Claude 3.5 Sonnet (Haziran 2024)

Desen analizi

MMF olmadığında ortaya çıkan sorunlar

Matematiksel ispat

Yüksek riskli finans

Benchmark farkı

Otonom ilaç keşfi

MMF eksikliği nasıl tespit edilir

Stratejik ikilem: Bugün için mi inşa etmeli, gelecek için mi?

Beklemenin gerekçesi

Erken başlamanın gerekçesi

Çözüm

MMF nasıl ölçülür

MMF testi

80/99 farkı

Agentic eşik

Yapısal kilit noktalar

İlgili okumalar

1 yorum