Claude Finance gerçekten junior banker'ların yerini alabilir mi?
(lattice-log.vercel.app)Anthropic'in Claude Finance'i piyasaya sürmesinin ardından, "yapay zeka junior banker'ların yerini alacak mı" sorusunu iki benchmark ile birlikte analiz eden bir yazı.
Özet
Yapay zeka, junior banker işlerini tek seferde ikame etmeyecek. Ancak dokümantasyonu yapılmış ve yapılandırılmış işleri hızla devralırken, middle/back office çalışanlarının yerinin alınma olasılığı yüksek.
Benchmark sonuçları
Vals AI Financial Agent 2.0: En üst seviye modeller bile %52 eşiğini aşamadı. Yalnızca finansal modelleme kategorisine bakıldığında en yüksek skor %23
BankerToolBench (Goldman·JPM·Evercore'da görev yapan 502 profesyonel tarafından puanlandı): Müşteriye olduğu gibi gönderilebilecek çıktı %0, hafif düzenleme %13, kapsamlı yeniden çalışma %41, kullanılamaz %27
Başarısızlık türleri: kod/formül hataları %41, iş mantığı hataları %27, veri sorgusunun kesilmesi %18, uydurulmuş rakamlar %13
İkame edilebilir vs edilemez
İkame edilebilir: kamuya açık bildirim ve transkript materyallerini bulma, earnings call özetleme, comps değerlendirmesi, ilk değerleme, pitch taslağı, data room Soru-Cevap
İkame edilemez: MNPI değerlendirmesi, yönetimle yapılan görüşmeler, satıcının satış motivasyonu, danışman ilişkileri, regülasyon/siyasi atmosferi sezme, nihai sorumluluk ve onay
Kore finans sektörünün özgünlüğü
Aile içi halefiyet, chaebol ilişkileri, FSS ve Fair Trade Commission öncelikleri, emeklilik fonu nüansları gibi data room'a girmeyen bağlamlar küresel pazarlara kıyasla çok daha fazla; bu da frontier modellerin kavramakta zorlandığı bir alan.
Dönemlere göre senaryo
2026: araştırma ve özetleme alanında otomasyon (4~5 saat → 4~5 dakika)
2027~2028: pitch taslağı, ilk model ve memo taslağına kadar ikame. Bir senior, aynı anda 5~6 ajan akışını gözden geçiriyor
2029+: Citrini Research'ün çizdiği geri besleme döngüsü — yapay zeka verimliliği → ücretlerde düşüş → tüketimde daralma → talebin çökmesi olasılığı
Kurallaştırılabilen işler daha hızlı otomatikleşirken, ölçülmesi zor muhakeme daha da ağırlaşıyor. Fırsat tam bu sınırda yatıyor.
Henüz yorum yok.