- Yazar, 10 yılı aşkın süredir LLM ve metin üretim teknolojileri üzerine çalışmasına rağmen, beklentilerin aksine günlük yaşamında LLM’leri sık kullanmadığını söylüyor
- LLM kullanırken prompt engineering, sistem prompt’u ayarlama, temperature kontrolü gibi ince ayarlı denetimi önemsiyor; genel amaçlı frontend’ler yerine API tabanlı erişimi tercih ediyor
- BuzzFeed’de veri etiketleme, haber kümesi özetleme, stil kılavuzu inceleme gibi somut problem çözümünde LLM’lerden yararlandı ve ciddi zaman tasarrufu sağladığını gösterdi
- Yazı yazarken LLM kullanmıyor; ancak hayali Hacker News yorumlarıyla eleştirel bakış açısını test etme yöntemiyle metinlerinin mantığını sınamak için kullanıyor
- LLM’ler kodlama yardımında faydalı olsa da karmaşık ya da yüksek güvenilirlik gerektiren işlerde doğrudan kendisi uygulamayı tercih ediyor; agent’lar ve vibe coding konusunda ise kuşkucu kalıyor
LLM ile aramdaki mesafe
- Yazar, uzun süredir RNN tabanlı metin üretimi, GPT-2 ince ayarı, GPT-3/ChatGPT deneyleri gibi alanlarda üretken yapay zeka araçlarını yoğun biçimde kullanmış deneyimli bir veri bilimci
- Buna rağmen doğrudan ve sık kullanım nadir; kullanıp kullanmaması işin niteliğine ve ihtiyacına göre belirlenen araçsal bir yaklaşım
LLM’i kontrol etme biçimi
- Prompt engineering, istenen çıktıyı LLM’den almanın temel unsuru
- Genel frontend’ler (ChatGPT.com) yerine API’yi doğrudan çağırarak ya da backend UI üzerinden kullanıyor; özellikle Claude Sonnet API’yi tercih ediyor
- Sistem prompt’u ve temperature ayarıyla yaratıcılık ile deterministiklik arasında denge kuruyor; genelde
0.0 ~ 0.3 aralığını kullanarak çıktıların daha öngörülebilir olmasını sağlıyor
- Hallucination sorunu (gerçekte olmayan içerik üretme) temperature yükseldikçe artma eğiliminde olduğu için buna dikkat ediyor
İşte kullanım örnekleri
- BuzzFeed haber sınıflandırma otomasyonu: Claude API, JSON tabanlı sınıflandırma şeması ve
temperature 0.0 ayarıyla doğru kategori ataması yapıldı
- Haber kümesi özetleme: Benzer 5 haber verilerek ortak başlık ve açıklama döndürülmesi sağlandı; küme özetleme verimli biçimde otomatikleştirildi
- Noktalama ve stil kılavuzu incelemesi: Tüm stil kılavuzu sistem prompt’u olarak eklenip politika temelli dilbilgisi değerlendirmesi yaptırıldı
- Her bir görev için birkaç saat içinde POC tamamlanabildi ve önceki yöntemlere kıyasla birkaç günden fazla zaman kazancı sağlandığı görüldü
Yazmak kendisine ait, eleştiri LLM’den
- Blog yazılarını kendisi yazıyor; üslubunda LLM’in yeniden üretmekte zorlanacağı belirgin özellikler var
- Ancak LLM’den Hacker News kullanıcısı gibi eleştirel yorumlar yazmasını isteyerek, onu mantıksal açıkları bulma aracı olarak kullanıyor
- Bu yöntem metnin kalitesini artırıyor, fakat LLM’in yazının yerini alması söz konusu değil
Kodlama tarafında LLM kullanımı
- Regex yazma, Pillow ile görsel birleştirme gibi karmaşık ama tekrarlı işlerde LLM’ler verimliliği ciddi ölçüde artırıyor
- Buna karşılık Polars gibi yeni kütüphaneler söz konusu olduğunda, LLM’in bunu pandas fonksiyonlarıyla karıştırması gibi sorunlar yaşanabiliyor
- Copilot benzeri gerçek zamanlı kod önerileri, zihinsel bağlam değişimini artırıp odağı bozduğu gerekçesiyle tercih edilmiyor
- Yazar, LLM’in sunduğu fikirlerde "fikri alıp kendin düzeltmenin" daha iyi olduğu görüşünü koruyor
Agents, MCP ve Vibe Coding hakkındaki görüşleri
- MCP ve agent’lar kavramsal olarak gelişmiş olsa da pratikte yeni kullanım senaryoları sunmuyor
- Vibe Coding hobi projeleri için işe yarayabilir, ancak resmî ürünler için uygun değil ve sorumluluktan kaçma aracı olarak kullanılmamalı
- Güvenilir kod yazmanın profesyonelliğin temel ölçütü olduğu vurgulanıyor
LLM endüstrisi ve etik üzerine düşünceler
- “LLM’ler işe yaramaz” iddiası gerçek kullanım açısından sahayı yansıtmıyor; asıl mesele kısa vadeli ROI ve sektör yapısı
- Açık kaynak modeller ve alternatif altyapılar (Cerebras, Groq vb.), OpenAI ortadan kalksa bile LLM talebini karşılayabilir
- Sonuç olarak LLM, amaca uygun biçimde kullanılacak bir araç; ne koşulsuz övgü ne de toptan reddiye güvenli bir yaklaşım
Kapanış
- LLM, yuvarlak deliğe kare çiviyi zorla sokmaya benzeyen bir araç; yani bazen verimsiz, bazen de dönüştürücü olabilir
- Önemli olan, onu ne zaman, nerede ve nasıl kullanacağını bilen teknik yargı gücü; LLM çağındaki asıl yetkinlik de bu
2 yorum
En son satıra katılıyorum. Ayrıca benim hissettiklerim de benzerdi; sonuçta AI ve LLM, kullanıcının yeteneği kadar kullanılabilen ve değerlendirilebilen araçlar.
Hacker News görüşü
Deneyimli programcıların LLM'lerle çalışırken yaşadığı kafa karıştırıcı noktalarla ilgili görüşler var
UI ya da web sitesi maketleri hazırlarken vibe coding kullanılıyor
LLM'lerden en iyi sonucu almak için çeşitli yöntemler kullanılmış
Daha az popüler kütüphanelerle ilgili karmaşık kod sorularında LLM çıktısına daha temkinli yaklaşılıyor
Yeni bir kütüphanenin dokümantasyonunu ya da tüm kod tabanını uzun bağlamlı modele doğrudan yapıştırma yöntemi kullanılıyor
Yazarın sohbet kayıtlarını eklemiş olması beğenilmiş
ChatGPT.com ya da genel kullanıcı arayüzleri kullanılmıyor
Sistem prompt'unun açıkça ayarlanamadığı modern LLM arayüzleri kendi sistem prompt'larını kullanıyor
Üretilen metin için belirli kısıtlar koymak, kullanıcı prompt'undan ziyade sistem prompt'unda daha etkili
Her LLM hizmetinin backend UI'ı kullanılıyor
JSON yanıtları her zaman beklendiği gibi çalışmıyor
LLM, yeni şeyler öğrenmek ya da kısa script'ler yazmak için kullanılıyor