Benim çalıştığım alan da o kadar uç bir düzeyde değil ama yapay zeka alanında araştırma ve geliştirme yapıyorum.
Genelde yaygın olarak kullanılan framework’lerin dışında, gerçek modeli deploy ettiğiniz hedef ortamın eğitimin yapıldığı ortamdan farklı olduğu durumlar da oluyor.
Bazı operasyonlar desteklenmediği için platforma göre custom operation’lar geliştirmek gerekebiliyor. Bu durumda, geliştirilen ortamda hemen test edemediğiniz durumlar da sıkça oluyor.
Modeli doğrudan modellediğimiz durumlar da var; belli verilerle test kodu yazabiliyorsunuz ama veri setine göre değerler olasılıksal olarak değişebiliyor ve belirli bir noktada değerlerin patlaması gibi olguları test koduyla kapsamak zor olabiliyor.
Muhtemelen benden daha da zor test edilen ortamlar epey vardır diye düşünüyorum.
SQLite'ın yaklaşımı gerçekten çok etkileyici. Kodun 590 katına ulaşan test paketini gizli tutmak, sonuçta "yazılımın gerçek değerinin davranış spesifikasyonunda olduğu" anlamına geliyor.
Gerçekten de bugünlerde yapay zeka destekli kodlama araçlarıyla proje oluşturmayı denediğinizde, mevcut bir projenin README'si + API dokümantasyonu + test kodları varsa temel işlevleri şaşırtıcı derecede hızlı biçimde kopyalamak mümkün oluyor. Bunu bizzat 7 proje yönetirken hissettim; testleri ne kadar iyi yazılmışsa, projeyi kopyalamak da paradoksal biçimde o kadar kolay oluyor.
Ancak Cloudflare vs Vercel örneğinde gözden kaçan bir nokta var: "kopyalama" ile "işletme" tamamen farklı problemler. Next.js'in edge case'lerini, eklenti ekosistemini ve topluluk bağımlılıklarını yeniden üretmek istiyorsanız, yalnızca test kodları yetmez. Sonuçta asıl hendeğin test kodu + topluluk + operasyonel bilgi birikiminin birleşimi olduğunu düşünüyorum.
Bu projede GC’nin sorun olacak düzeyde olduğunu sanmıyorum. Aslında “son dönemdeki çoğu proje” içinde programlama dili seçiminin, belirli bir dilin avantajları ya da sınırlamalarından ziyade çoğu zaman bir zevk meselesi olduğunu düşünüyorum; yine de Rust’ın genel amaçlı bir programlama dili olarak Go’ya karşı hangi karşılaştırmalı üstünlüklere sahip olduğu sorulursa, benim cevabım Rust’ın sunduğu soyutlama düzeyi ve derleme zamanında çeşitli hataları yakalayabilmesi olurdu. Elbette Go’nun da Rust’a karşı daha kolay asenkron programlama, hızlı derleme süresi ve sade sözdizimi gibi avantajları var.
Aynı düzeyde bir sözleşme olsa bile, güvenilirlik ya da imaj açısından gerçekten çok farklı hissettiriyor.
Galiba GPT aboneliğimi iptal etmem gerekecek.
Rust'ta hataların büyük bir kısmı derleme sırasında yakalandığı için, derlemenin başarısız olması bile aslında yapay zekanın doğru yolda ilerlemesine yardımcı oluyormuş gibi bir his veriyor.
Şey, bu sadece bir tahmin ama bence bunun nedeni Rust’a giriş engelinin ortadan kalkmış olması olabilir.
En büyük zorluk, kod yazınca derlemenin sürekli başarısız olmasıydı; artık bunu yapay zeka sizin yerinize hallediyor.
DIY, maker hareketi, indie, punk ve açık kaynak; bunların hepsi endüstrileşme, kapitalizm ve tüketimciliğe karşı bir itiraz ama onların sınırlarını aşmanın yolunun tüketimciliği kabullenmek olması ne tuhaf.
Vibe coding'in tüketim çerçevesine uygun olduğuna katılıyorum. Bence bu, yakın zamanda popüler olan Temu kutu açma, Ali kutu açma (https://www.asiae.co.kr/article/2024053117460950053) akımının kodlama versiyonu.
Ama tüketim çerçevesinin maker hareketinin başarısızlığını tekrar etmemenin yolu olduğu söyleniyorsa, HN'deki yorumlarda olduğu gibi buna çeşitli açılardan katılmam mümkün değil.
Vibe coding, vatandaş geliştiricilerin tarihsel çizgisini sürdürüyor.
Vibe coding’in artık kodlamayı adeta elektrik kadar kolay, hızlı ve vazgeçilmez bir şeye dönüştürdüğünü düşünüyorum.
Şimdiden birçok şirketteki dâhi programcılar bile tek satır kod yazmadan, prompt’lar ve ajanlarla kodlamayı sürdürüyor.
Bunu küçümsemeye çalışanlar var, ancak Andrej Karpathy’nin ortaya attığı vibe coding’in bilgisayar tarihinde iz bırakacak bir gelişme olduğuna itiraz etmenin zor olduğunu düşünüyorum.
İyi bir soru. Aslında deneyimizdeki "hibrit" koşul tam olarak bu yöndeydi — düzenlenmiş özetle birlikte ham deneyim günlüklerini de sunan bir yapıydı.
Sonuç olarak hibrit yaklaşım 4.95/5.0 ile en yüksek puanı aldı. Yalnızca özet verildiğinde puan 2.65'ti; ancak buna "başarısız oldu", "nedeni bilinmiyor" gibi süreç kayıtları eklenince, özetin zayıf yönleri tersine telafi edilmiş oldu.
Bu yüzden sonuç şu: "Sorun özetin kendisinde değil, sürecin ve belirsizliğin de birlikte aktarılması gerekiyor."
Ancak N=1 olduğu için bunun farklı kullanıcı gruplarında genel amaçlı olarak kullanılabilecek bir içerik olup olmadığını görmek için ek araştırma gerekiyor.
Peki, sentetik belleğin bu tür görevlerin süreçlerini, başarısızlıklarını ve başarılarını içerecek şekilde yapılandırılması durumu biraz değiştirir mi?
Kesinlikle. Ben de başta sentetik belleğin en azından baseline'dan daha iyi olacağını düşünmüştüm, ama sonuçları görünce şaşırdım.
İnceleyince kilit noktanın "belirsizliğin korunması" olduğunu gördüm. Ham loglarda "bunu denedik ama olmadı", "sebebini bilmiyorum" gibi izler kaldığı için ajan bilmediği şeylere bilmediğini söyleyerek yanıt veriyor; ama özetlenmiş sürümde bu bağlam tamamen silinince, aksine yanlış cevapları kendinden emin bir şekilde vermeye başlıyor.
"İçerik yok" şeklindeki özet hatasıyla ilk kez karşılaşıyorum..
Benim çalıştığım alan da o kadar uç bir düzeyde değil ama yapay zeka alanında araştırma ve geliştirme yapıyorum.
Genelde yaygın olarak kullanılan framework’lerin dışında, gerçek modeli deploy ettiğiniz hedef ortamın eğitimin yapıldığı ortamdan farklı olduğu durumlar da oluyor.
Bazı operasyonlar desteklenmediği için platforma göre custom operation’lar geliştirmek gerekebiliyor. Bu durumda, geliştirilen ortamda hemen test edemediğiniz durumlar da sıkça oluyor.
Modeli doğrudan modellediğimiz durumlar da var; belli verilerle test kodu yazabiliyorsunuz ama veri setine göre değerler olasılıksal olarak değişebiliyor ve belirli bir noktada değerlerin patlaması gibi olguları test koduyla kapsamak zor olabiliyor.
Muhtemelen benden daha da zor test edilen ortamlar epey vardır diye düşünüyorum.
SQLite'ın yaklaşımı gerçekten çok etkileyici. Kodun 590 katına ulaşan test paketini gizli tutmak, sonuçta "yazılımın gerçek değerinin davranış spesifikasyonunda olduğu" anlamına geliyor.
Gerçekten de bugünlerde yapay zeka destekli kodlama araçlarıyla proje oluşturmayı denediğinizde, mevcut bir projenin README'si + API dokümantasyonu + test kodları varsa temel işlevleri şaşırtıcı derecede hızlı biçimde kopyalamak mümkün oluyor. Bunu bizzat 7 proje yönetirken hissettim; testleri ne kadar iyi yazılmışsa, projeyi kopyalamak da paradoksal biçimde o kadar kolay oluyor.
Ancak Cloudflare vs Vercel örneğinde gözden kaçan bir nokta var: "kopyalama" ile "işletme" tamamen farklı problemler. Next.js'in edge case'lerini, eklenti ekosistemini ve topluluk bağımlılıklarını yeniden üretmek istiyorsanız, yalnızca test kodları yetmez. Sonuçta asıl hendeğin test kodu + topluluk + operasyonel bilgi birikiminin birleşimi olduğunu düşünüyorum.
Vay be
Bu projede GC’nin sorun olacak düzeyde olduğunu sanmıyorum. Aslında “son dönemdeki çoğu proje” içinde programlama dili seçiminin, belirli bir dilin avantajları ya da sınırlamalarından ziyade çoğu zaman bir zevk meselesi olduğunu düşünüyorum; yine de Rust’ın genel amaçlı bir programlama dili olarak Go’ya karşı hangi karşılaştırmalı üstünlüklere sahip olduğu sorulursa, benim cevabım Rust’ın sunduğu soyutlama düzeyi ve derleme zamanında çeşitli hataları yakalayabilmesi olurdu. Elbette Go’nun da Rust’a karşı daha kolay asenkron programlama, hızlı derleme süresi ve sade sözdizimi gibi avantajları var.
Aynı düzeyde bir sözleşme olsa bile, güvenilirlik ya da imaj açısından gerçekten çok farklı hissettiriyor.
Galiba GPT aboneliğimi iptal etmem gerekecek.
Can sıkıcı, özür dilerim
Vay be, harika. Görünüşe göre bunu RustPython sayesinde başarmışsınız. Umarım güzel sonuçlar alırsınız!
Rust'ta hataların büyük bir kısmı derleme sırasında yakalandığı için, derlemenin başarısız olması bile aslında yapay zekanın doğru yolda ilerlemesine yardımcı oluyormuş gibi bir his veriyor.
Başvurdum.
Şey, bu sadece bir tahmin ama bence bunun nedeni Rust’a giriş engelinin ortadan kalkmış olması olabilir.
En büyük zorluk, kod yazınca derlemenin sürekli başarısız olmasıydı; artık bunu yapay zeka sizin yerinize hallediyor.
Sanırım bir şaka testiydi.
DIY, maker hareketi, indie, punk ve açık kaynak; bunların hepsi endüstrileşme, kapitalizm ve tüketimciliğe karşı bir itiraz ama onların sınırlarını aşmanın yolunun tüketimciliği kabullenmek olması ne tuhaf.
Vibe coding'in tüketim çerçevesine uygun olduğuna katılıyorum. Bence bu, yakın zamanda popüler olan Temu kutu açma, Ali kutu açma (https://www.asiae.co.kr/article/2024053117460950053) akımının kodlama versiyonu.
Ama tüketim çerçevesinin maker hareketinin başarısızlığını tekrar etmemenin yolu olduğu söyleniyorsa, HN'deki yorumlarda olduğu gibi buna çeşitli açılardan katılmam mümkün değil.
Vibe coding, vatandaş geliştiricilerin tarihsel çizgisini sürdürüyor.
Vibe coding’in artık kodlamayı adeta elektrik kadar kolay, hızlı ve vazgeçilmez bir şeye dönüştürdüğünü düşünüyorum.
Şimdiden birçok şirketteki dâhi programcılar bile tek satır kod yazmadan, prompt’lar ve ajanlarla kodlamayı sürdürüyor.
Bunu küçümsemeye çalışanlar var, ancak Andrej Karpathy’nin ortaya attığı vibe coding’in bilgisayar tarihinde iz bırakacak bir gelişme olduğuna itiraz etmenin zor olduğunu düşünüyorum.
İyi bir soru. Aslında deneyimizdeki "hibrit" koşul tam olarak bu yöndeydi — düzenlenmiş özetle birlikte ham deneyim günlüklerini de sunan bir yapıydı.
Sonuç olarak hibrit yaklaşım 4.95/5.0 ile en yüksek puanı aldı. Yalnızca özet verildiğinde puan 2.65'ti; ancak buna "başarısız oldu", "nedeni bilinmiyor" gibi süreç kayıtları eklenince, özetin zayıf yönleri tersine telafi edilmiş oldu.
Bu yüzden sonuç şu: "Sorun özetin kendisinde değil, sürecin ve belirsizliğin de birlikte aktarılması gerekiyor."
Ancak N=1 olduğu için bunun farklı kullanıcı gruplarında genel amaçlı olarak kullanılabilecek bir içerik olup olmadığını görmek için ek araştırma gerekiyor.
Peki, sentetik belleğin bu tür görevlerin süreçlerini, başarısızlıklarını ve başarılarını içerecek şekilde yapılandırılması durumu biraz değiştirir mi?
Kesinlikle. Ben de başta sentetik belleğin en azından baseline'dan daha iyi olacağını düşünmüştüm, ama sonuçları görünce şaşırdım.
İnceleyince kilit noktanın "belirsizliğin korunması" olduğunu gördüm. Ham loglarda "bunu denedik ama olmadı", "sebebini bilmiyorum" gibi izler kaldığı için ajan bilmediği şeylere bilmediğini söyleyerek yanıt veriyor; ama özetlenmiş sürümde bu bağlam tamamen silinince, aksine yanlış cevapları kendinden emin bir şekilde vermeye başlıyor.
Ampirik olarak bir ölçüde hissettiğim bir şeydi ama sentetik bellek düşündüğümden bile çok daha fena durumda.
Denemeye çalıştım ama yalnızca gemini 2.5'e kadar destekliyor... Desteklenen model listesi de vibe coding ile mi yapılmış acaba