15 puan yazan GN⁺ 2024-03-13 | 2 yorum | WhatsApp'ta paylaş
  • Devin, dünyanın ilk tamamen otonom yapay zeka yazılım mühendisidir.
  • Devin, insan mühendislerle birlikte ya da bağımsız olarak çalışabilir ve mühendislerin daha ilginç problemlere odaklanmasını sağlar.
  • Devin, karmaşık mühendislik görevlerini planlayıp yürütebilir ve shell, kod editörü, tarayıcı gibi geliştirici araçlarını kullanabilir.

Devin'in yetenekleri

  • Devin, uzun vadeli akıl yürütme ve planlama konusunda ilerleme kaydetmiştir ve karmaşık mühendislik görevlerini binlerce karar vererek yerine getirebilir.
  • Kullanıcıyla iş birliği yaparak ilerlemeyi gerçek zamanlı olarak raporlayabilir, geri bildirim alabilir ve tasarım seçimlerini birlikte yapabilir.
  • Devin, bilmediği teknolojileri öğrenebilir, uygulamalar geliştirip dağıtabilir, kod tabanında hataları bulup düzeltebilir ve kendi yapay zeka modellerini eğitip ince ayar yapabilir.

Devin'in performansı

  • SWE-bench kodlama benchmark'ında Devin, gerçek GitHub issue'larını çözmede önceki en iyi derece olan %1,96'yı açık ara geçerek %13,86 başarı oranına ulaştı.
  • Devin, veri kümesinin rastgele seçilmiş %25'lik bir alt kümesinde değerlendirildi; diğer modeller hangi dosyaları düzenlemeleri gerektiğine dair yardım alırken Devin bunu yardım almadan yaptı.

Cognition hakkında

  • Cognition, akıl yürütmeye odaklanan bir uygulamalı yapay zeka araştırma laboratuvarıdır.
  • Amaçları, günümüz yapay zeka araçlarının ötesine geçen yetenekler sunan yapay zeka ekip arkadaşları geliştirmektir.
  • Cognition, Founders Fund liderliğinde 21 milyon dolarlık Seri A yatırımı aldı ve sektör liderlerinden destek görüyor.
Reklam

Devin'i işe almak

  • Devin şu anda erken erişim aşamasındadır; Devin'i mühendislik işlerinizde kullanmak istiyorsanız Cognition ile iletişime geçebilirsiniz.

Bize katılın

  • Cognition ekibi küçüktür; kurucu ekip 10 IOI altın madalyasına sahiptir ve Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo ve Nuro gibi şirketlerde çalışmış liderler ve üreticilerden oluşur.
  • Devin'i inşa etmek ilk adımdır; en zor meydan okumalar ise hâlâ önümüzde duruyor.

GN⁺ görüşü

  • Devin adlı yapay zeka yazılım mühendisi, yazılım geliştirmenin geleceğini simgeliyor ve otomasyon ile yapay zekanın birleşimi sayesinde mühendislik işlerinin verimliliğini büyük ölçüde artırma potansiyeli taşıyor.
  • Yapay zekanın gerçek mühendislik problemlerini çözmede bu kadar yüksek bir başarı oranı göstermesi dikkat çekici bir gelişme; bu da yapay zeka teknolojilerindeki ilerlemenin gerçek çalışma ortamlarına ne kadar iyi entegre olabildiğini gösteriyor.
  • Ancak yapay zekanın insan işlerini ikame etmesine dair etik ve toplumsal etkilerin dikkate alınması gerekiyor. Yapay zekanın benimsenmesinin istihdam üzerindeki etkisi ve insan rolündeki değişim konusunda dikkatli bir yaklaşım şart.
  • Benzer işlevler sunan diğer yapay zeka tabanlı geliştirme araçları arasında, geliştiricilerin kod yazmasına yardımcı olan ve yaygın olarak kullanılan GitHub Copilot da bulunuyor.
  • Devin gibi teknolojiler benimsenirken veri güvenliği, gizlilik ve yapay zeka kararlarında şeffaflık ile hesap verebilirlik meseleleri göz önünde bulundurulmalıdır. Yapay zeka kararlarının işletmeler ve kullanıcılar üzerindeki etkisini anlamak ve yönetmek önemlidir.

2 yorum

 
yangeok 2024-03-13

Devin'i ücretsiz denemek isterdim :)

 
GN⁺ 2024-03-13
Hacker News yorumları
  • Bir geliştirici ve ürün sorumlusu olarak, yapay zekayla kod yazmayı denedim ama bağlam uzunluğu, modelin zayıf çıktıları ve mimari eksikliği gibi nedenlerle başarısız oldum. Leetcode yardımının ötesine geçen faydalı işleri yapay zekayla yapamadım. Basit bir HTML sayfasından seçicileri çıkarma işini bile çeşitli yapay zeka modelleriyle denedim ama başaramadım. Teknolojik ilerleme konusunda beklentim yüksekti, ancak gerçekten düzgün çalışan bir ürün istiyorum.
  • İnsanlar anlam ve tatmin veren işler arar. Teknolojik ilerlemeyle birlikte zanaatkarlar ilk olarak işe yaramaz hale geliyor. Toplum, değer üretmezsen onurunu tanımayacağı mesajını veriyor. Sanatı ve mühendisliği yapay zekaya bırakarak, anlamayan insanların bile bunlardan ucuza yararlanabilmesini sağlıyoruz. Teknolojik ilerlemenin kimin yararına olduğu ve gelecekte insanın yerinin neresi olduğu sorularını gündeme getiriyor.
  • Scott Wu, 1989'dan bu yana mükemmel puan alan az sayıdaki insandan biri; onunla rekabetçi programlama olimpiyatlarında tanıştım. Olağanüstü yeteneğini değerlendirdiğini görmek sevindirici.
  • Kimlik doğrulaması olmadan rastgele boyutta dosya yüklemeye izin veren bir web sitesinden pek etkilenmedim. Sunucuya 500MB'lık bir dosya yükledim.
  • Yapay zeka bu kadar iyiyse, iyi amaçlar için kullanılmalı. Kıdemli bir yazılım mühendisi olarak, işimin %90'ı kod yazmak değil; karmaşık gereksinimleri net görevlere bölmek, gereksinimlerdeki boşlukları bulup minimum kod yazmak ve kod tabanını anlamak. "AI yazılım mühendisi"nden çok "AI insan ilişkileri sorumlusu"na ihtiyaç var.
  • Demo etkileyici, ancak kapsamı sınırlı olduğu için gerçek dünyada ne kadar iyi çalışacağı belirsiz. Yazılım mimarisi yapıp yapamayacağı, çözümün sadece yeniden üretimden ibaret olup olmadığı ve çözümün %90 doğru olmasının yetmediği durumların ne kadar sık yaşanacağı konusunda soru işaretleri var.
  • Backend geliştirme deneyimi olan biri olarak, LLM'ler temel kütüphane/framework/dili iyi bildiğinizde kod üretiminde inanılmaz bir verimlilik artışı sağlıyor. Ancak yine de her şeyi bilmeniz gerekiyor; yapay zeka her şeyi otomatik olarak yapamıyor.
  • Demo etkileyici ve lansmanı kutluyorum, ancak Devin'in karşılaştığı bug'ların basit düzeltmelerle çözülüp çözülemeyeceğini merak ediyorum. Örneğin, bir KeyError'u çözmek için kodu try-catch ile sarmak kodu çalıştırır, ama bu her zaman ideal çözüm değildir.
  • LLM'ler hâlâ "kafiye uydurma" aşamasında. "Akıl yürütme"ye geçip geçemeyecekleri belirsiz, ama kodlama karmaşık problemler üzerinde akıl yürütme gerektiriyor. Değişimin hızını düşününce hiçbir olasılığı dışlamıyorum.
  • Bu alanda çalışan biri olarak, bugün kodlamada yapay zeka kullanımı yardımcı araçlar ve gelişmiş otomatik tamamlama seviyesinde. Pythagora gibi şirketler insan müdahalesinin önemli olduğunu görüyor ve LLM'leri, verilen talimatlara göre hızlı hareket eden hevesli bir junior geliştirici gibi düşünebilirsiniz. İç prompt'lar ve insanın az miktarda yönlendirmesiyle şaşırtıcı sonuçlar üretebilirler.