[Samsung Electronics] Ev Aletleri MCU Firmware’ini Yapay Zekanın %100 Geliştirdiği Bir Senaryo Mümkün mü?
(techblog.samsung.com)Başlık: Ev Aletleri MCU Firmware’i, yapay zekanın %100 geliştirdiği bir senaryo mümkün mü?
Kaynak: Samsung Tech Blog - https://techblog.samsung.com/blog/article/90
-
Samsung Electronics, “Harness Engineering”i ev aletleri (davlumbaz) MCU firmware geliştirmesine uygulayarak, insanın kodlama müdahalesi olmadan bir yapay zeka ajanının planlama-uygulama-doğrulama döngüsünü otonom biçimde tekrarlayıp firmware’i %100 oluşturup oluşturamayacağını doğruladı
-
Burada “harness”, modeli daha akıllı hâle getirmek değil; yapay zekanın amaçlanan sonucu üretmesini sağlayacak çalışma ortamını (gerekli bilgiler, yasaklar, öz doğrulama döngüsü, klasör yapısı, spesifikasyonlar, kodlama standartları, build/linter) tasarlamak anlamına geliyor. Geliştiricinin rolü “kod yazan kişi”den “spesifikasyon ve harness tasarımcısı”na dönüşüyor
-
Temel ilke şu: “Yapay zekanın doğrulayamadığı bir spesifikasyon, var olmayan bir spesifikasyondur.” Dokümante edilmemiş gereksinimler ne uygulama kriteri ne de doğrulama kriteri olabilir; bu yüzden “var olmayan gereksinim” ile aynıdır (ör. hava akış seviyesinin Low-Mid-High mı yoksa On-Off mu olacağı belirtilmezse yapay zeka kendi başına karar verir). Başlangıç noktası, eski spesifikasyonları ve geliştiricinin “örtük bilgisini” yapay zekanın kullanabileceği biçimde sistemleştiren “spesifikasyon tasarımı”dır
-
Dağınık durumdaki spesifikasyonlar docs/ klasörü merkezli olarak yeniden düzenlendi. Ürün davranışları behavior/ içine, tasarım gerekçeleri design/ içine, donanım yapılandırması ve başlatma bilgileri hardware/ içine kondu; iletişim spesifikasyonları, durum makinesi ve iletişim protokolü de kendi klasörlerinde düzenlendi. Buna, yapay zeka çalışma kurallarını içeren AGENTS.md ve katman yapısı ile bağımlılık kurallarını tanımlayan ARCHITECTURE.md eklenerek harness temeli tamamlandı. Sonuçta dokümantasyon “Single Source of Truth” rolünü üstlendi
-
Spesifikasyon/uygulama/doğrulama şeklindeki üç harness türüne ek olarak, Samsung’a özel MCU spesifikasyonları, MCU debugger kullanım yöntemi ve 220V gücü fiziksel olarak kapatıp açan USB Switch gibi unsurlar “skill” olarak sağlandı. SDD/TDD/BDD ile uygulama kapsamı kontrol edildi; Build/Test/Lint kalite kapılarından geçmeden bir sonraki aşamaya ilerlenmedi
-
AUTOPILOT döngüsü Zero-Base koddan başlayarak planlama-uygulama-doğrulama süreçlerini otonom şekilde tekrarladı. Bu sırada “üreten ajan” ile “değerlendiren/doğrulayan ajan” ayrılarak, yapay zekanın kendi çıktısını fazla olumlu değerlendirmesi engellendi
-
En zor görev, yapay zekanın çıktıyı “gerçek MCU” üzerinde doğrudan kontrol edebileceği bir ortam kurmaktı. Doğrulama ortamı PC üzerindeki Codex AI + JTAG tabanlı MCU debugger + güç kontrolü için USB Switch’ten oluşuyor; Codex AI debugger ve switch’i kontrol ediyor. Debugger MCU durumunu doğrudan okuyup yazıyor; USB Switch ise 220V gücü açıp kapatarak kurtarılamaz durumlarda bile yapay zekanın seti kendi başına sıfırlamasını sağlıyor
-
Yapay zekaya ürün spesifikasyonları, protokol ve paket bilgileri, MCU datasheet’i, debugger kullanım yöntemi, kaynak kod ve değişken yapısı, güç On/Off yöntemi sağlandı. Yapay zeka spesifikasyonları analiz ederek “otonom iradesiyle” test senaryoları çıkardı; debugger ile gerçek sete tuş girdisi enjekte etti (belleğe Write), ardından durum değerlerini değişken olarak okudu (bellekten Read) ve senaryo bazında Pass/Fail kararını kendi verdi. Yani “davranış senaryosu + memory Write + memory Read” üç öğesi birlikte çalıştığında otonom otomatik doğrulama mümkün oluyor
-
Sonuç: 5 denemenin tamamı insan müdahalesi olmadan otonom şekilde tamamlandı (her biri yaklaşık 4,5~5,5 saat); temel davranış tamamlanma düzeyi yaklaşık %95 oldu. Eksik kalan yaklaşık %5’lik bölüm çoğunlukla HAL (UART, Timer, WatchDog, Clock gibi gerçek HW doğrulama alanları) tarafında ortaya çıktı ve insanla 1~4 saatlik debugging ile tamamlanabilir
-
Geliştirme süresinin ortalama %50~70 kısalabileceği doğrulandı. Ancak bu, onay/review/release süreçleri hariç saf geliştirme süresi bazında yapay zeka tahminidir; ilk yatırım ve “insanın kodu review etmesine gerek kalmayacak düzeyde kusursuz doğrulama kriterleri” oluşturmak, yaygınlaşmanın önündeki görevlerdir
Henüz yorum yok.