- Görme engelliler için gönüllülerle bağlantı kurup ekranı okuyan "Be My Eyes" hizmetinin benzeri, yapay zeka ile hayata geçirilmiş
- Multimodal bir backend üzerinden görüntüyü izleyip bunun ne olduğunu gerçek zamanlı açıklayan bir web uygulaması
- Açık kaynaklı multimodal model SkunkworksAI'nin BakLLaVA-1 modeli
llama.cppile çalıştırılıyor ve ses çıktısı Web Speech API ile veriliyor
4 yorum
Vay, böyle şeyleri görünce mühendis olmakla gurur duyuyorum. Görme engelli insanlar için gerçekten çok büyük bir yardım olacak gibi görünüyor.
YouTuber One Shot Hansol'un kullandığı
Sullivan Plusadlı bir uygulama da var.Yalnızca metin tanıma değil, nesnelerin özelliklerini de algılıyor gibi görünüyor.
https://youtu.be/EAKGU-uW6Ek
https://www.mysullivan.org/
Be My Eyes - görme engellilere görme yetisi verin
MS'nin görüntü açıklama yapan yapay zekası fotoğrafları insan gibi betimlemeye başladı
Böyle haberler beni çok mutlu ediyor :) Çünkü kızım görme engelli.