- Claude’un yeni Computer Use API’sinin performansını görmek istiyordum, ancak temel proje fazla ağır görünüyordu
- Agent, Claude 3.5 Sonnet’in yerel bilgisayarı doğrudan kontrol edebilmesini sağlayan basit bir Electron uygulaması
- Kullanıcının adım adım onay verdiği "yarı otomatik" modu eklemeyi düşündüm, ancak her adım çok yavaş olduğu için buna gerek olmadığına karar verdim
- Modelin kafası karışırsa çalıştırmayı sonlandırmak için "Durdur" düğmesine basabilirsiniz
Başlarken
git clone https://github.com/corbt/agent.exe
cd agent.exe
npm install
.env.example dosyasını .env olarak yeniden adlandırın ve Anthropic API Key ekleyin
npm start
- Modelden bilgisayarda ilginç bir görev yapmasını isteyin
Desteklenen sistemler
- MacOS
- Teorik olarak Windows ve Linux da desteklenebilir (tüm bağımlılıklar çapraz platform)
Bilinen sınırlamalar
- Yalnızca ana ekranda çalışır
- Yapay zeka bilgisayarı tamamen kontrol edebilir
- Muhtemelen başka birçok sorun da olabilir
İpuçları
- Claude, Firefox’u belirgin şekilde tercih ediyor
- Diğer tarayıcılar da kullanılabilir, ancak Firefox kurarsanız daha iyi çalışır
Yol haritası
- 6 saatte yazılmış bir proje, muhtemelen daha fazla geliştirilmeyecek
- Ancak harika bir PR gelirse inceleyip birleştireceğim
GN⁺ özeti
- Bu proje, Claude’un bilgisayar kullanımı API’sini basitçe test etmenin bir yolunu sunuyor
- Yapay zekanın bilgisayarı tamamen kontrol edebilmesi güvenlik açısından endişe yaratabilir
- Firefox ile uyumu güçlü ve esas olarak MacOS’ta kullanılabiliyor
- Benzer işlevlere sahip projeler arasında AutoHotkey ve Sikuli bulunuyor
1 yorum
Hacker News yorumu
Kyle'ın fikrinin harika olduğunu düşünüyor; deneyimli bir masaüstü otomasyonu ve Electron geliştiricisi olarak kaynak kodunu okuyup temel görevlerde denemeye değer bulmuş
Sisteme bir daemon eklediğini fark etmememizin ne kadar süreceğini merak ediyor
Birkaç yıl önce haberlerde geçen "Alexa, bana bir oyuncak bebek evi sipariş et" olayını hatırlıyor
Wayland kullanan Linux'ta tarayıcı dışı GUI uygulamalarının nasıl otomatikleştirileceğini merak ediyor
Adının .exe olmasının, esasen macOS'u destekleyen çok platformlu bir uygulama gibi görünürken neden böyle olduğunu merak ediyor
Yakın zamanda Cursor'ı "compose" modunda sıfırdan bir full-stack proje başlatmak için denemiş ve sonuçlara şaşırmış
Yapay zekanın bilgisayarı tamamen ele geçirmesini engelleyen bilinen sınırlamalar var
Air gap oluşturup kendi işletim sistemini kodlamasını sağlamak havalı olabilir, ama onu gerçek verilere yakın tutmak istemiyor
Yalnızca basit görevlerde işe yarıyor gibi görünüyor
Bilgisayarların tüm gün meme üretmesini, kendisinin ise ailesiyle ilgilenip bahçeyle uğraşırken kripto kazanmasını istiyor