ocap - Masaüstündeki her şeyi kaydeden yüksek performanslı kaydedici
(github.com/open-world-agents)AI ajanlarının eğitimi için masaüstü verisi toplamak amacıyla geliştirilmiş, ancak genel amaçlı kullanım için de uygun açık kaynaklı kayıt aracı ocap (Omnimodal CAPture).
OBS gibi mevcut kayıt araçları genellikle yalnızca videoyu saklar ya da farklı türde verileri senkronize ederek kaydedemez. Yapay zeka eğitimi için, "kullanıcının ne zaman hangi tuşa bastığı, fareyi nereye hareket ettirdiği ve hangi pencerenin aktif olduğu" gibi bilgileri de içeren senkronize verilere ihtiyaç vardır. Bu aracı bu sorunu çözmek için geliştirdik.
Özellikler:
- Ekran videosu + ses + klavye/fare olayları + pencere olaylarını nanosaniye düzeyinde senkronize ederek kaydeder
- Donanım hızlandırmalı kodlama (H265/HEVC, NVIDIA GPU)
- Tek komutla kaydı başlatma/durdurma:
ocap my-recording→ Ctrl+C - Temel mantık tek bir Python dosyasında (~400 satır) bulunduğu için özelleştirmesi kolaydır
- GStreamer tabanlı olduğu için Linux/macOS genişletmesine uygun bir yapıya sahiptir
- Çıktı: .mkv (video) + .mcap (olay günlüğü, robotik alanında zaten doğrulanmış MCAP formatı)
Kurulum:
conda install open-world-agents::gstreamer-bundle
pip install ocap
Alternatif olarak sürümler sayfasından zip dosyasını indirip run.bat çalıştırabilirsiniz.
Başlangıçta, masaüstü verileriyle Embodied AI eğitmek için yürütülen D2E araştırma projesi (https://worv-ai.github.io/d2e/) kapsamında geliştirildi; ancak genel amaçlı bir masaüstü kayıt aracı olarak da kullanılabildiği için ayrı bir paket olarak ayrıldı.
Şu anda yalnızca Windows + NVIDIA GPU ortamı destekleniyor; AMD/Intel GPU veya diğer işletim sistemi desteği ise yalnızca GStreamer pipeline'ını değiştirerek eklenebilecek şekilde tasarlandı.
GitHub: https://github.com/open-world-agents/ocap
PyPI: https://pypi.org/project/ocap/
Henüz yorum yok.