Haru Ongi - Yapay zeka sesli şükran günlüğü
(play.google.com)Merhaba.
Yapay zeka teknolojisinin insanların günlük yaşamında olumlu değişimler yaratan sıcak bir araç olmasını isteyen bir geliştiriciyim.
Her gün tutulan küçük kayıtların ve içsel değerlendirmelerin birikip hayatı değiştirdiğine inanarak,
herkesin kolayca ve düzenli şekilde yazabileceği bir şükran günlüğü uygulaması olan 'Haru Ongi''yi geliştirdim.
Piyasada zaten çok sayıda harika yapay zeka günlük uygulaması var, ancak sadece metinle teselli bulmanın bir sınırı olduğunu hissettim.
Yanınızda gerçekten bir arkadaş konuşuyormuş gibi hissettiren bir 'ses' gerekliydi.
Bunun için en yeni Gemini modelini kullanarak doğal sesli geri bildirim özelliğini hayata geçirdim.
[Hizmet tanıtımı]
Haru Ongi, şükran günlüğü yazdığınızda seçtiğiniz yapay zeka karakterinin anında sesli olarak empati ve cesaret verici bir yanıt gönderdiği bir uygulamadır.
[Başlıca özellikler]
-
Yapay zeka arkadaşın sesli yanıtı:
Günlüğü yazar yazmaz içeriği analiz edip sesli geri bildirim oluşturur. -
Karakter sahibi 3 yapay zeka arkadaş:
-
Neşeli ve sıcak arkadaş 'Seona': Pozitif enerjiye ihtiyaç duyduğunuzda
-
Sakin ve nazik mentor 'Hyunjun': Gelişime yönelik tavsiyeye ihtiyaç duyduğunuzda
-
Her zaman sizin tarafınızda olan, sıcacık 'Büyükanne Sunja': Sıcak bir teselli ve empatiye ihtiyaç duyduğunuzda
-
-
Veri gizliliği:
- Kullanıcının yazdığı günlük içerikleri AES256 şifreleme uygulanarak güvenli biçimde saklanır.
[Teknoloji yığını ve geliştirme deneyimi]
-
AI Model: Google Gemini 2.5 Flash Native Audio Preview
- Metin üretip ardından TTS ekleme yöntemine kıyasla Native Audio modeli tonlama ve nefes/pause açısından çok daha doğaldı.
- Özellikle 'Sunja (büyükanne)' karakterinin sıcak ve yavaş konuşma tarzını hayata geçirmede etkili oldu.
- Prompt'ları ayarlayarak her karakterin personasını, konuşma hızını, nefesini, tonunu ve duygu ifadesini düzenleyip istediğim karakter sesini oluşturabildim.
- OpenAI'nin GPT Realtime API'si de değerlendirildi, ancak maliyet verimliliği ($20.00 per 1M tokens) göz önünde bulundurularak sonunda Gemini'de birleştirildi.
-
Maliyet optimizasyonu:
- Ses çıktı token maliyeti metne göre çok daha yüksek olduğundan ($12.00 per 1M tokens), sistem prompt'u ile yanıt uzunluğunu kontrol eden bir optimizasyon süreci gerekti.
-
UI iş akışı: Figma Dev Mode ile geliştirme verimliliği artırıldı.
- Yapay zekaya Figma tasarım taslakları ve asset bilgileri bağlam (context) olarak birlikte verildiğinde, UI geliştirme çalışması çok daha kolay hale geldi.
-
Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)
-
Frontend: React Native (Expo), TypeScript
-
Dev Tools: Claude Code (Main), Cursor (Sub)
[Kapanış]
Bugün kendinizi yorgun hissediyorsanız, bir uğrayın.
Şu anda yalnızca Android'de kullanılabiliyor.
Teşekkür ederim.
3 yorum
App Store'da da yayımlandı!
https://smplu.link/F8JwF
Benzer bir hizmet yapıp tek başıma kullandığım için desteklemek istiyorum! Umarım iyi bir ürün olur. Native Audio’ya geçirip yeniden geliştirmeyi denemem gerekecek.
Desteğiniz için teşekkürler hehe. Native Audio modelinin sesi oldukça doğal, bu yüzden denerseniz iyi bir deneyim yaşayacağınızı düşünüyorum.