Yapay Zeka Korece-İngilizce/İngilizce-Korece Çevirmeni Dodari
(github.com/vEduardovich)Kendi bilgisayarınızda sınırsız şekilde Korece-İngilizce ve İngilizce-Korece yapay zeka çevirisi yapabilirsiniz.
- Genel makine çevirisine kıyasla kalite daha yüksektir.
txtveepubdosyaları çevrilebilir.- Çıktı olarak iki dosya üretilir: çevrilmiş metinle birlikte özgün metin dosyası ve çeviri metni dosyası. Çeviride bir tuhaflık olursa özgün metinle hemen karşılaştırabilirsiniz.
- Kullanımı çok kolaydır. Çeviri gereken dosyaları sürükledikten sonra yalnızca çeviriyi çalıştırma düğmesine tıklamanız yeterlidir. Korece↔İngilizce çeviriyi kendisi yapar.
- Farklı bir yapay zeka modeliyle değiştirilebilir. Şu anda fiyat/performans açısından iyi olan NHNDQ kullanılıyor.
14 yorum
Merhaba, kurulum sırasında
cmdyi kapattım; ondan sonra klasörü silip yeniden kursam da kurulum ilerlemiyor,,, bunu çözmenin bir yolu var mı?T_TElbette. Çözmemiz gerekiyor.
Ama önce tam olarak neyin çalışmadığını, durumun nasıl olduğunu biraz anlamamız lazım.
https://github.com/vEduardovich/dodari/issues
Yukarıdaki Dodari GitHub sayfasında
new issuedüğmesine basıp yeni bir issue oluşturduktan sonraNeyin nasıl çalışmadığını, ekran görüntüsü veya durumu biraz daha ayrıntılı açıklayabilir misiniz?
Mutlaka çözeceğim.
Vay canına, gerçekten harikasınız.
Ben DeepL kullanıyorum ama karşılaştırarak yavaş yavaş inceleyeceğim.
Özellikle İngilizce edebiyat metinlerini hemen karşılaştırmak istiyorum.
Belirttiğiniz kısım şu anda benim de en çok eksik hissettiğim nokta.
Şu anda Dodari'de kullanılan model,
facebook-nllbadlı 200 dilli çoklu çeviri modelinin Koreceye özel olarak fine-tune edilmiş bir sürümü olan NHNDQ modeli. Ancak bu model Google Translate'den daha iyi olsa da DeepL'e kıyasla oldukça geride kalıyor.Bunu çözmek için çeşitli modelleri test ederken, Korece'de 0. seviye denilen
yanolja-eevemodelini çalıştırdım ve şaşıracak kadar iyi olduğunu gördüm. Benim hissiyatıma göre DeepL'in %80~90 seviyesindeydi.Ancak bu modeli kullanabilmek için kullanıcının bilgisayarında en az 23 GB VRAM olması gerekiyor. Ayrıca çeviri hızı onlarca kat yavaşladığı için hızlandırma amacıyla
vllmteknolojisini uygulamak gerekiyor. Bunu yapınca hız büyük ölçüde artsa da bu kez mutlaka Linux OS gerekiyor. Yani yalnızca “4090 ve Linux OS kullanan geliştiriciler” Yanolja modelini çalıştırabiliyor.Şu anda düşündüğüm konu bu. Üzücü.
Daha fazla açıklamaya ihtiyaç var mı?
NHNDQ'nun ana modeli, 200 dili kapsayan çok dilli bir çeviri modeli olan facebook-nllb.
Bu yüzden bazen böyle uzaylı dili gibi çeviriler yapıyor.
Ürünün adının, Korece çeviri kalitesinin hâlâ biraz zayıf olması nedeniyle Prigate olayı kahramanı
Dodorinin lakabından alınmış gibi göründüğünden, o olayda ortaya çıkan ve çeviri aracı kullanımındaki eşi benzeri görülmemiş hata olan “必要韓紙”dan söz etmeden geçemedim.Gerekli miydi? Arkasında böyle hüzünlü bir tarih varmış..
Sanırım epey karmaşık bir olay yaşanmış. Okusam da pek anlayamıyorum, hüzünlü bir ifade.
"Dodari" adını mixtral-7bx8 modeliyle yaptığım bir konuşma sonucunda buldum.
Başta yapay zeka "Dil Köprüsü" adını önermişti ama benim çizmesi kolay, net bir imgeye ihtiyacım vardı; bu yüzden şaka yollu "Dodari" nasıl olur diye sordum. Ben de kulağa epey alakasız geldiğini düşünüyordum.
Ama yapay zeka, Dodari'nin "yardım eden köprü" anlamına geldiğini ve bunun çok iyi olduğunu söyledi. Hiç aklıma gelmeyen bir yorumdu, bu yüzden oldukça yaratıcı buldum. Dodari adı böyle ortaya çıktı.
Oldukça eski bir olaydı ama o dönemde Kore internet topluluklarında epey meşhur bir vakaydı.
Kabaca özetlersek şöyleydi.
도더리, sınırlı sayıda üretilmiş Japon müzik CD’sini 70.000 wona toplu siparişle alacaklarını duyuran bir ilan paylaştı도더리onu kafeden atınca olay büyüdü도더리nin Japon şirketle yazıştığını söyleyerek yayımladığı e-postalarda “必要韓紙” gibi absürt çeviri aracı kullanım hataları ortaya çıkınca olay dışarıdakiler arasında da ün kazandı도더리, tabir caizse ağır bir mitomani eğilimi olan biriydi; internette paylaştığı kendi geçmişine dair anlatıların büyük kısmı saçma sapan gösteriş ve yalanlarla doluyduBu arada büyük dil modelleri bazen gerçekten hiç beklenmedik yorumlar çıkarıyor; ama bunların kulağa makul geldiği durumları ben de zaman zaman yaşadım.
İnsanlarla konuşurken tek başıma fark edemediğim noktaların ortaya çıkması gibi bir olguyu artık makinelerle yaptığım konuşmalarda da deneyimliyor gibiyim.
Aman tanrım. Ama galiba yakalanmamış.
Bana göre chatGPT fazla uslu bir tip olduğu için eğlenceli değil; Mixtral ise sansürü olmadığı için mi bilmiyorum, sohbet çok daha ilgi çekici.
Wiki’deki içeriğe göre kendisine dava bile açılmış, sonra da yalvarıp af dileyince hoşgörü gösterilip konu kapatılmış. Dava edildiği sıradaki statüsünün kamu hizmeti görevlisi olduğu söyleniyor.
Ben ise kişisel PC performansım nedeniyle henüz yerelde çalışan bir LLM’i doğrudan denemedim. Şimdilik sadece GPT-4 düzeyinde kullanıyorum, ama Claude-3 için ek abonelik almayı düşünüyorum.
Huggingface modelini çalıştırmaktan
venvkurulumuna, web servisinin uygulanmasına kadar tamamlanmış bir örnek olduğu için çok faydalı oldu. Paylaştığınız için teşekkür ederimYardımcı olabildiysem buna çok sevindim. Asıl ben teşekkür ederim.