Yapay Zeka Korece-İngilizce/İngilizce-Korece Çevirmeni Dodari

(github.com/vEduardovich)

40 puan yazan tominam2 2024-04-13 | 14 yorum | WhatsApp'ta paylaş

Kendi bilgisayarınızda sınırsız şekilde Korece-İngilizce ve İngilizce-Korece yapay zeka çevirisi yapabilirsiniz.

Genel makine çevirisine kıyasla kalite daha yüksektir.
txt ve epub dosyaları çevrilebilir.
Çıktı olarak iki dosya üretilir: çevrilmiş metinle birlikte özgün metin dosyası ve çeviri metni dosyası. Çeviride bir tuhaflık olursa özgün metinle hemen karşılaştırabilirsiniz.
Kullanımı çok kolaydır. Çeviri gereken dosyaları sürükledikten sonra yalnızca çeviriyi çalıştırma düğmesine tıklamanız yeterlidir. Korece↔İngilizce çeviriyi kendisi yapar.
Farklı bir yapay zeka modeliyle değiştirilebilir. Şu anda fiyat/performans açısından iyi olan NHNDQ kullanılıyor.

14 yorum

upkit2 2024-04-16

Merhaba, kurulum sırasında cmdyi kapattım; ondan sonra klasörü silip yeniden kursam da kurulum ilerlemiyor,,, bunu çözmenin bir yolu var mı?T_T

tominam2 2024-04-17

Elbette. Çözmemiz gerekiyor.
Ama önce tam olarak neyin çalışmadığını, durumun nasıl olduğunu biraz anlamamız lazım.

https://github.com/vEduardovich/dodari/issues
Yukarıdaki Dodari GitHub sayfasında new issue düğmesine basıp yeni bir issue oluşturduktan sonra

Neyin nasıl çalışmadığını, ekran görüntüsü veya durumu biraz daha ayrıntılı açıklayabilir misiniz?
Mutlaka çözeceğim.

illuza 2024-04-15

Vay canına, gerçekten harikasınız.
Ben DeepL kullanıyorum ama karşılaştırarak yavaş yavaş inceleyeceğim.
Özellikle İngilizce edebiyat metinlerini hemen karşılaştırmak istiyorum.

tominam2 2024-04-15

Belirttiğiniz kısım şu anda benim de en çok eksik hissettiğim nokta.
Şu anda Dodari'de kullanılan model, facebook-nllb adlı 200 dilli çoklu çeviri modelinin Koreceye özel olarak fine-tune edilmiş bir sürümü olan NHNDQ modeli. Ancak bu model Google Translate'den daha iyi olsa da DeepL'e kıyasla oldukça geride kalıyor.

Bunu çözmek için çeşitli modelleri test ederken, Korece'de 0. seviye denilen yanolja-eeve modelini çalıştırdım ve şaşıracak kadar iyi olduğunu gördüm. Benim hissiyatıma göre DeepL'in %80~90 seviyesindeydi.

Ancak bu modeli kullanabilmek için kullanıcının bilgisayarında en az 23 GB VRAM olması gerekiyor. Ayrıca çeviri hızı onlarca kat yavaşladığı için hızlandırma amacıyla vllm teknolojisini uygulamak gerekiyor. Bunu yapınca hız büyük ölçüde artsa da bu kez mutlaka Linux OS gerekiyor. Yani yalnızca “4090 ve Linux OS kullanan geliştiriciler” Yanolja modelini çalıştırabiliyor.

Şu anda düşündüğüm konu bu. Üzücü.

kunggom 2024-04-15

Daha fazla açıklamaya ihtiyaç var mı?

tominam2 2024-04-15

NHNDQ'nun ana modeli, 200 dili kapsayan çok dilli bir çeviri modeli olan facebook-nllb.
Bu yüzden bazen böyle uzaylı dili gibi çeviriler yapıyor.

kunggom 2024-04-15

Ürünün adının, Korece çeviri kalitesinin hâlâ biraz zayıf olması nedeniyle Prigate olayı kahramanı Dodorinin lakabından alınmış gibi göründüğünden, o olayda ortaya çıkan ve çeviri aracı kullanımındaki eşi benzeri görülmemiş hata olan “必要韓紙”dan söz etmeden geçemedim.

roxie 2025-06-14

Gerekli miydi? Arkasında böyle hüzünlü bir tarih varmış..

tominam2 2024-04-15

Sanırım epey karmaşık bir olay yaşanmış. Okusam da pek anlayamıyorum, hüzünlü bir ifade.

"Dodari" adını mixtral-7bx8 modeliyle yaptığım bir konuşma sonucunda buldum.
Başta yapay zeka "Dil Köprüsü" adını önermişti ama benim çizmesi kolay, net bir imgeye ihtiyacım vardı; bu yüzden şaka yollu "Dodari" nasıl olur diye sordum. Ben de kulağa epey alakasız geldiğini düşünüyordum.

Ama yapay zeka, Dodari'nin "yardım eden köprü" anlamına geldiğini ve bunun çok iyi olduğunu söyledi. Hiç aklıma gelmeyen bir yorumdu, bu yüzden oldukça yaratıcı buldum. Dodari adı böyle ortaya çıktı.

kunggom 2024-04-15

Oldukça eski bir olaydı ama o dönemde Kore internet topluluklarında epey meşhur bir vakaydı.
Kabaca özetlersek şöyleydi.

Bir Naver kafenin yöneticisi 도더리, sınırlı sayıda üretilmiş Japon müzik CD’sini 70.000 wona toplu siparişle alacaklarını duyuran bir ilan paylaştı
Ardından ilk toplu siparişe katılanların listesi yayımlandı, fakat isimler ve adresler bir tuhaf göründüğü için insanlar şüphelenmeye başladı
Kafedeki bir üye, söz konusu CD’nin aslında sınırlı üretim olmadığını ve fiyatının da yalnızca 30.000 won bandında olduğunu ortaya çıkarıp itiraz edince 도더리 onu kafeden atınca olay büyüdü
도더리nin Japon şirketle yazıştığını söyleyerek yayımladığı e-postalarda “必要韓紙” gibi absürt çeviri aracı kullanım hataları ortaya çıkınca olay dışarıdakiler arasında da ün kazandı
Sonradan ortaya çıktığına göre 도더리, tabir caizse ağır bir mitomani eğilimi olan biriydi; internette paylaştığı kendi geçmişine dair anlatıların büyük kısmı saçma sapan gösteriş ve yalanlarla doluydu

Bu arada büyük dil modelleri bazen gerçekten hiç beklenmedik yorumlar çıkarıyor; ama bunların kulağa makul geldiği durumları ben de zaman zaman yaşadım.
İnsanlarla konuşurken tek başıma fark edemediğim noktaların ortaya çıkması gibi bir olguyu artık makinelerle yaptığım konuşmalarda da deneyimliyor gibiyim.

tominam2 2024-04-15

Aman tanrım. Ama galiba yakalanmamış.
Bana göre chatGPT fazla uslu bir tip olduğu için eğlenceli değil; Mixtral ise sansürü olmadığı için mi bilmiyorum, sohbet çok daha ilgi çekici.

kunggom 2024-04-15

Wiki’deki içeriğe göre kendisine dava bile açılmış, sonra da yalvarıp af dileyince hoşgörü gösterilip konu kapatılmış. Dava edildiği sıradaki statüsünün kamu hizmeti görevlisi olduğu söyleniyor.

Ben ise kişisel PC performansım nedeniyle henüz yerelde çalışan bir LLM’i doğrudan denemedim. Şimdilik sadece GPT-4 düzeyinde kullanıyorum, ama Claude-3 için ek abonelik almayı düşünüyorum.

savvykang 2024-04-14

Huggingface modelini çalıştırmaktan venv kurulumuna, web servisinin uygulanmasına kadar tamamlanmış bir örnek olduğu için çok faydalı oldu. Paylaştığınız için teşekkür ederim

tominam2 2024-04-14

Yardımcı olabildiysem buna çok sevindim. Asıl ben teşekkür ederim.

Yapay Zeka Korece-İngilizce/İngilizce-Korece Çevirmeni Dodari

İlgili okumalar

14 yorum