g1 - Groq üzerinde Llama-3.1 70B kullanarak o1 benzeri bir muhakeme zinciri oluşturma
(github.com/bklieger-groq)- g1, LLM'lerin muhakeme yeteneğini geliştirmek için prompt stratejileri kullanan erken bir prototiptir
- Bu, LLM'lerin mantıksal problemleri çözebilmesini sağlar ve mevcut modellerin zorlandığı sorunları çözmesine yardımcı olur
- g1, açık kaynak topluluğuna yeni stratejiler geliştirmesi için ilham vermek amacıyla açık kaynak olarak yayımlandı
Nasıl çalışır
- g1, dinamik bir Chain of Thought oluşturmak için Llama3.1-70b kullanır.
- Her adımda LLM, bir sonraki muhakeme adımına geçebilir veya nihai yanıtı verebilir.
- Sistem prompt'u, LLM için ipuçları içerir.
- Örneğin, "alternatif yanıtları keşfetmeyi dahil et" ve "cevaba ulaşmak için en az 3 yöntem kullan" gibi yönergeler bulunur.
- Bu yöntemler sayesinde LLM'in muhakeme yeteneği gelişir.
Örnekler
- g1, basit mantık problemlerini %60-80 doğrulukla çözebilir.
- Örnek: "strawberry kelimesinde kaç tane R var?" sorusunda g1 %70 doğruluk gösterir.
Hızlı başlangıç
-
Streamlit UI kullanım şekli:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
Gradio UI kullanım şekli:
cd gradio pip3 install -r requirements.txt python3 app.py
Prompt stratejisi
-
Prompt örneği:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
Prompt yapısı:
- Uzman yapay zeka asistanı rolü verilmesi
- Her adım için başlık ve içerik sağlanması
- JSON biçiminde yanıt verilmesi
- En az 3 adımlık muhakeme aşaması kullanılması
- LLM'in sınırlamalarının farkında olunması ve alternatif yanıtların keşfedilmesinin dahil edilmesi
- Yeniden gözden geçirme sırasında gerçekten farklı bir yaklaşım kullanılması
Öne çıkan fork
- Mult1: Birden çok AI sağlayıcısı kullanarak o1 benzeri bir muhakeme zinciri oluşturma (GitHub Repository)
Katkılar
- Bu uygulama Benjamin Klieger tarafından geliştirildi
GN⁺ özeti
- g1, LLM'lerin muhakeme yeteneğini geliştirmek için prompt stratejileri kullanan erken bir prototiptir.
- Açık kaynak topluluğuna yeni stratejiler geliştirmesi için ilham vermek amacıyla açık kaynak olarak yayımlandı.
- g1, basit mantık problemlerini çözmede mevcut modellere kıyasla daha yüksek doğruluk gösterir.
- Bu yazı, LLM'lerin muhakeme yeteneğini geliştirmek için çeşitli yöntemleri keşfetmek açısından faydalıdır.
- Benzer işlevlere sahip diğer projeler arasında OpenAI'nin o1'i bulunur.
1 yorum
Hacker News görüşü
ollama:8bkullanarak bunu %100 yerelde çalışacak şekilde değiştirdim.9ile.11'den hangisinin daha büyük olduğu sorulan promptta,.9'ın daha büyük olduğu yanıtını veriyor