Vikipedi metinlerinden hazırladığım hala

Cenker Sisman @cenker-sisman
08 Ekim 2023 - 13:58

Vikipedi metinlerinden hazırladığım hala eğitiminin devam ettiği GPT2 modelinin ne kadar öğrendiğini gözlemlemek için bir çalışma yaptım: Ona birkaç ülkenin en önemli 3 şehrini söyledim (sondaki görsel) ve ondan farklı ülkelerin 3 şehrinin ne olabileceğini tahmin etmesini istedim.
Sonuçlar aşağıda: Başta sonuçların hatalı olduğunu düşünebilirsiniz. Ama aslında öğrenmiş. Eğitimin 20.evresinde olduğu için bilmediği konularda bile öğrendiği kadarını yorumladığını farkettim. Dikkat ederseniz şu ana kadar tam eğitilebildiği kadarını doğru doldurabiliyor. Kalan kısımları kültürel benzer ve yakın ülkenin şehirleri ile dolduruyor. Mesela Pakistan ile Hindistan'ı aynı sanıyor. Almanca dillerini konuşan Avusturya ile Almanya'yı, Fransızca konuşan Belçika ile Fransa'yı aynı yere koyuyor. İspanyolca konuşan Meksika ve İspanya'yı da benzer düşünüyor.. Amaç olan 100. evreye yaklaşınca nasıl bir eğitime uğrayacağını merak ediyorum.

Modelin son haline ulaşmak için: (Kullanımı ücretsizdir)
https://huggingface.co/cenkersisman/gpt2-turkish-900m

Model Açıklaması
GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir. Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır. Eğitim setindeki cümleler maksimum 48 tokendan (token = kelime kökü ve ekleri) oluşmuştur bu yüzden oluşturacağı cümlelerin boyu sınırlıdır.. Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 7.5 milyon adımda yaklaşık 12 epoch eğitilmiştir. Eğitim halen devam etmektedir. Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.

#ceydasistan #gpt #gpt2 #chatgpt

Beğen Favori Paylaş Yorum yap

14 2 5

kortex @kortex

Hocam sizin bu projeden kazancınız ne oluyor? Maddi olarak sürdürebiliyor musunuz?

08 Ekim 2023 - 14:12 Yanıtla Beğen 1
- Cenker Sisman @cenker-sisman
  
  merhaba yapay zeka benim çocukluk yaşlarımdan beri ilgi alanım ve geliştirdiklerimi hobi olarak severek geliştiriyorum. Ne yazık ki maddi olarak bir kazanç getirmiyorlar. Ancak maddi bir destek olsaydı kesin daha hızlı geliştirmeler sağlayabilirdim. Elimdeki kişisel notebook sayesinde onu en verimli kullanarak geliştirmelere devam ediyorum.
  
  08 Ekim 2023 - 14:19 Yanıtla Beğen 3
- qubit @qubit
  
  @cenker-sisman Tübitak vs. gibi bir yerlerden destek almayı düşündünüz mü?
  
  08 Ekim 2023 - 14:25 Yanıtla Beğen 1
- Metin @babazula
  
  @leventp @cenker-sisman Levent abiyle yapay zeka konusunda bir yayın yapsanız ne güzel olurdu...
  
  08 Ekim 2023 - 14:36 Yanıtla Beğen 5
Cenker Sisman @cenker-sisman

Bu yazıda kullandığım ve eğitime devam ettiğim model 48 token destekli bir model. Şu anda başka bir makinede 128 token lı daha gelişmiş bir model eğitiyorum. 48 token yaklaşık 48 kelime/hece lik cümleler kurabilmesi demek. 128 tokenlık model ile yaklaşık 3 kat daha uzun cümleleri işleyip üretebilmesini sağlayabileceğiz.
https://huggingface.co/cenkersisman/gpt2-turkish-128-token

08 Ekim 2023 - 14:22 Yanıtla Beğen

Teknoseyir gündemi

Öne çıkan videolar

Xiaomi 17T: Xiaomi'nin En Yenisi!

BİM'de Satılan Oyun Konsolu Polosmart'ı Alıp İnceledik

YouTube'ta telif haklarını ihlal etmeden nasıl yayın yapılır?

Araç alırken ikinci el mi sıfır mı ?

Samsung Galaxy Z Fold 8 Ultra, Fold 8 ve Flip 8 - İlk İzlenimler!

Öne çıkan bloglar

Şekilli MSN Nickleri

Xiaomi Telefonunuzun Aslında Adı Ne? Tüm Mi Telefonların Kod Adları, Şirket İsimlendirmeleri ve Ticari Adları

Türk Telekom Sil Süpür Çıkmıyor Çözümü

Mobil Klima Performans Arttırma (Çift Hortum Hilesi)

ByeDPI Rehberi: DPI Sansürünü Kolayca Aşın!

Öne çıkan incelemeler

Ford Focus Sedan Titanium 1.5 TDCi PowerShift

Samsung SM-B310E

Casio Efa-120L-1A1vdr Erkek Kol Saati

The Bizarre Adventures of Woodruff and the Schnibble

Asus Pen