https://huggingface.co/cenkersisman/gpt2-turkish-256-token
Türkçe GPT-2 modeli eğitimi yaklaşık 1 senedir devam ediyor. Kayıp değeri son paylaşımdan beri 1.74 seviyesinden 1.68'e düştü. Artık daha uzun cümleler üretebiliyor. Bu modeli bir hamur gibi düşünün. İnce ayar ile eğitildikten sonra farklı amaçlara hizmet verebilir. İnce ayarla bu hamura şekil veriyorsunuz. Bu hamurdan ne ekmekler çıkar ne ekmekler!
Konu ile ilgili yazı: https://medium.com/@cenker/gpt-model-kullan%C4%B1larak-neler-yap%C4%B1labilir-b0569891922a


neden bir yıl sürüyor eğitimi ?
Bu işlemler gerçekte o kadar zahmetli ki büyük firmalar yüzbinlerce GPU'yu aynı anda kullanıyorlar. Bende ise sadece tek bir GPU var.