Herkese selam, Medium’da ilk yazımı yayımladım, geribildirim veya sorularınız olursa olursa yazabilirsiniz.

https://medium.com/p/4ece8c476152

TUS Sorularıyla Yapay Zekâ Testi: Hangi Model Doktorları Geçiyor?

Tıp öğrencilerinin kabusu olan TUS (Tıpta Uzmanlık Sınavı), dünyanın en zor sınavlarından birisi olarak kabul edilir. Peki ya bu sınava bir…
BeğenFavori PaylaşYorum yap
  • AB9 @sqn

    "GPT-4o modeli yine birinci oluyor. Bu sefer doğruluk % 83.5'e geriledi."

    grafikte 85.5 yazıyor.

  • leventp @leventp

    "Tıp öğrencilerinin kabusu olan TUS (Tıpta Uzmanlık Sınavı), dünyanın en zor sınavlarından birisi olarak kabul edilir."

    Kim kabul ediyor mesela, kim yapıyor bu sınavların zorluk sıralamasını? 🙂

    • Alperen @byalperen

      Abi sen konuya uzak olduğun için sana "clickbait" olarak gelebilir, sonuçta bu sıralamayı yapan bağımsız bir kuruluş yok ancak bir sınavın zorluğunu ölçen bilimsel parametreler var; ortalama kaç saatlik çalışma yükü test ediliyor, Difficulty Index kaç (p-değeri TUS'ta çoğu soru için p < 0.30 seviyesinde), geçme sınavı değil sıralama sınavı olması için (Discrimination Index i de yüksek tutmak için) kimsenin bilemeyeceği sorular bilerek konuyor örneğin milyonda bir görülen vakalar, spesifik bir proteinde kaç aminoasit vardır gibi, ki bunu o proteini bulan kişi bile bilmiyor olabilir, Competition Ratio-Pass Rate (Türkiye'de sınava giren-uzmanlık kazanan oranı %30larda, bu oran ABD'deki USMLE için %90larda, İngiltere'deki PLAB için de yüksekti ama hatırlamıyorum). Not: Bu yazı doğal zekayla yazıldı.

    • Mehmet Berk Örüncü @mberko

      @byalperen TUS, yapay zekânın delik deşik edebileceği bir sınav... Ama çok garip hatalar yapıyor. Ben vaka sorularında yanılabilir diye düşünürken salt bilgi sorularında tökezliyor. Doğrudan TUS kitapları ile "fine-tuning" yapılsa muhtemelen sınavı uçurur.

    • Alperen @byalperen

      @mberko evet ama gariplikler var farmakoloji de anatomi de tamamen bilgi odaklı farmakolojide en yüksek ortalamayı yaptıkları halde anatomide en düşük ortalamayı yaptılar, vaka sorularının olduğu dahiliye vs. orta-üst sıralarda. Telif demeden internetteki her veriyle eğittikleri için eğitim verisinde bence kesin TUS, USMLE kaynakları da vardır hatta harrison, robbins gibi textbooklar bile vardır, dediğin gibi bu konuda finetune edilse başarıları daha da artar.