Weka Veri madenciliği
Selam Teknoseyir ailesi, bir ödev için weka ile veri madenciliği yapmam gerekiyordu. Aynı datasette farklı algoritmaları çalıştırdım. Doğruluk oranı hemen hemen aynı çıktı hepsinde de. Ancak ben bu durumları nasıl yorumlamalıyım? Bana bu konuda yardımcı olabilecek var mı?
#akış #datamining
Wekayı kendim kullanmadım. Az çok ne yaptığı belli olduğu için genel olarak cevaplayabilirim.
Aynı veri seti üzerinde farklı algoritmaların benzer sonuçlar vermesi çok doğal olabilir. Özellikle veri seti çok kompleks ilişkiler içermiyorsa, farklı algoritmalar/modeller veri seti içerisindeki kalıpları kolayca bulabilir. Veri setinin karmaşıklığı yüksekse genelde büyük modeller daha iyi sonuç verir. Mesela logistic regression lineer regressiondan daha büyük bir modeldir ve biraz daha zor ilişkileri çıkarabilir.
Benim yardım istediğim nokta şu; Algoritmaları çalıştırdım, belli sonuçlar çıktı. Bu sonuçları karıştırmak ve yorumlamak istiyorum. Yani bunda böyle olurken, şunda böyle sonuç verdi. Ya da bu sonuçlar bu sebepten dolayı böyle çıktı. vb. şekilde yorumlama lazım
Senin istedigin bu sonuçlari analiz etme tekniği
Evet bir nevi öyle diyebiliriz.
Şuradaki makakeyi inceleyebilirsin, orada da sonuclar karşılaştırılmış. https://www.researchgate.net/publication/269270867_Comparison_of_data_mining_classification_algorithms_for_breast_cancer_prediction