Bir model eğitiyoruz. Bu basit bir regresyon modeli olabilir, derin öğrenme modeli olabilir veya bir başka mimari olabilir. Modeli eğittikten sonra bazı bilgileri kaydetmek lazım. Modelin kendisini, modelin eğitim sırasındaki doğrulama değerlerini yani eğitim geçmişini, eğitilen model için seçilen parametreleri (öğrenme katsayısı, optimizer, batch, epoch vs) gibi değerleri kaydetmek istiyoruz. Bunu genelde elle yapıyoruz. Ama yapay zeka kütüphaneleri tarafından sunulan kaydetme metotları sadece modelin kendisini veya ağırlıklarını kaydediyor. İsimlendirmeyi biz yapıyoruz, vgg16_512x512_v1 gibi. Bu modeli ne zaman eğittik, hangi veri setiyle eğittik, nasıl eğittik, eğitim süreci nasıl gitti gibi şeyleri daha sonraki tarihlerde elde etmek için bir sürü iş yapmamız gerekiyor. Pickle gibi modüller kullanarak yapabiliyoruz, kendimizce bir takım fonksiyonellikler katarak işin üstesinden gelebiliyoruz. Ama bütün bu işleri yapmak karmaşaya sebep olabiliyor. Bir kere modellerin versiyonlar...
Bilgilerim henüz tazeyken bu blog yazısını yazayım sonra yine vaktimi ayırıp nedir ne değildir diye araştırma yapmadan önce buraya bakarım belki. Bir makaleyi incelerken, makalede örneklem sayısının seçimi için kullanılan bir yönteme denk geldim. Bu yönteme göre eğer örnekleminiz kümeli bir şekildeyde, ideal örneklem sayısını bulmak için Design Effect denklemini kullanarak bulabilirsiniz. Makalemiz şu . Ve makalenin sample size determination kısmında örneklem sayısının nasıl seçildiğinden bahsedilmiş. Ben de merak edip araştırdım. Yani makalede yapılan hesaplama şu şekilde: Design Effect (DE) = 1 + (m-1) x ICC Burada m değeri küme içerisindeki örnek sayısını ifade eder. Interclass Corelation Coefficient (ICC) ise sınıf içi korelasyon katsayısını ifade ediyor. Bireyin kendi kümesi içindeki varyansının genel varyansa oranını belirten bir değer. Makalede kullanılan ICC 0.20 olarak belirlenmiştir ve bu seçimi, Masood ve ark. tarafından 2015 yılında yap...