Kas ir Holdout komplekts? Dažkārt saukta par “testēšanas” datiem, aizturēšanas apakškopa nodrošina galīgo mašīnmācīšanās modeļa veiktspējas aprēķinu pēc tam, kad tas ir apmācīts un apstiprināts. Aizturēšanas komplektus nekad nevajadzētu izmantot, lai pieņemtu lēmumus par to, kurus algoritmus izmantot, vai algoritmu uzlabošanai vai regulēšanai.
Vai savstarpēja validācija ir labāka par turēšanu?
Savstarpēja validācija parasti ir ieteicamā metode, jo tā sniedz jūsu modelim iespēju trenēties vairākos vilcienu testa sadalījumos. Tas sniedz labāku priekšstatu par to, cik labi jūsu modelis darbosies ar neredzamiem datiem. No otras puses, kavēšanās ir atkarīga tikai no viena vilciena testa sadalījuma.
Kas ir noturēšanas pieeja?
Aiztures metode ir vienkāršākā metode klasifikatora novērtēšanai. Izmantojot šo metodi, datu kopa (datu vienumu vai piemēru kolekcija) tiek sadalīta divās kopās, ko sauc par apmācības kopu un testa kopu. Klasifikators veic funkciju, lai piešķirtu datu vienumus noteiktā kolekcijā mērķa kategorijai vai klasei.
Vai man vienmēr ir jāveic savstarpēja validācija?
Kopumā savstarpēja validācija ir vienmēr nepieciešama, ja nepieciešams noteikt optimālos modeļa parametrus, loģistikas regresijai tas būtu C parametrs.
Kāda ir K-reizes krusteniskās validācijas priekšrocība?
ja salīdzina testa MSE ir labāki k-kārtīga CV gadījumā nekā LOOCV. k reizes CV vai jebkura CV vai resampling metodes navuzlabot pārbaudes kļūdas. viņi novērtē pārbaudes kļūdas. k-reizes gadījumā tas labāk veic kļūdu novērtēšanas darbu nekā LOOCV.