Machine learning 中的 validation sample 是屬于in-sample 還是 out-of-sample 呀?在CFA考試中很多人在問這個問題,今天小編給你說說!
機器學習(Machine Learning),是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
machine learning機器學習,就是把收集到的數據分成兩組,一組叫training sample,另一組是validation sample。具體是說,把training sample的數據喂(feed)給電腦,讓它自己識別學習,總結出一套規(guī)律算法。
然后用總結出的算法放到 validation sample (驗證樣本)中檢驗,看規(guī)律是否成立。
機器學習分為兩種 ,一種是supervised,也就是labeled traning data,就是事先認為的給出一些label,比如檢驗桃子和蘋果混合在一起,人為事先給出 檢測表面有沒有毛,果實硬度 這些label讓機器檢驗;另一種是unsupervised,也就是not labeled,機器自己總結特點規(guī)律,比如實際中 銀行反洗錢,和垃圾郵件,都是機器自己識別,人類沒有給label,此外 機器學習的考點還有,需要人類的主觀判斷,會出現overfitting問題,以及暗箱操作(black box)。
然后問的 in sample 還是out of sample 中的sample是指training sample 所以 validation是out of sample 的,所以說它就是out-of-sample,如果你在備考中有很多的不懂的知識,可以跟著一起學習哦!