基于k-均值的基因選擇方法的研究.doc


約37頁DOC格式手機打開展開
基于k-均值的基因選擇方法的研究,摘要基因芯片表達譜數(shù)據(jù)具有樣本數(shù)量小、基因數(shù)量大等特點,且其中涵蓋大量與疾病無關(guān)的基因,這不僅降低了分類器性能,還增加了計算復雜度。因此,對基因選擇進行研究,不僅能提高分類器的性能,還能得到與疾病相關(guān)的特征基因子集,并且能提高人們對疾病的認識。本文利用k-均值聚類方法對備選基因進行初選,...


內(nèi)容介紹
此文檔由會員 那年三月 發(fā)布
基于k-均值的基因選擇方法的研究
摘要
基因芯片表達譜數(shù)據(jù)具有樣本數(shù)量小、基因數(shù)量大等特點,且其中涵蓋大量與疾病無關(guān)的基因,這不僅降低了分類器性能,還增加了計算復雜度。因此,對基因選擇進行研究,不僅能提高分類器的性能,還能得到與疾病相關(guān)的特征基因子集,并且能提高人們對疾病的認識。
本文利用K-均值聚類方法對備選基因進行初選,再對聚類簇的去冗余,然后利用粒子群優(yōu)化算法(PSO)結(jié)合極端學習機(ELM)對初選基因進行篩選,該類方法能有效降低選出基因子集的冗余度并提高基因表達譜數(shù)據(jù)的分類準確。