EasiFFRA:一種基于鄰域粗糙集的屬性快速約簡算法

王念; 彭政紅; 崔莉 中國科學院計算技術研究所; 北京100190; 中國科學院大學; 北京100190

關鍵詞:鄰域粗糙集 特征約簡 對稱機制 過濾機制 散列分桶 

摘要:從高維異構感知信息中提取有效特征是支撐物聯網系統預測與識別的基礎.物聯網場景中通常包括多個多種感知節點,系統通常會從感知數據中提取大量特征,其中不乏部分無關和冗余特征.這些無關及冗余特征會降低系統的運行速度,引入冗余計算,更會影響后續的分類及預測等機器學習操作的性能.因而高效識別并提取低維有效的特征子集是物聯網數據分析所面臨的一大挑戰.鄰域粗糙集方法能夠在保持數據集可分性的前提下,識別和去除無關及冗余特征子集,從而達到降維效果.但由于現有基于鄰域粗糙集的特征約簡算法的計算開銷大、運行時間長,故而并未得到廣泛應用.提出了一種基于鄰域關系對稱性及決策值過濾策略的特征快速約簡算法EasiFFRA.EasiFFRA可通過改進的散列分桶方法加速正域樣本計算,可檢驗并過濾冗余決策值樣本,從而降低現有方法中由于重復距離評估所帶來的冗余計算.實驗結果表明:EasiFFRA在實際采集的水質數據集和多個不同樣本量及維度的公開數據集中平均加快75.45%的特征約簡時間,其約簡結果和已有鄰域粗糙集特征約簡算法等效,可有效解決物聯網數據分析中由冗余及無關特征導致的分類及預測精度下降問題,有重要應用價值.

計算機研究與發展雜志要求:

{1}摘要200字左右,應具有獨立性和自明性,闡明撰寫該文的目的、方法、結論并體現出原創性,不加引注。

{2}來稿請恪守學術道德,嚴禁抄襲。

{3}來稿經審查后,編輯部有權對來稿作適當文字修改.來稿不退,請作者自留底稿。

{4}間接引文通常以“參見”或“詳見”等引領詞引導,反映出與正文行文的呼應,標注時應注出具體參考引證的起止頁碼或章節。標注項目、順序與格式同直接引文。

{5}本期刊的文獻引證方式均采用頁下注(腳注),采用小五號宋體,每頁單獨編號,注釋中卷次、出版時間、刊期、頁碼一律用阿拉伯數字表示。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

計算機研究與發展

北大期刊
1-3個月下單

關注 9人評論|0人關注
服務與支付
国产精品视频线观看26uuu,免费av网站在线观看,免费一级a四片久久精品网,国产成人无码精品久久久露脸
一级a性色生活片久久无 | 亚洲中文久久精品一码 | 在线人成视频福利免费 | 午夜精品亚洲一区二区三区嫩草 | 亚洲欧美久久一区二区 | 亚洲天堂在线免费观看 |