數據挖掘術語
數據挖掘
數據挖掘是指從大量的數據集提取信息。換句話說,我們可以說,數據挖掘是從數據挖掘領域的知識。此信息可用於任何以下應用程序:
市場分析
欺詐檢測
客戶保留
生產控制
科學探索
數據挖掘引擎
數據挖掘引擎是非常必要的數據挖掘系統。它由一組功能模塊。這些模塊在以下任務:
描述
關聯和相關性分析
分類
預測
聚類分析
異常值分析
進化分析
知識庫
這是領域知識。這方面的知識,用於指導搜索或計算得到的圖案的趣味性。
知識發現
有些人把數據挖掘一樣的知識發現,而有些人認爲在知識發現過程中的數據挖掘必不可少的步驟。以下是參與知識發現過程的步驟列表:
數據清理
數據集成
數據選擇
數據轉換
數據挖掘
評估模式
知識呈列
用戶界面
用戶界面是數據挖掘系統的模塊,可以幫助用戶和數據挖掘系統之間的通信。用戶接口允許以下功能:
通過指定一個數據挖掘查詢任務交互與系統。
提供信息,以幫助集中搜索。
挖掘基於中間數據挖掘結果。
瀏覽數據庫和數據倉庫模式或數據結構。
評估開採模式。
可視化的模式以不同的形式。
數據集成
數據集成是合併來自多個異構數據源的數據轉換成一個連貫的數據存儲中的數據預處理技術。數據集成可能涉及的數據不一致,因此需要數據清理。
數據清理
數據清理是應用於以去除噪聲的數據和校正數據中的不一致之處的一種技術。數據清理涉及轉換改正錯誤的數據。數據清洗,同時準備數據的數據倉庫進行數據預處理步驟。
數據選擇
數據選擇是在相關的分析任務數據從數據庫中檢索的過程。有時,數據轉換和合並前的數據選擇的過程中進行。
集羣
集羣是指一組相似的對象的類型的。聚類分析是指形成組非常相似彼此但與在其他簇中的對象高度不同的對象。
數據轉換
在這個步驟中的數據是由執行彙總或聚集操作轉化或合併成適合挖掘的形式。