數據挖掘 - 應用與趨勢

數據挖掘技術被廣泛應用於不同的領域。有今天的商業數據挖掘系統提供的數竟然有在這一領域的許多挑戰。在本教程中,我們將應用程序和數據挖掘的發展趨勢。

數據挖掘中的應用

下面是在數據挖掘,廣泛應用於區域列表:

  • 財務數據分析

  • 零售業

  • 電信業

  • 生物數據分析

  • 其他科學應用

  • 入侵檢測

財務數據分析

在銀行和金融業的財務數據一般是可靠的高品質極大方便了系統的數據分析和數據挖掘和。下面是幾個典型的案例:

  • 設計和建造數據倉庫的多維數據分析和數據挖掘。

  • 貸款償還預測和客戶信用政策分析。

  • 分類和客戶進行有針對性的營銷聚類。

  • 檢測洗錢和其他金融犯罪的。

零售業

數據挖掘在零售行業的巨大應用,因爲它來自於銷售,客戶購買歷史,貨物運輸,消費和服務收集大量的數據。這是很自然的收集數據的數量將繼續增加,因爲易用性,可用性和網絡的普及迅速擴大。

數據挖掘在零售業有助於識別客戶的購買模式和趨勢。這導致客戶服務和良好的客戶保留和滿意質量的提高。下面是在零售行業的數據挖掘的例子列表:

  • 基於數據挖掘的優勢數據倉庫的設計與施工。

  • 銷售,客戶,產品,時間和地區的多維分析。

  • 分析銷售活動成效。

  • 客戶忠誠度。

  • 產品推薦和交叉引用的項目。

電信行業

今天,電信行業是最新興產業提供各種服務,如傳真,尋呼機,移動電話,互聯網的使者,圖像,電子郵件,網絡數據傳輸等之一,由於新的計算機和通信技術的發展,電信工業正在迅速擴大。這就是爲什麼數據挖掘變得非常重要,幫助和了解企業的原因。

在電信行業數據挖掘有助於確定電信模式,趕上欺詐行爲,更好地利用資源,提高服務質量。這裏是清單例子,其中數據挖掘提升電信服務:

  • 電信數據的多維分析。

  • 欺詐模式分析。

  • 識別異常模式。

  • 多維關聯和序列模式分析。

  • 移動通信服務。

  • 在電信數據分析中使用的可視化工具。

生物數據分析

現在天我們看到,有廣闊的增長,生物,如基因組學,蛋白組學,功能基因組學和生物醫學研究的領域。生物數據挖掘是生物信息學中非常重要的一部分。以下是在哪些方面進行生物數據分析數據挖掘有助於:

  • 語義集成異構的,分佈式的基因組和蛋白質組數據庫。

  • 對齊,索引,相似性搜索和比較分析多個核苷酸序列。

  • 發現的結構模式和遺傳網絡和蛋白途徑的分析。

  • 關聯和路徑分析。

  • 可視化工具在基因數據分析。

其他科學領域

上面討論的應用程序往往處理相對較小而均勻數據集的統計技術是適當的。巨大的數據量已收集到的科學領域,如地球科學,天文學等有大量的被產生,因爲在各個領域,如氣候和生態系統模擬,化學工程,流體力學等的快速數值模擬的數據集以下是數據挖掘在科學應用領域的應用:

  • 數據倉庫和數據預處理。

  • 基於圖的挖掘。

  • 可視化和特定領域的知識。

入侵檢測

入侵是指任何類型的行動,威脅網絡資源的完整性,機密性或可用性。在這個世界連接的安全性已成爲主要問題。隨着工具和技巧互聯網和可用性的提高使用率入侵和攻擊網絡提示入侵檢測成爲網絡管理的重要組成部分。下面是其中的數據挖掘技術可以應用於入侵檢測領域的列表:

  • 開發數據挖掘算法的入侵檢測。

  • 協會和相關分析,彙總,以幫助選擇和建立判別屬性。

  • 分析流數據。

  • 分佈式數據挖掘。

  • 可視化和查詢工具。

數據挖掘系統產品

有很多數據挖掘系統產品和特定領域的數據挖掘應用程序可用。新的數據挖掘系統和應用程序被添加到以前的系統。也正在作出對數據挖掘語言的標準化的努力。

選擇數據挖掘系統

其中數據挖掘系統的選擇將取決於以下數據挖掘系統的特點:

  • 數據類型 - 數據挖掘系統可以處理格式化的文本,基於記錄的數據和關係數據。該數據也可能是ASCII文本,關係數據庫的數據或數據倉庫中的數據。因此,我們應該檢查什麼確切的格式,數據挖掘系統可以處理。

  • 系統問題 - 我們必須考慮數據挖掘系統使用不同操作系統的兼容性。一個數據挖掘系統可能只在一個操作系統或幾個運行。還有,提供基於web的用戶界面,並允許使用XML數據作爲輸入的數據挖掘系統。

  • 數據源 - 數據源是指在數據格式中,數據挖掘系統的操作方式。有些數據挖掘系統只能工作在ASCII文本文件,而其他多個關係數據源。數據挖掘系統還應該支持ODBC連接或OLE DB的ODBC連接。

  • 數據挖掘的功能和方法 - 也有一些只提供一個數據挖掘功能,如分類,而一些提供了多種數據挖掘功能,如概念的描述,發現驅動的OLAP分析,關聯規則挖掘,關聯分析,統計分析,分類,預測,聚類,離羣數據挖掘系統分析,相似性檢索等。

  • 耦合的數據挖掘與數據庫或數據倉庫系統 - 數據挖掘系統需要被加上數據庫或數據倉庫系統。該耦合部件被集成到一個統一的信息處理環境。這裏是下面列出的耦合類型:

    • 無耦合

    • 鬆耦合

    • 半緊密耦合

    • 緊耦合

  • 可擴展性- 有兩個可擴展性問題,數據挖掘,如下所示:

    • 行(數據庫大小)可擴展性 - 數據挖掘系統被認爲是可擴展的列時數或行被放大10倍,這需要不超過10倍以上來執行查詢。

    • 列(尺寸)銷路 - 數據挖掘系統被認爲是可擴展的列,如果與列數的挖掘查詢執行時間線性增加。

  • 可視化工具 - 可視化數據挖掘可分類如下:

    • 數據可視化

    • 挖掘結果可視化

    • 挖掘過程可視化

    • 可視化數據挖掘

  • 數據挖掘查詢語言和圖形用戶界面 - 圖形用戶界面,易於使用,並須提升用戶引導,交互式數據挖掘。不同於關係型數據庫系統中的數據挖掘系統不共享基礎數據挖掘查詢語言。

趨勢數據挖掘

以下是趨勢的數據挖掘,反映追求如建築集成和交互式數據挖掘的環境中,數據挖掘語言的設計挑戰的清單:

  • 應用探索

  • 可擴展性和交互式數據挖掘方法

  • 數據挖掘與整合的數據庫系統,數據倉庫系統和網絡數據庫系統。

  • 數據挖掘查詢語言的標準化

  • 可視化數據挖掘

  • 新的方法來挖掘複雜的數據類型

  • 生物數據挖掘

  • 數據挖掘和軟件工程

  • Web挖掘

  • 分佈式數據挖掘

  • 實時數據挖掘

  • 多數據庫的數據挖掘

  • 隱私保護和數據挖掘信息安全