資料挖掘 - 應用與趨勢


資料挖掘技術被廣泛應用於不同的領域。有今天的商業資料挖掘系統提供的數竟然有在這一領域的許多挑戰。在本教學中,我們將應用程式和資料挖掘的發展趨勢。

資料挖掘中的應用

下面是在資料挖掘,廣泛應用於區域列表:

  • 財務資料分析

  • 零售業

  • 電信業

  • 生物資料分析

  • 其他科學應用

  • 入侵檢測

財務資料分析

在銀行和金融業的財務資料一般是可靠的高品質極大方便了系統的資料分析和資料挖掘和。下面是幾個典型的案例:

  • 設計和建造資料倉庫的多維資料分析和資料挖掘。

  • 貸款償還預測和客戶信用政策分析。

  • 分類和客戶進行有針對性的行銷聚類。

  • 檢測洗錢和其他金融犯罪的。

零售業

資料挖掘在零售行業的巨大應用,因為它來自於銷售,客戶購買歷史,貨物運輸,消費和服務收集大量的資料。這是很自然的收集資料的數量將繼續增加,因為易用性,可用性和網路的普及迅速擴大。

資料挖掘在零售業有助於識別客戶的購買模式和趨勢。這導致客戶服務和良好的客戶保留和滿意品質的提高。下面是在零售行業的資料挖掘的例子列表:

  • 基於資料挖掘的優勢資料倉庫的設計與施工。

  • 銷售,客戶,產品,時間和地區的多維分析。

  • 分析銷售活動成效。

  • 客戶忠誠度。

  • 產品推薦和交叉參照的專案。

電信行業

今天,電信行業是最新興產業提供各種服務,如傳真,尋呼機,行動電話,網際網路的使者,影象,電子郵件,網路資料傳輸等之一,由於新的計算機和通訊技術的發展,電信工業正在迅速擴大。這就是為什麼資料挖掘變得非常重要,幫助和瞭解企業的原因。

在電信行業資料挖掘有助於確定電信模式,趕上欺詐行為,更好地利用資源,提高服務品質。這裡是清單例子,其中資料挖掘提升電信服務:

  • 電信資料的多維分析。

  • 欺詐模式分析。

  • 識別異常模式。

  • 多維關聯和序列模式分析。

  • 行動通訊服務。

  • 在電信資料分析中使用的視覺化工具。

生物資料分析

現在天我們看到,有廣闊的增長,生物,如基因組學,蛋白組學,功能基因組學和生物醫學研究的領域。生物資料挖掘是生物資訊學中非常重要的一部分。以下是在哪些方面進行生物資料分析資料挖掘有助於:

  • 語意整合異構的,分散式的基因組和蛋白質組資料庫。

  • 對齊,索引,相似性搜尋和比較分析多個核苷酸序列。

  • 發現的結構模式和遺傳網路和蛋白途徑的分析。

  • 關聯和路徑分析。

  • 視覺化工具在基因資料分析。

其他科學領域

上面討論的應用程式往往處理相對較小而均勻資料集的統計技術是適當的。巨大的資料量已收集到的科學領域,如地球科學,天文學等有大量的被產生,因為在各個領域,如氣候和生態系統模擬,化學工程,流體力學等的快速數值模擬的資料集以下是資料挖掘在科學應用領域的應用:

  • 資料倉庫和資料預處理。

  • 基於圖的挖掘。

  • 視覺化和特定領域的知識。

入侵檢測

入侵是指任何型別的行動,威脅網路資源的完整性,機密性或可用性。在這個世界連線的安全性已成為主要問題。隨著工具和技巧網際網路和可用性的提高使用率入侵和攻擊網路提示入侵檢測成為網路管理的重要組成部分。下面是其中的資料挖掘技術可以應用於入侵檢測領域的列表:

  • 開發資料挖掘演算法的入侵檢測。

  • 協會和相關分析,匯總,以幫助選擇和建立判別屬性。

  • 分析流資料。

  • 分散式資料挖掘。

  • 視覺化和查詢工具。

資料挖掘系統產品

有很多資料挖掘系統產品和特定領域的資料挖掘應用程式可用。新的資料挖掘系統和應用程式被新增到以前的系統。也正在作出對資料挖掘語言的標準化的努力。

選擇資料挖掘系統

其中資料挖掘系統的選擇將取決於以下資料挖掘系統的特點:

  • 資料型別 - 資料挖掘系統可以處理格式化的文字,基於記錄的資料和關係資料。該資料也可能是ASCII文字,關聯式資料庫的資料或資料倉庫中的資料。因此,我們應該檢查什麼確切的格式,資料挖掘系統可以處理。

  • 系統問題 - 我們必須考慮資料挖掘系統使用不同作業系統的相容性。一個資料挖掘系統可能只在一個作業系統或幾個執行。還有,提供基於web的使用者介面,並允許使用XML資料作為輸入的資料挖掘系統。

  • 資料源 - 資料源是指在資料格式中,資料挖掘系統的操作方式。有些資料挖掘系統只能工作在ASCII文字檔案,而其他多個關係資料源。資料挖掘系統還應該支援ODBC連線或OLE DB的ODBC連線。

  • 資料挖掘的功能和方法 - 也有一些只提供一個資料挖掘功能,如分類,而一些提供了多種資料挖掘功能,如概念的描述,發現驅動的OLAP分析,關聯規則挖掘,關聯分析,統計分析,分類,預測,聚類,離群資料挖掘系統分析,相似性檢索等。

  • 耦合的資料挖掘與資料庫或資料倉庫系統 - 資料挖掘系統需要被加上資料庫或資料倉庫系統。該耦合部件被整合到一個統一的資訊處理環境。這裡是下面列出的耦合型別:

    • 無耦合

    • 松耦合

    • 半緊密耦合

    • 緊耦合

  • 可延伸性- 有兩個可延伸性問題,資料挖掘,如下所示:

    • 行(資料庫大小)可延伸性 - 資料挖掘系統被認為是可延伸的列時數或行被放大10倍,這需要不超過10倍以上來執行查詢。

    • 列(尺寸)銷路 - 資料挖掘系統被認為是可延伸的列,如果與列數的挖掘查詢執行時間線性增加。

  • 視覺化工具 - 視覺化資料挖掘可分類如下:

    • 資料視覺化

    • 挖掘結果視覺化

    • 挖掘過程視覺化

    • 視覺化資料挖掘

  • 資料挖掘查詢語言和圖形化使用者介面 - 圖形化使用者介面,易於使用,並須提升使用者引導,互動式資料挖掘。不同於關係型資料庫系統中的資料挖掘系統不共用基礎資料挖掘查詢語言。

趨勢資料挖掘

以下是趨勢的資料挖掘,反映追求如建築整合和互動式資料挖掘的環境中,資料挖掘語言的設計挑戰的清單:

  • 應用探索

  • 可延伸性和互動式資料挖掘方法

  • 資料挖掘與整合的資料庫系統,資料倉庫系統和網路資料庫系統。

  • 資料挖掘查詢語言的標準化

  • 視覺化資料挖掘

  • 新的方法來挖掘複雜的資料型別

  • 生物資料挖掘

  • 資料挖掘和軟體工程

  • Web挖掘

  • 分散式資料挖掘

  • 實時資料挖掘

  • 多資料庫的資料挖掘

  • 隱私保護和資料挖掘資訊安全