資料探勘可以在何種資料上進行

時間 2021-08-11 17:26:23

1樓:劉鵬

資料探勘,介於你所使用的挖掘模型不同,可以處理的資料也不同:

聚類模型:

系統聚類——只能用於數值型變數

二階聚類——可以用於數值型變數、離散型變數(如變數內容為使用者職業、性別,或者病人的血型等等)

k-mean聚類——一些軟體的k-mean聚類只能用於數值型變數,不過已經有k-mean聚類的改進模型,可以用於離散變數了,並且優化了模型,避免了區域性最優犧牲全域性最優的情況

迴歸模型:

線性迴歸、非線性迴歸——只能用於數值型變數邏輯迴歸——可用於數值型、離散型變數

決策樹模型:

c&r決策樹——分類迴歸決策樹,可用於數值、離散變數chaid決策樹——卡方自動互動檢驗決策樹,可用於數值、離散變數關聯規則模型:

只能用於離散型變數

以上都是一些舉例,不夠全面,希望能給你幫助,如有問題可以追問

2樓:

不是很清楚你的意思。

是從資料型別出發?有生物醫學資料、影像資料、其他各專業領域資料等;

如果是從檔案角度出發。有faster檔案資料;txt文件資料等。

我暫時知道這些,有需要可以討論下。

3樓:匿名使用者

anything,經過清洗,預處理即可,理論上是這樣

什麼是資料探勘?資料探勘怎麼做啊

海同職座標 資料探勘是從大量的 不完全的 有噪聲的 模糊的 隨機的資料中提取隱含在其中的 人們事先不知道的 但又是潛在有用的資訊和知識的過程。資料探勘流程 定義問題 清晰地定義出業務問題,確定資料探勘的目的。資料準備 資料準備包括 選擇資料 在大型資料庫和資料倉儲目標中 提取資料探勘的目標資料集 資...

如何開展資料探勘的學習,如何學習資料探勘

資料探勘是一門綜合類的學科,它綜合了計算機 人工智慧 統計學 資料庫等領域的知識。建議你現從基本的資料探勘演算法開始學起,現向你推薦基本書,應該可以引你入門。資料探勘導論 資料探勘基本概念 datamining 覆蓋面也算是比較廣泛的。開始的話,推薦線看看 資料探勘概念與技術 瞭解基礎知識,資料預處...

資料探勘對聚類的資料要求是什麼,資料探勘中 聚類演算法 資料集在什麼地方獲取的

1.可擴充套件性 scalability 大多數來自於機器學習和統計學領域的聚類演算法在處理數百條資料時能表現出高效率 2.處理不同資料型別的能力 數字型 二元型別,分型別 標稱型,序數型,比例標度型等等3.發現任意形狀的能力 基於距離的聚類演算法往往發現的是球形的聚類,其實現實的聚類是任意形狀的4...