[課程筆記]DataMining 資料挖掘(1)
DataMining 資料挖掘(1)
授課老師 台灣大學 工科所 張瑞益教授
課本 Margaret H. Dunham, Data Mining Introductory and Advanced Topics
Define data mining
在資料庫中挖掘隱含資訊或是替資料建構模型的過程
實際應用,需從database取data出來mining
研究上通常忽略database access這一步
Data mining vs databases
- | Database | Mining |
---|---|---|
query | SQL | poor define |
data | 可操作的data in database | 可能是模型 不可操作 |
output | 精確 為 資料庫子集合 | 不精確 |
Data mining task
datamining由三部分組成
modal 模型
preference 偏好的演算法
search 能夠找到所需結果
基本任務
classification
regression
prediction
clustering
summarization
association rules
sequence discovery
KDD
KDD (knowledge discovery in database)步驟
- selection 資料來源
- preprocessing 前處理
- transformation 標準化資料
- data mining 挖掘資訊
- interpretation 展示
- potential user application 客製化使用
Data mining development
與資料採礦相關的主題延伸
Database
• Relational Data Model
• SQL
• Association Rule Algorithms
• Data Warehousing
• Scalability Techniques
Information Retrieval
• Similarity Measures
• HierarchicalClustering
• IR Systems
• Imprecise Queries
• Textual Data
• Web Search Engines
Statlstics
• Bayes Theorem
• Regression Analysis
• EM Algorithm
• K-Means Clustering
• Time Series
Maching Learning
• Neural networks
• Decision Tree Algorithms
Algorithm
• Algorithm Design Techniques
• Algorithm Analysis
• Data Structures