Contents
  1. 1. DataMining 資料挖掘(1)
    1. 1.1. Define data mining
    2. 1.2. Data mining vs databases
    3. 1.3. Data mining task
    4. 1.4. KDD
    5. 1.5. Data mining development
      1. 1.5.1. Database
      2. 1.5.2. Information Retrieval
      3. 1.5.3. Statlstics
      4. 1.5.4. Maching Learning
      5. 1.5.5. Algorithm

DataMining 資料挖掘(1)

授課老師 台灣大學 工科所 張瑞益教授
課本 Margaret H. Dunham, Data Mining Introductory and Advanced Topics

Define data mining

在資料庫中挖掘隱含資訊或是替資料建構模型的過程
實際應用,需從database取data出來mining
研究上通常忽略database access這一步

Data mining vs databases

-DatabaseMining
querySQLpoor define
data可操作的data in database可能是模型 不可操作
output精確 為 資料庫子集合不精確

Data mining task

datamining由三部分組成
modal 模型
preference 偏好的演算法
search 能夠找到所需結果

基本任務
classification
regression
prediction
clustering
summarization
association rules
sequence discovery

KDD

KDD (knowledge discovery in database)步驟

  • selection 資料來源
  • preprocessing 前處理
  • transformation 標準化資料
  • data mining 挖掘資訊
  • interpretation 展示
  • potential user application 客製化使用

kdd

Data mining development

與資料採礦相關的主題延伸

Data mining development

Database

• Relational Data Model
• SQL
• Association Rule Algorithms
• Data Warehousing
• Scalability Techniques

Information Retrieval

• Similarity Measures
• HierarchicalClustering
• IR Systems
• Imprecise Queries
• Textual Data
• Web Search Engines

Statlstics

• Bayes Theorem
• Regression Analysis
• EM Algorithm
• K-Means Clustering
• Time Series

Maching Learning

• Neural networks
• Decision Tree Algorithms

Algorithm

• Algorithm Design Techniques
• Algorithm Analysis
• Data Structures

Comments