PGC201 - Mineração de Dados

EMENTA

DISCIPLINA: MINERAÇÃO DE DADOS

CÓDIGO: PGC201

CARGA HORÁRIA: 90h

CRÉDITOS: 5

OBJETIVOS GERAIS DA DISCIPLINA: Adquirir uma compreensão abrangente sobre mineração de dados (data mining) e descoberta de conhecimento em bancos de dados. Entender as principais técnicas e temas de pesquisa nesta subárea de bancos de dados. Estar apto a aplicar ferramentas de mineração de dados (data mining) a problemas práticos.

EMENTA DO PROGRAMA: O que é Data Mining - Regras de Associação - Padrões Sequenciais – Classificação, Técnicas de Amostragem- Avaliação de Classificadores -  Clusterização -  Avaliação de Clusters– Mineração com Restrições - Web Mining.

DESCRIÇÃO DO PROGRAMA:

1. O que é Data Mining ? Que tipo de dados minerar ? As diversas fases do processo de descoberta de conhecimento em bancos de dados :
a) Pré-processamento - Redução : Agregação, Compressão, Discretização.
b) Mineração
c) Pós-processamento dos padrões minerados.
2. Mineração de Regras de Associação em grandes volumes de dados – Algoritmo Apriori – Técnicas de Otimização – Mineração de Regras com Restrições
    3. Mineração de Sequências -  Algoritmo GSP – Algoritmo PrefixSpan- Análise Comparativa          da metodologia e da performance dos dois algoritmos.
   4. Mineração de Sequências com Restrições - Algoritmos SPIRIT
   5. Classificadores 
       5.1 Tipos de Classificadores - Criterios de Avaliação 
       5.2 Método da  Árvore de Decisão - Algoritmos ID3 – J48
  5.3 Backpropagation - Redes Neurais 
       5.4 Classificadores Bayesianos
       5.5 Método KNN 
       5.6 Previsão – Regressão Linear 
       5.7 Técnicas de Amostragem
       5.8 Avaliação de Classificadores - dados com classes não-balanceadas
              Curvas Roc 
   6. Análise de Clusters 
       6.1 Tipos de Clusters
       6.2 Métodos por Particionamento -  K-means - K-medóides (PAM - CLARA) 
       6.3 Métodos Hierárquicos - CURE, BIRCH
       6.4 Métodos baseados em densidade- DBSCAN
       6.5 Avaliação de Clusteres
 7. Outliers - Detecção de Anomalias
8 . Mineração de Arvores – Web Mining

BIBLIOGRAFIA

Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Introduction to Data Mining. Addison-Wesley, 2006.

J.Han, M. Kamber : Data Mining : Concepts and Techniques. Morgan Kaufmann, 2nd Edition, 2006

I. H. Witten, E. Frank : Data Mining : Practical Machine Learning - Tools and Techniques.  Morgan Kaufmann, 2nd Edition, 2005.

Artigos de pesquisa atual sobre o tema.