Machine Learning
Curso de Machine Learning da LEAD
O objetivo é conhecer as principais técnicas de Aprendizado de Máquina (Machine Learning) e saber como utilizá-las, construindo modelos que extraem informação a partir de dados dos mais diferentes tipos. Foi utilizado .
ipynb
- fruit_data_with_colors_analise.ipynb
- Introdução à Análise de Dados com Python.
- Demonstração da leitura de arquivos em modo texto.
- Demonstração da tabela e informações básicas.
- Análise Estatística de um Conjunto de Dados.
- Demonstração das estatísticas do conjunto de dados.
- Demonstração da manipulação de linhas e colunas.
- Análise e Visualização de um Conjunto de Dados.
- Demonstração do balanceamento dos dados.
- Demonstração da visualização de gráficos.
- Finalização da demonstração da funcionalidade básica de um notebook Jupyter.
- fruit_data_with_colors_miss_analise.ipynb
- Introdução ao Pré-processamento de Dados com Python.
- Demonstração da leitura de arquivos em modo texto com valores faltantes (missing values).
- Demonstração da tabela e informações básicas com valores faltantes.
- Imputando Valores Faltantes.
- Tratar os dados de modo que os valores faltantes passem a não existirem.
- Eliminação de Colunas.
- Demonstração de eliminação de coluna quando a imputação de dados se mostrar ineficiente por serem muitos dados faltantes.
- Transformando a escala dos dados.
- Transformar a escala dos dados para deixar os dados com importâncias iguais.
- Encontrando outliers
- Demonstrar como encontrar os dados discrepantes, elementos que possuem uma de suas características fora de um padrão.
- regressao_para_prever_venda_sorvetes.ipynb
- Introdução a Regressão.
- Criação de um DataFrame com arrays do numpy.
- Demonstração de separação de variável independente e variável dependente.
- Demonstração de treinamento de modelo usando regressão linear.
- Demonstração e plot de previsão.
- car_data_regressao_linear_multipla.ipynb
- Regressão Linear Múltipla.
- Utilizar a biblioteca scikit-learn para construir um modelo de previsão de preço, usando regressão linear múltipla. Para isso será utilizado um conjunto de dados de carros usados listados pelo site www.cardekho.com e disponível em https://www.kaggle.com/nehalbirla/vehicle-dataset-from-cardekho e adaptado neste notebook.
- fruit_data_with_colors_KNN and_boston_house_prices_KNN.ipynb
- Introdução ao KNN.
- Exemplificar a distância Euclidiana.
- Demonstração do KNN para classificação usando fruit_data_with_colors.
- Demonstração de pré-processamento de dados para o KNN.
- Demonstração do KNN para regressão usando load_boston.
- arvore_de_decisao.ipynb
- Introdução às árvores de decisão.
- Implementando as árvores de decisão.
- Selecionando features com árvores de decisão.
Conteúdo Programático
- 1.Introdução a machine learning
- Descrever fundamentos e conceitos de Aprendizado de Máquina, tais como as diferentes tarefas sobre dados.
- 2.Modelos de aprendizado de máquina
- Descrever os principais modelos de Aprendizado de Máquina, tais como a sua utilidade diante de diversos tipos de dados.
- 3.Clusterização e modelos
- Definir o conceito e o algoritmo de clusterização e K-Means.
- 4.Avaliação de modelos
- Aprender técnicas de como avaliar um modelo segundo os conceitos de underfitting e overfitting.
- 5.Introdução às redes neurais
- 6.Tópicos avançados
- Estudar modelos e análises mais avançadas em Aprendizado de Máquina.