machine-learning-lead-dell

Machine Learning codes approaching models, clustering, underfitting, overfitting and neural networks.

View on GitHub

GitHub Open Source

Machine Learning

alt text

Curso de Machine Learning da LEAD Dell Badge

O objetivo é conhecer as principais técnicas de Aprendizado de Máquina (Machine Learning) e saber como utilizá-las, construindo modelos que extraem informação a partir de dados dos mais diferentes tipos. Foi utilizado Jupyter Badge.

ipynb

  • fruit_data_with_colors_analise.ipynb
    • Introdução à Análise de Dados com Python.
      • Demonstração da leitura de arquivos em modo texto.
      • Demonstração da tabela e informações básicas.
    • Análise Estatística de um Conjunto de Dados.
      • Demonstração das estatísticas do conjunto de dados.
      • Demonstração da manipulação de linhas e colunas.
    • Análise e Visualização de um Conjunto de Dados.
      • Demonstração do balanceamento dos dados.
      • Demonstração da visualização de gráficos.
      • Finalização da demonstração da funcionalidade básica de um notebook Jupyter.
  • fruit_data_with_colors_miss_analise.ipynb
    • Introdução ao Pré-processamento de Dados com Python.
      • Demonstração da leitura de arquivos em modo texto com valores faltantes (missing values).
      • Demonstração da tabela e informações básicas com valores faltantes.
    • Imputando Valores Faltantes.
      • Tratar os dados de modo que os valores faltantes passem a não existirem.
    • Eliminação de Colunas.
      • Demonstração de eliminação de coluna quando a imputação de dados se mostrar ineficiente por serem muitos dados faltantes.
    • Transformando a escala dos dados.
      • Transformar a escala dos dados para deixar os dados com importâncias iguais.
    • Encontrando outliers
      • Demonstrar como encontrar os dados discrepantes, elementos que possuem uma de suas características fora de um padrão.
  • regressao_para_prever_venda_sorvetes.ipynb
    • Introdução a Regressão.
      • Criação de um DataFrame com arrays do numpy.
      • Demonstração de separação de variável independente e variável dependente.
      • Demonstração de treinamento de modelo usando regressão linear.
      • Demonstração e plot de previsão.
  • car_data_regressao_linear_multipla.ipynb
    • Regressão Linear Múltipla.
      • Utilizar a biblioteca scikit-learn para construir um modelo de previsão de preço, usando regressão linear múltipla. Para isso será utilizado um conjunto de dados de carros usados listados pelo site www.cardekho.com e disponível em https://www.kaggle.com/nehalbirla/vehicle-dataset-from-cardekho e adaptado neste notebook.
  • fruit_data_with_colors_KNN and_boston_house_prices_KNN.ipynb
    • Introdução ao KNN.
      • Exemplificar a distância Euclidiana.
      • Demonstração do KNN para classificação usando fruit_data_with_colors.
      • Demonstração de pré-processamento de dados para o KNN.
      • Demonstração do KNN para regressão usando load_boston.
  • arvore_de_decisao.ipynb
    • Introdução às árvores de decisão.
      • Implementando as árvores de decisão.
      • Selecionando features com árvores de decisão.

Conteúdo Programático