- Tecnologia
Sobre o instrutor:
Cientista de Dados, Head Coach e Escritor
Sobre o curso Data Science Descomplicada - Machine Learning e Python
Num mundo cada vez mais digitalizado e com uma influência cada vez maior de Inteligências Artificiais, compreender o que de fato é Ciência de Dados, Machine Learning e programação é não apenas uma grande porta de entrada para uma vasta gama de oportunidades de trabalho, mas também uma educação necessária para compreender o novo mundo em que estamos vivendo.
Esse é o terceiro curso da série Data Science Descomplicada!
Nessa terceira e última parte mergulharemos, de fato, em conceitos e algoritmos de Python e Machine Learning.
*Acesse os cursos “Data Science Descomplicada - Matemática” e, depois, “Data Science Descomplicada - Programação” para que você construa a base e evolua ainda mais como cientista de dados ;)
Em conjunto, os três cursos trarão todos os conceitos necessários para você se tornar Cientista de Dados que o mercado procura.
O que você aprenderá
- Programar com Python do básico ao avançado;
- Conhecer a essência de Data Science;
- Aprender sobre Pré-processamento e Modelo em Produção;
- Entender Regressão, Classificação, Clusterização e Regras de Associação
- Compreender como aplicar MCMC (Markov Chain Monte Carlo)
- Reconhecer as Séries Temporais
- Aprender Deep Learning: ANN, CNN, RNN e NLP;
- Associar tudo que você aprendeu à Projetos da Vida Real como Galaxy Zoo, Sorteador de Times de Pelada, entre outros.
Requisitos
- Computador (Windows, Mac OS ou Linux) com acesso à Internet para melhor experiência de aprendizagem.
Para quem é este curso
- Pessoas que desejam solidificar seus conhecimentos em aprendizado da máquina e programação com Python;
- Profissionais (principalmente de áreas não-exatas) que desejam migrar para a área de Tecnologia e Ciência de Dados;
- Entusiastas de Ciência de Dados e que desejam ter um conhecimento mais profundo sobre o tema.
Sobre o Professor Lucas Moda
Cientista de Dados, Head Coach e Escritor
Sou formado em Astronomia pela USP e trabalho como cientista de dados há 4 anos. Como Cientista de Dados, acredito que tenho como dever dividir meu conhecimento e contribuir para a construção de uma sociedade em que as pessoas, de fato, possam entender a transformação digital que vivemos.Fora da vida profissional, sou Head Coach de uma equipe de Futebol Americano (esporte com o qual estou envolvido há mais de 10 anos!) e também sou escritor :)
Introdução
- Ementa
- Vamos alinhar as expectativas?
Python Básico
- Primeiro contato com o Python
- Operadores
- Data Types
- Flow Control
- Funções
- Escopo
- Exception Handling
- Projetos
Python Intermediário
- Classes
- Herança
- Encapsulation
- Polimorfismo
- Operator Overloading
- Decoradores
- Class Method Static Method
- Iterator
- Generators
- BuiltIn
Algoritmos Genéticos
- Introdução e Principais Termos
- Fitness
- Seleção de Parentes
- Crossover
- Seleção de Sobreviventes
- Critério de Parada
- Implementação
Algoritmo Genético Implementado em Python
- NFL Team Building
- NFL Fontes de Dados
- NFL Restrições
- NFL Fitness
- NFL Implementação
- NFL Simulações
- NFL Resultados
- NFL Algoritmo
O Essencial de Data Science
- O que é Ciência de Dados?
- A carreira em Ciência de Dados
- AI,DS,ML,DL
- Aprendizagem Supervisionada e Não-supervisionada
- Classificação
- Clusterização
- Reinforcement Learning
- Treino Teste
- Validação Cruzada
- Data Leakage
- Bias Variance Trade off
- Ciclo De Vida Modelo ML
- Projeto de ML
- Montando a Base de Treino
- Consumo Modelo
Pré-Processamento
- Missing Values
- Encoding
- Outliers
- Feature Scaling e Feature Engineering
- PCA
- Kernel PCA
- SVD
- LDA
- tSNE
- Dados Desbalanceados
Modelo em Produção
- Avaliação e Seleção de Modelos
- Interpretabilidade
- Deploy Modelo
- Monitoramento Modelo
- Retreino Modelo
- Estratégias Deploy
Regressão
- Regressão Linear
- OLS
- Regressão Linear Múltipla
- Regressão Polinomial
- Lasso, Ridge, Elastic Net
- Métricas de Regressão
Classificação
- Matriz de Confusão
- Métricas de Classificação
- Modelos de Classificação
- Métodos Baseados em Árvore de Decisão
- XG Boost
Clusterização
- KMeans
- Clustering Hierárquico
- GMM
- DBScan
- Mean Shift
- Métricas de Clusterização
- Detecção de Anomalias
Regras de Associação
- Association Rule Learning
- Apriori
MCMC (Markov Chain Monte Carlo)
- MCMC
- Monte Carlo
- Markov Chain
- Algoritmo Aceitação/Rejeição
Séries Temporais
- Séries Temporais
- Autocorrelação
- Sazonalidade
- Estacionariedade
- Média Móvel
- Exponential Smoothing
- Arima e Sarima
Deep Learning: ANN
- Neurônio
- ANN
- Função de Ativação
- Gradient Descent
- Stochastic Gradient Descent
- Perceptron
- Treinamento ANN
Deep Learning: CNN
- Imagens
- Convolução
- Relu Layer
- Pooling
- Flattening
- Fully Connected Network
Deep Learning: RNN
- Tipos de Redes Neurais
- RNN
- Vanishing e Exploding Gradients
- LSTM
NLP
- Tokenização e Normalização
- Stemming e Lematização
- POS Tagging
- Stop Words
- NER
- N-Grams
- Bag of Words
- TF-IDF
- Word2Vec
- Skip-Gram
- GloVe
- Bert e GPT-3
Projetos da Vida Real - Galaxy
- Galaxy
Projetos da Vida Real - Testagem Covid19
- Testagem Covid19
Projetos da Vida Real - Sorteador de Times
- Sorteador de Times de Pelada
