Conteúdos e Ementas

O curso será dividido em dois módulos:

(1) Ciência de Dados com R

20 horas 

Minicurso de análise de dados com R

Duração de 16h (8 aulas de 2h)

 

1 – Introdução ao R:

            - Ambientação ao R e ao RStudio

            - Objetos do R: vetores, matrizes, fatores, data frames e listas

            - Estruturas úteis: operadores, loops, funções e apply

 

2 – Manipulação de bases de dados (R base e pacote dplyr):

            - Importação e exportação de informações

            - Tipos de variáveis e respectivos objetos

            - Filtrando informações e ordenando linhas

            - Selecionando, criando e modificando colunas

            - Juntando bases de dados

 

3 – Visualização de dados (R base e pacote ggplot2):

            - Análise exploratória visual

            - Tipos de gráficos

            - Customização

 

4 – Técnicas estatísticas aplicadas:

            - Teste qui-quadrado

            - Análise de regressão

            - Valores atípicos

 

 

(2) Ciência de Dados com Python

20 horas 

 

1 - Introdução ao Python

    - Ambientação ao Python e ao Colab

    - Estruturas úteis e conceitos: tipos de variáveis, controle de fluxo e escopos

    - Tratamento de erros

 

 2 - Bases de dados e visualização

    - Criação e manipulação de dados com o Pandas

    - Selecionar dados nas bases

    - Visualizar os dados com matplotlib

 

3 - Obtendo dados na Internet com Python

    - Introdução aos conceitos de dados na web e alguns de seus tipos

    - Protocolos e estruturas para obtenção de dados web

    - APIs e exemplo prático – Twitter (tweepy)

 

4 - Visualização interativa com IPython e Colab

    - Propriedades e funções interativas do IPython e Colab

    - Widgets e outros objetos interativos para visualização de dados

    - Curiosidades e itens para aprofundamento (html, interoperabilidade, etc)