Currículo
Curso: R para Ciência de Dados
Login

Currículo

R para Ciência de Dados

Considerações Finais e Aprendizado Contínuo

0/0
Lição de texto

Boas-vindas e Instruções

Sobre o curso

Este curso tem como objetivo habilitar você a utilizar o R para análise de dados, do básico à prática aplicada. Ao final, você será capaz de instalar e configurar o ambiente, importar dados, manipulá-los, aplicar medidas estatísticas descritivas e confeccionar gráficos com qualidade profissional.

Trata-se de um curso 100% gratuito, originalmente desenvolvido para a trilha de Ciência de Dados do Programa Justiça 4.0, fruto da cooperação entre CNJ, PNUD e UFPR, e agora também disponível nesta plataforma pessoal, com autorização expressa, para ampliar seu alcance.

 

O que você vai aprender

Com este curso você dominará o R, uma linguagem livre e ambiente de propósito específico para computação estatística e gráficos. O curso abrange a instalação e configuração do R e RStudio, a IDE mais popular e recomendada, explorando a interação com a linguagem via modos REPL e Batch, além do gerenciamento de scripts, arquivos e projetos.

Aprenderá os fundamentos de programação em R, incluindo operadores matemáticos e lógicos, estruturas de dados básicas como vetores, tipos e classes, e funções estatísticas essenciais. Serão abordadas estruturas de controle (if-else, switch) e laços de repetição (for, while, repeat), bem como a criação e tratamento de funções, incluindo manejo de exceções.

Em seguida, no curso você aprenderá sobre a importação e exportação de dados em diversos formatos (texto, binário, planilhas, bancos de dados, JSON, HTML). Um foco principal será a manipulação e visualização de dados com o ecossistema Tidyverse, utilizando pacotes como tibble, readr, tidyr, dplyr, ggplot2, stringr, forcats e purrr. Isso inclui operações de arrumação, seleção, filtragem, transformação, agregação e junção de dados, além da construção de gráficos e mapas.

Por fim, você terá uma introdução prática à inferência estatística, aplicando testes de hipótese para médias e variâncias, e utilizando Análise de Variância (ANOVA) e Regressão Linear Simples para modelagem estatística.

 

Por que isso é importante

O domínio deste conteúdo é essencial para qualquer profissional de dados. R é a melhor ferramenta para análise de dados, com uma extensa coleção de mais de 20 mil pacotes no CRAN. Sua interoperabilidade e natureza multiplataforma a tornam versátil no mercado de trabalho, sendo cada vez mais adotada por grandes instituições.

A reprodutibilidade e automação de análises, permitindo scripts agendados e colaborativos, é uma vantagem significativa sobre outros softwares. Visto que a limpeza e organização de dados consomem a maior parte do tempo em ciência de dados (cerca de 60%), o Tidyverse, com sua sintaxe clara e intuitiva, torna essa tarefa mais eficiente e produtiva.

R é pioneiro em novas soluções estatísticas, com inovações frequentemente surgindo primeiro em seus pacotes. Sua capacidade incomparável na construção de gráficos e seu robusto conjunto de ferramentas para modelagem estatística e testes de hipótese o consolidam como uma linguagem poderosa e completa para lidar com dados em qualquer contexto.

 

Principais competências desenvolvidas

Ao final do curso você vai saber:

  • Instalar e configurar o R e o RStudio.

  • Compreender e aplicar conceitos fundamentais da linguagem R.

  • Manipular, limpar e transformar conjuntos de dados.

  • Construir gráficos usando a Gramática dos Gráficos com o pacote {ggplot2}.

  • Calcular e interpretar medidas resumo estatísticas.

  • Aplicar testes de hipótese e ajustar modelos de regressão linear simples.

  • Exportar gráficos e resultados de análise.

 

Requisitos para participar

Não é necessário ter conhecimento prévio em R, estatística ou programação. Basta ter disposição para aprender, um computador com acesso à internet e um sistema operacional atualizado (Windows, Linux ou macOS).

 

Organização do curso

O curso é dividido em 10 Unidades Didáticas (UDs). Cada unidade está estruturada da seguinte forma:

  • 🎥 Vídeos didáticos explicando os principais conceitos e aplicações

  • 📄 Resumo da unidade, destacando os principais aprendizados

  • 📘 Dicionário de termos técnicos apresentados na aula

  • 🔗 Lição com links para download dos códigos-fonte, scripts e arquivos de apoio

 

Referências bibliográficas

  • WICKHAM, Hadley; GROLEMUND, Garrett. R for data science: import, tidy, transform, visualize, and model data. Sebastopol, CA: O’Reilly Media, 2016.

  • MATLOFF, Norman S. The art of R programming: tour of statistical software design. San Francisco: No Starch Press, 2011.

  • WICKHAM, Hadley. Ggplot2: elegant graphics for data analysis. Dordrecht: Springer, 2009.

  • GROLEMUND, Garrett. Hands-on programming with R. Sebastopol: O’Reilly Media, 2014.

  • VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC, 2005.

  • DALGAARD, Peter. Introductory statistics with R. New York: Springer, 2008.