Este curso tem como objetivo habilitar você a utilizar o R para análise de dados, do básico à prática aplicada. Ao final, você será capaz de instalar e configurar o ambiente, importar dados, manipulá-los, aplicar medidas estatísticas descritivas e confeccionar gráficos com qualidade profissional.
Trata-se de um curso 100% gratuito, originalmente desenvolvido para a trilha de Ciência de Dados do Programa Justiça 4.0, fruto da cooperação entre CNJ, PNUD e UFPR, e agora também disponível nesta plataforma pessoal, com autorização expressa, para ampliar seu alcance.
Com este curso você dominará o R, uma linguagem livre e ambiente de propósito específico para computação estatística e gráficos. O curso abrange a instalação e configuração do R e RStudio, a IDE mais popular e recomendada, explorando a interação com a linguagem via modos REPL e Batch, além do gerenciamento de scripts, arquivos e projetos.
Aprenderá os fundamentos de programação em R, incluindo operadores matemáticos e lógicos, estruturas de dados básicas como vetores, tipos e classes, e funções estatísticas essenciais. Serão abordadas estruturas de controle (if-else, switch) e laços de repetição (for, while, repeat), bem como a criação e tratamento de funções, incluindo manejo de exceções.
Em seguida, no curso você aprenderá sobre a importação e exportação de dados em diversos formatos (texto, binário, planilhas, bancos de dados, JSON, HTML). Um foco principal será a manipulação e visualização de dados com o ecossistema Tidyverse, utilizando pacotes como tibble
, readr
, tidyr
, dplyr
, ggplot2
, stringr
, forcats
e purrr
. Isso inclui operações de arrumação, seleção, filtragem, transformação, agregação e junção de dados, além da construção de gráficos e mapas.
Por fim, você terá uma introdução prática à inferência estatística, aplicando testes de hipótese para médias e variâncias, e utilizando Análise de Variância (ANOVA) e Regressão Linear Simples para modelagem estatística.
O domínio deste conteúdo é essencial para qualquer profissional de dados. R é a melhor ferramenta para análise de dados, com uma extensa coleção de mais de 20 mil pacotes no CRAN. Sua interoperabilidade e natureza multiplataforma a tornam versátil no mercado de trabalho, sendo cada vez mais adotada por grandes instituições.
A reprodutibilidade e automação de análises, permitindo scripts agendados e colaborativos, é uma vantagem significativa sobre outros softwares. Visto que a limpeza e organização de dados consomem a maior parte do tempo em ciência de dados (cerca de 60%), o Tidyverse, com sua sintaxe clara e intuitiva, torna essa tarefa mais eficiente e produtiva.
R é pioneiro em novas soluções estatísticas, com inovações frequentemente surgindo primeiro em seus pacotes. Sua capacidade incomparável na construção de gráficos e seu robusto conjunto de ferramentas para modelagem estatística e testes de hipótese o consolidam como uma linguagem poderosa e completa para lidar com dados em qualquer contexto.
Ao final do curso você vai saber:
Instalar e configurar o R e o RStudio.
Compreender e aplicar conceitos fundamentais da linguagem R.
Manipular, limpar e transformar conjuntos de dados.
Construir gráficos usando a Gramática dos Gráficos com o pacote {ggplot2}
.
Calcular e interpretar medidas resumo estatísticas.
Aplicar testes de hipótese e ajustar modelos de regressão linear simples.
Exportar gráficos e resultados de análise.
Não é necessário ter conhecimento prévio em R, estatística ou programação. Basta ter disposição para aprender, um computador com acesso à internet e um sistema operacional atualizado (Windows, Linux ou macOS).
O curso é dividido em 10 Unidades Didáticas (UDs). Cada unidade está estruturada da seguinte forma:
🎥 Vídeos didáticos explicando os principais conceitos e aplicações
📄 Resumo da unidade, destacando os principais aprendizados
📘 Dicionário de termos técnicos apresentados na aula
🔗 Lição com links para download dos códigos-fonte, scripts e arquivos de apoio
WICKHAM, Hadley; GROLEMUND, Garrett. R for data science: import, tidy, transform, visualize, and model data. Sebastopol, CA: O’Reilly Media, 2016.
MATLOFF, Norman S. The art of R programming: tour of statistical software design. San Francisco: No Starch Press, 2011.
WICKHAM, Hadley. Ggplot2: elegant graphics for data analysis. Dordrecht: Springer, 2009.
GROLEMUND, Garrett. Hands-on programming with R. Sebastopol: O’Reilly Media, 2014.
VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC, 2005.
DALGAARD, Peter. Introductory statistics with R. New York: Springer, 2008.