01/Oct/2024
Introdução do pacote ggplot2
Instalação do pacote ggplot2
Lógica e estrutura básica de montagem de um gráfico no ggplot
Camadas de um gráfico
Arte por Allison Horst
R e RStudio instalados no seu notebookRStudio é a IDE (integrated development environment) da Linguagem R, ou seja, o ambiente que utilizamos para editar e executar os códigos em R. Tem quatro áreas, conforme a figura abaixo:
Pacote para visualização de dados, criado por Hadley Wickham e mantido pela Posit.
Versátil e Esteticamente rico.
Implementação dos conceitos de Grammar of Graphics.
Arte por Allison Horst
A origem do nome GGplot
Estrutura que segue uma abordagem em camadas para descrever e construir visualizações ou gráficos de maneira estruturada.
Uma visualização geralmente tem vários componentes ou aspectos, e alavancar essa gramática de gráficos em camadas nos ajuda a descrever e entender cada componente envolvido na visualização - em termos de dados, estética, escala, objetos e assim por diante.
Um gráfico feito com ggplot2 é uma soma de camadas.
Não precisa utilizar todos os componentes seguintes em seu gráfico, mas é interessante saber que existem.
A função ggplot() inicia um gráfico ggplot.
Utilizamos o símbolo + para somar as camadas.
ggplot(data, aesthetics) +
geometries(statistics) +
facets +
coordinates +
theme
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Definir o objeto geométrico mais adequado: linha, ponto, barras etc.
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Definir o objeto geométrico mais adequado: linha, ponto, barras etc.
ggplot(data = [BASE DE DADOS],
mapping = aes(x = [VARIÁVEL X], y = [VARIÁVEL Y])) +
geom_[OBJETO GEOMÉTRICO]()
Gráficos de dispersão: geom_point()
Gráficos de barras: geom_col() ou geom_bar()
Gráficos de linhas: geom_line()
Histograma: geom_hist()
Boxplot: geom_boxplot()
Densidade: geom_density()
Suavização: geom_smooth()
Adicionar rótulos ou textos: geom_label() ou geom_text()
Primeiro, precisamos instalar os pacotes necessários e carregá-los:
Na maioria das vezes precisaremos organizar e limpar os dados antes de utilizar o ggplot. Aqui vamos partir de uma base já organizada.
Para a parte prática, utilizaremos a base do R airquality.
As variáveis escolhidas para a minha análise são: Wind e Temp.
Como as variáveis Wind e Temp são numéricas, vamos fazer um gráfico de pontos, chamando a camada geom_point().
Base de dados: airquality.
Mapear as variáveis: Wind (x) e Temp (y).
Objeto geométrico: pontos (geom_point()).
O mapeamento das variáveis também pode ser inserido no objeto geométrico:
Arte por Allison Horst
geom_point())geom_point(color = "cor desejada")
geom_point(size = valor numérico)
aes() (mapeamento das variáveis)geom_point())geom_point(color = variável)
geom_point(size = variável)
Vou associar a cor à variável Month (numérico de 5 a 9)
ggtitle("Titulo", "subtítulo").labs(x = "nome no eixo x", y = "nome no eixo y").xlim(c(a,b)) e ylim(c(a,b)).ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, size = factor(Month), color = factor(Month))) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
xlim(c(0,30)) + # Camada 4
ylim(c(50,150)) # Camada 5guides().ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) # Camada 3theme_().Tema clássico
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_classic() # Camada 4ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_classic(16) # Camada 4theme_().Tema escuro
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_dark(16) # Camada 4theme_().Tema mínimo
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_minimal(16) # Camada 4
Slides feitos com Quarto e Quarto R-Ladies Theme.