01/Oct/2024
Introdução do pacote ggplot2
Instalação do pacote ggplot2
Lógica e estrutura básica de montagem de um gráfico no ggplot
Camadas de um gráfico
R
e RStudio
instalados no seu notebookRStudio é a IDE (integrated development environment) da Linguagem R, ou seja, o ambiente que utilizamos para editar e executar os códigos em R. Tem quatro áreas, conforme a figura abaixo:
Pacote para visualização de dados, criado por Hadley Wickham e mantido pela Posit.
Versátil e Esteticamente rico.
Implementação dos conceitos de Grammar of Graphics.
A origem do nome GGplot
Estrutura que segue uma abordagem em camadas para descrever e construir visualizações ou gráficos de maneira estruturada.
Uma visualização geralmente tem vários componentes ou aspectos, e alavancar essa gramática de gráficos em camadas nos ajuda a descrever e entender cada componente envolvido na visualização - em termos de dados, estética, escala, objetos e assim por diante.
Um gráfico feito com ggplot2 é uma soma de camadas.
Não precisa utilizar todos os componentes seguintes em seu gráfico, mas é interessante saber que existem.
A função ggplot()
inicia um gráfico ggplot.
Utilizamos o símbolo +
para somar as camadas.
ggplot(data, aesthetics) +
geometries(statistics) +
facets +
coordinates +
theme
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Definir o objeto geométrico mais adequado: linha, ponto, barras etc.
Base de dados que temos interesse em analisar e extrair informação.
Mapear as variáveis que queremos relacionar.
Definir o objeto geométrico mais adequado: linha, ponto, barras etc.
ggplot(data = [BASE DE DADOS],
mapping = aes(x = [VARIÁVEL X], y = [VARIÁVEL Y])) +
geom_[OBJETO GEOMÉTRICO]()
Gráficos de dispersão: geom_point()
Gráficos de barras: geom_col()
ou geom_bar()
Gráficos de linhas: geom_line()
Histograma: geom_hist()
Boxplot: geom_boxplot()
Densidade: geom_density()
Suavização: geom_smooth()
Adicionar rótulos ou textos: geom_label()
ou geom_text()
Primeiro, precisamos instalar os pacotes necessários e carregá-los:
Na maioria das vezes precisaremos organizar e limpar os dados antes de utilizar o ggplot. Aqui vamos partir de uma base já organizada.
Para a parte prática, utilizaremos a base do R airquality.
As variáveis escolhidas para a minha análise são: Wind e Temp.
Como as variáveis Wind e Temp são numéricas, vamos fazer um gráfico de pontos, chamando a camada geom_point()
.
Base de dados: airquality.
Mapear as variáveis: Wind (x) e Temp (y).
Objeto geométrico: pontos (geom_point()
).
O mapeamento das variáveis também pode ser inserido no objeto geométrico:
geom_point()
)geom_point(color = "cor desejada")
geom_point(size = valor numérico)
aes()
(mapeamento das variáveis)geom_point()
)geom_point(color = variável)
geom_point(size = variável)
Vou associar a cor à variável Month (numérico de 5 a 9)
ggtitle("Titulo", "subtítulo")
.labs(x = "nome no eixo x", y = "nome no eixo y")
.xlim(c(a,b))
e ylim(c(a,b))
.ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, size = factor(Month), color = factor(Month))) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
xlim(c(0,30)) + # Camada 4
ylim(c(50,150)) # Camada 5
guides()
.ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) # Camada 3
theme_()
.Tema clássico
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_classic() # Camada 4
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_classic(16) # Camada 4
theme_()
.Tema escuro
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_dark(16) # Camada 4
theme_()
.Tema mínimo
ggplot(data = airquality) +
geom_point(mapping = aes(x = Wind, y = Temp, color = factor(Month)), size = 3) + # Camada 1
ggtitle("Qualidade do ar", "Temperatura pelo Vento") + # Camada 2
labs(x = "Vento (Km/h)", y = "Temperatura (Farenheit)") + # Camada 3
guides(color=guide_legend(title="Mês")) + # Camada 3
theme_minimal(16) # Camada 4
Slides feitos com Quarto e Quarto R-Ladies Theme.