R-quadrado (R2) nada mais é que uma métrica es­ta­tís­tica de erro usada para mensurar a proporção de variância de re­gres­sões lineares, ou seja, a qualidade de modelos de regressão. Usuários da linguagem de pro­gra­ma­ção R podem escrever uma fórmula simples para calcular esse valor.

Im­por­tân­cia de R-quadrado em R

R-quadrado, também chamado de R-square e ge­ral­mente re­pre­sen­tado por “R2”, é uma medida es­ta­tís­tica que mensura quão bem uma regressão linear se ajusta aos dados. Ele pode apre­sen­tar valores entre 0 e 1, e é con­si­de­rado uma medida-chave para de­ter­mi­nar a qualidade de um modelo de regressão.

Ao in­ter­pre­tar o valor de R-quadrado, você obtém in­for­ma­ções sobre a pro­xi­mi­dade dos dados em relação à linha de regressão calculada. Entenda-se: quanto maior for o valor do R-quadrado, melhor o modelo explicará os dados. Da mesma forma, um R-quadrado de valor baixo indica que o modelo não está bem ajustado.

Dica

A linguagem de pro­gra­ma­ção R pos­si­bi­lita o de­sen­vol­vi­mento de uma ampla gama de apli­ca­ções, que podem ser hos­pe­da­das em um espaço web próprio. Conheça di­fe­ren­tes planos de webspace da IONOS e escolha o que melhor atender às suas ne­ces­si­da­des.

R-quadrado em R com regressão linear

R-quadrado em R (R-squared in R) costuma ser usado na linguagem de pro­gra­ma­ção R, no contexto de re­gres­sões lineares. Como R é uma linguagem de pro­gra­ma­ção bastante utilizada na área de es­ta­tís­tica, não é surpresa que diversas funções R ajudam usuários a re­a­li­za­rem cálculos, como o exibido pelo exemplo abaixo:

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)
 
# Regressão linear
model <- lm(y ~ x)
R

No exemplo de código acima, criamos dois vetores R, que chamamos de x e y. Esses vetores contêm conjuntos de dados com os quais uma regressão linear pode ser realizada. Nesse caso, a variável de­pen­dente é a variável y. Por sua vez, o modelo de regressão é calculado pela função R lm() e ar­ma­ze­nado na variável model.

Como calcular R-quadrado em R

Você pode calcular o valor de R2 em R fazendo uso de uma função para a escrita de uma fórmula (r square formula). Não se preocupe, nenhum co­nhe­ci­mento ma­te­má­tico mais profundo é ne­ces­sá­rio. Tudo que você precisa saber é como montar essa fórmula, con­si­de­rada simples até mesmo por aqueles que começaram há pouco a aprender pro­gra­ma­ção.

A função que permite a re­a­li­za­ção do cálculo de R2 se chama summary(). Ela exibe um resumo da análise da regressão, que inclui o valor de R-quadrado. O código abaixo, que toma como base a regressão linear já calculada no exemplo anterior, mostra a função summary() em ação:

# Valor de R-quadrado
summary(model)$r.squared
R

Você pode usar esse código para extrair o valor de R-quadrado do modelo de regressão linear lm_model. Ele indica quão bem o modelo se aproxima da variação na variável de­pen­dente y, tomando como base a variável in­de­pen­dente x.

No nosso exemplo de código, a função summary() é aplicada a um modelo de regressão que já foi calculado. Si­mul­ta­ne­a­mente, o operador R $ exibe o valor de R-quadrado a partir dos valores re­tor­na­dos pela escrita da função. No nosso exemplo, ele é de 0,6.

Dica

Se você quer se apro­fun­dar na linguagem de pro­gra­ma­ção R, não deixe de explorar outros artigos do nosso Digital Guide:

Como in­ter­pre­tar R-quadrado

Após descobrir o valor de R-square, você precisará in­ter­pre­tar o resultado apre­sen­tado. Nesse momento, atente-se ao intervalo que R2 assumirá. Como já men­ci­o­na­mos, um valor de R-quadrado sempre será exibido dentro do intervalo de 0 e 1:

  • 0 (sem ajuste): Um valor de R-quadrado igual a 0 significa que o modelo não cor­res­ponde aos dados. Nesse caso, não existe nenhuma relação linear entre as variáveis.
  • 1 (ajuste perfeito): Um valor de R-quadrado igual a 1 indica que o modelo se ajusta per­fei­ta­mente aos dados ob­ser­va­dos, sem erro residual. Ele é ex­tre­ma­mente raro, por isso pode indicar ruídos nos dados.
  • 0,7 a 0,9 (ajuste bom): Um valor de R-quadrado nesse intervalo indica que o modelo descreve os dados su­fi­ci­en­te­mente bem.
  • 0,5 a 0,7 (ajuste aceitável): Um valor de R-quadrado no intervalo entre 0,5 e 0,7 é aceitável, mas indica que ainda há espaço para melhorias.
  • Menos que 0,5 (ajuste ruim): Um valor de R-quadrado abaixo de 0,5 indica que o modelo calculado não descreve os dados com precisão su­fi­ci­ente. Nesse caso, o modelo deve ser re­a­dap­tado para conseguir alcançar re­sul­ta­dos mais sig­ni­fi­ca­ti­vos.
Nota

Obter um valor alto de R-quadrado não é su­fi­ci­ente para de­ter­mi­nar ter­mi­nan­te­mente a qualidade de um modelo. Para chegar a essa conclusão e atestar a qualidade de ajuste de um modelo de regressão, você deverá analisar outros fatores, como a validação do modelo, a análise de resíduos e a adaptação aos re­qui­si­tos es­pe­ci­fi­ca­dos. A função summary(), apre­sen­tada por este artigo, suporta números adi­ci­o­nais, que podem ser usados para refinar esse tipo de avaliação.

Ir para o menu principal