Buckminster
(usa Debian)
Enviado em 04/07/2023 - 11:07h
Você sabe o que significa na fórmula o símbolo de somatório (sigma, Σ), índice i, etc?
Mas enfim, caso não souber montar o algoritmo a partir da fórmula, leia isto:
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
http://www.clbo.ufba.br/BioStat2005_2/Aula_1.pdf <<< este é bem resumido, mas simples de entender
https://pt.khanacademy.org/math/ap-calculus-ab/ab-integration-new/ab-6-3/a/review-summation-notation
https://statplace.com.br/blog/coeficientes-de-correlacao/
Mas vai uma dica.
Na fórmula: somatório de xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn <<< somatório dos produtos (veja pdf [aula 1] no link acima).
Tem 27 parcelas (estados do Brasil), no caso 27 é o n.
O índice i = 1 é o primeiro valor da variável "x" (Educação) e da variável "y" (Renda).
Perceba na primeira linha (Acre) da tabela que x1 = 0,692 e y1 = 0,655 e na última (Tocantins) x27 = 0,732 e y27 = 0,684.
xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn
xiyi = 0,692.0,655(Acre) + 0,679.0,630(Alagoas) + 0,647.0,648(Amapá) + ... + 0,732.0,684(Tocantins)
No caso da primeira parte de cima da fórmula (antes do sinal de menos) é o somatório dos produtos; depois do sinal de menos (sinal de subtração) é o somatório simples de x multiplicado pelo somatório simples de y.
Embaixo no denominador temos na primeira parte a raiz quadrada do somatório dos quadrados de x (Acre x1= 0,692 ao quadrado) + (Alagoas x2= 0,679 ao quadrado) + (Amapá x3= 0,647 ao quadrado) + ... +(x27 ao quadrado) menos entre parênteses o somatório simples de x (0,692+0,679+0,647+...+0,732) tudo elevado ao quadrado no final do somatório; e isso multiplicado pela mesma coisa de y (a raiz quadrada do somatório dos quadrados de y menos entre parênteses o somatório simples de y todo ele elevado ao quadrado no final do somatório).
Fiz de cabeça agora aqui, pode ter alguma coisa faltando, mas pela dica você monta teu código em Python.
Não sei se ficou muito confusa a explicação.
Aqui não aceita (ou eu não sei fazer) xi com i menor. Tentei copiar e colar, mas não foi nem o sigma ali em cima.
Acredito que o código da biblioteca Pandas que o Lisandro enviou faça o mesmo cálculo, pois estamos falando do coeficiente de Pearson (o valor de "r" estará sempre no intervalo de -1 a 1), mas testa depois com o teu código só para confirmar se dá o mesmo resultado.
Veja nesse link
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
que a fórmula ali (Coeficiente de Correlação Linear de Pearson) é a mesma do teu problema, é o Coeficiente de Correlação Linear de Pearson.
Aqui tem em Python com explicações:
https://medium.com/omixdata/estat%C3%ADstica-an%C3%A1lise-de-correla%C3%A7%C3%A3o-usando-python-e-r-....
Aqui a mesma com Pandas:
https://acervolima.com/python-teste-de-correlacao-de-pearson-entre-duas-variaveis/
_________________________________________________________
Always listen the Buck!
Com raras exceções, não dou mais soluções prontas, somente dou dicas!