Cálculo do desvio padrão no LibreOffice

Publicado por Pedro Ferrarezi em 15/10/2016

[ Hits: 18.515 ]

 


Cálculo do desvio padrão no LibreOffice



Muitas pessoas não usam Linux só por causa que já estão acostumadas com os aplicativos de outros sistemas operacionais.

Mas essa realidade está mudando. Existem ferramentas gratuitas muito boas que fazem o papel desses aplicativos nas distribuições Linux de forma adequada. É o caso do LibreOffice Calc.

Para provar isso, hoje vamos solucionar um problema difícil usando a fórmula de desvio padrão do Calc.

Imagine o seguinte cenário:

Você é o gerente de uma grande equipe de vendedores, e de repente você descobre que por algum motivo alguns vendedores não vendem durante alguns dias da semana, ou seja, estão concentrando o faturamento da empresa em apenas alguns dias sendo que poderiam "cadenciar" a venda, ou seja, buscar vender pelo menos um pouco todo dia.

Então você chama sua equipe de vendas e informa que devem vender todo dia.

No final da semana você pede que cada um informe a quantidade média de vendas por dia e vê que é bem cada uma parecida em relação às outras.

Mas olhando um relatório da contabilidade você percebe que em muitos dias não houve vendas. Até parece que os vendedores mentiram, mas você faz uma conferência por amostragem das médias de vendas diárias e vê que elas "batem". Logo vê que não é possível determinar a cadência de vendas através da média.

E agora? Como descobrir rapidamente quais os vendedores não cumprem com o combinado? E até mesmo fazer um ranking dos melhores e dos piores com respeito à cadência de vendas?

Simples: você pode calcular o desvio padrão do período por vendedor.

O QUE É DESVIO PADRÃO

Se já sabe o que é desvio padrão vá para a próxima parte.

Vejamos uma definição:

"Em Probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística (representado pelo símbolo sigma, σ). Ele mostra o quanto de variação ou "dispersão" existe em relação à média (ou valor esperado). Um baixo desvio padrão indica que os dados tendem a estar próximos da média; um desvio padrão alto indica que os dados estão espalhados por uma gama de valores.

O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que:

    Seja um número não-negativo;
    Use a mesma unidade de medida dos dados fornecidos inicialmente.

Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão de um subconjunto em amostra."
Fonte: https://pt.wikipedia.org/wiki/Desvio_padr%C3%A3o

OK, li 2x e não entendi nada...

Rsrs, não se preocupe, vamos simplificar.

Desconsidere a diferença entre "desvio padrão amostral x desvio padrão populacional", para esse exemplo os 2 servem, mesmo assim vamos usar o populacional.

Se não entendeu nada até aqui, então entenda o seguinte:

Imagine 2 alvos de tiro usados por 2 atiradores diferentes, um à esquerda com os tiros bem próximos da "mosca" o outro à direita com os tiros bem distantes.

A que conclusão podemos chegar? - O cara da direita tem Mal de Parkinson e não mexa com o cara da esquerda! kkkk Sim, esta conclusão pode ser correta... mas o ponto não é esse.

Imagine que esse alvo é na verdade um plano cartesiano e a "mosca" do alvo representa uma média que estamos buscando atingir. No caso dos alvos seria a coordenada 0,0, e no caso das vendas que vimos acima seria 1 venda por dia, totalizando 6 vendas ao final da semana.

No alvo da esquerda os tiros mais próximos da média são como dados homogêneos, ou seja, a maioria tem valor bem próximo da coordenada 0,0 e portanto os valores são próximos entre si - homogêneos/próximos. Se calcularmos o desvio padrão disso ele será próximo de 0,0.

Já no alvo da direita, se os buracos de bala fossem coordenadas numéricas e calculássemos o desvio padrão, o número seria bem, mas bem maior mesmo que zero, mostrando que as coordenadas são como dados heterogêneos/dispersos em relação à média (lembre nesse exemplo a média é a mosca do alvo).

Então podemos dizer que:

Dados homogêneos (dispersão menor) = desvio padrão menor.
Dados heterogêneos (dispersão maior) = desvio padrão maior.

Podemos calcular o desvio padrão com a fórmula STDEV.P().
Basta clicar em uma célula inserir a fórmula e entre os parêntesis colocar o intervalo de células que deseja calcular o D.P

Dica adaptada do meu blog:
Outras dicas deste autor

Backup poderoso e automatizado combinando 7-Zip + head + cron

Extendendo a classe ArrayList para criar listas sem repetição

Montando um servidor de remote desktop com NX Server

Ubuntu 12.04 com Gnome 3 - Tunando a Aparência com Temas e Ferramentas

Livros gratuitos sobre Linux

Leitura recomendada

Você quer o BrOffice (OpenOffice/LibreOffice) no seu Slackware? Use os buildscripts do SlackBuilds.org!

Libreoffice - Impressão de etiquetas no lugar correto

LibreOffice - Instalação da tradução para o português via terminal

Instalando o LibreOffice RC2 - substituto do OpenOffice, agora da Oracle (Ubuntu)

Trabalhando com datas no LibreOffice

  

Comentários
[1] Comentário enviado por Fellype em 19/10/2016 - 10:18h

Passando para o português (o LibreOffice em português tem os comandos/funções traduzidos):
STDEV.P() -> DESVPAD.P()

Cabe uma nota com relação à esta dica:
A função STDEV.P() (ou DESVPAD.P()) calcula o desvio padrão *não corrigido* da amostra [1].
O mais adequado/recomendado, na grande maioria dos casos, é calcular o desvio padrão *corrigido* da amostra [2], que é feito com a fórmula:
STDEV(), (ou DESVPAD(), em português).

[1] https://en.wikipedia.org/wiki/Standard_deviation#Uncorrected_sample_standard_deviation
[2] https://en.wikipedia.org/wiki/Standard_deviation#Corrected_sample_standard_deviation

[2] Comentário enviado por removido em 21/10/2016 - 19:34h

Legal. Agora eu queria saber como colocar as barrinhas do desvio-padrão no gráfico de colunas. :\



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts