A partir de uma tabela, como criar uma curva de regressão simples, para definir uma reta que melhor descreva os pontos (ou para fazer projeções)?
Selecione os dados e vá em Inserir -> Gráficos -> Dispersão
Clicar na série do gráfico com o botão direito do mouse e escolher “Adicionar linha de tendência…”
Vão aparecer algumas opções, como a curva a ser escolhida. Especialmente interessante é a opção “Exibir equação no gráfico” – aí temos realmente a equação que dá o melhor fit aos dados.
Modelos do tipo “Random walk” são amplamente utilizados para fenômenos probabilísticos.
A ideia básica é bem simples.
Imagine um bêbado, que está numa posição de coordenadas (0,0).
Como ele está chapado, ele pode dar um passo numa direção aleatória qualquer.
Traduzindo numa fórmula, seria Posição(t+1) = Posição(t) + aleatório(), ou seja, sua posição futura depende da posição atual, mais o passo aleatório.
Nota: a função aleatória do Excel varia de 0 a 1. Queremos que ela varie de -0,5 a 0,5 (para considerar que o bêbado pode andar para trás também). Portanto, a ideia é simplesmente utilizar (aleatório() – 0.5).
Colocando as fórmulas numa planilha, resulta num gráfico deste tipo:
Clicando F9, o Excel realiza um novo sorteio do passo aleatório:
Temos uma série histórica de dados (digamos, uma medição por mês do consumo).
Responda:
Qual a distribuição Normal que melhor fita os dados da Coluna A?
Qual a distribuição Uniforme que melhor fita os dados da Coluna A?
Desenhe um histograma desta distribuição
Qual das duas distribuições (Normal ou Uniforme) fita melhor os dados?
Respostas:
Primeiro, para que serve isto?
Uma aplicação clássica é para forecast, por exemplo. Tenho uma série de dados históricos, e quero prever o comportamento futuro, e tomar ações, digamos, considerar um estoque mínimo para garantir um nível de serviço.
A Normal é a curva em forma de sino. Ela tem dois parâmetros, média e desvio padrão.
=MÉDIA(A2:A94)
=DESVPAD.A(A2:A94)
No fundo, fazer forecast é como se eu tivesse que dar um chute.
Se eu não souber muito bem o comportamento da curva, posso dizer: fica entre 270 e 723.
A uniforme é exatamente isto, ela tem a mesma probabilidade de dar qualquer valor entre mínimo e máximo.
=MÍNIMO($A$2:$A$94)
=MÁXIMO($A$2:$A$94)
Para ilustrar o resultado, fiz mais duas listas. A primeira faz um sorteio baseado numa normal, e a segunda, numa uniforme.
A uniforme é mais fácil de explicar.
É como usar a função aleatório entre (mínimo, máximo).
Porém, ela é discreta, e a versão contínua é a fórmula seguinte.
=ALEATÓRIO()*($F$17-$F$16)+$F$16
Para sortear uma normal, o truque é usar a fórmula inv.normal (inverso da normal acumulada), com um parâmetro aleatório.
=INV.NORM(ALEATÓRIO();$F$11;$F$12)
Fiz o histograma com fórmulas cont.ses. A ideia é contar quantos itens das listas estão entre 250 e 300, 300 e 350, etc…
Nota-se que a normal parece representar melhor os dados que a uniforme, para este caso específico.
A distribuição acumulada é outra forma de ver.
Clicar em F9 para sortear outros valores, e ver a diferença.
Você precisa fazer login para comentar.