As distribuições de probabilidade eram, provavelmente, uma das coisas mais amedrontadoras que eu vi ao iniciar meu estudo de estatística. 

Eram muitas distribuições diferentes, com nomes elaborados e – muitas vezes – desconhecido. 

Entretanto, ao removermos a matemática desses modelos, eles ficam bem fáceis de entender. É isso que faremos hoje. 

Termos básicos

Antes de aprendermos sobre algumas distribuições mais importantes, precisamos repassar alguns conceitos básicos:

  1. A distribuição de probabilidade mostra as probabilidades de obter resultados diferentes. Por exemplo: a distribuição de cara ou coroa é de 0,5 e 0,5, respectivamente.
  2. Uma distribuição discreta é uma distribuição na qual os valores que os dados podem assumir são contabilizáveis
  3. Uma distribuição contínua é uma distribuição na qual os valores que os dados podem assumir não são contabilizáveis 

Distribuição Normal

A distribuição normal é a mais importante a ser conhecida, pois encaixa inúmeros fenômenos (QI, altura das pessoas, tamanho do sapato, peso ao nascer, etc).

Parte integrante da estatística por agir como base de várias técnicas de inferência (como regressão linear), ela tem uma curva em forma de sino, e possui as seguintes propriedades:

  1. Forma simétrica de sino
  2. Média e mediana são iguais e localizadas no centro
  3. Mais ou menos 68% dos dados estão dentro de 1 desvio padrão da média, cerca de 95% dentro de 2 desvios padrão da média, e quase 99,7% dentro de 3 desvios padrão da média.

Distribuição Gamma

A Distribuição Gamma é utilizada para prever o tempo de espera até que um evento futuro ocorra. 

É útil quando algo tem um mínimo natural equivalente a zero. Também é uma distribuição generalizada da distribuição do qui-quadrado e da distribuição exponencial. 

Distribuição do Qui-Quadrado

Como já falamos, a distribuição qui-quadrada é um caso particular da distribuição Gamma. 

Como há muitas informações para essa distribuição, não entraremos em detalhes, mas discutiremos seus usos:

  1. Permite estimar intervalos de confiança para um desvio padrão da população
  2. É a distribuição de desvios de amostra quando a distribuição subjacente é normal
  3. Permite a testagem de desvios de diferenças entre os valores esperados e observados

Distribuição de Bernoulli

Para entender a Distribuição de Bernoulli, é preciso saber o que é um Teste de Bernoulli. 

O Teste de Bernoulli é um experimento aleatório com apenas dois resultados possíveis: sucesso ou fracasso, onde a probabilidade de sucesso é sempre a mesma.

Portanto, a distribuição Bernoulli é uma distribuição discreta para um Teste de Bernoulli. Por exemplo, atirar uma moeda no ar pode ser representado por uma distribuição de Bernoulli. 

Distribuição Binomial

Agora que entendemos a Distribuição de Bernoulli, conseguimos perceber que a Distribuição Binomial representa múltiplos Testes de Bernoulli. 

Mais especificamente, a Distribuição Binomial é uma distribuição discreta que representa a probabilidade de obter x sucessos de n Testes de Bernoulli independentes.

Exemplo: Qual é a probabilidade de obter 5 coroas em 10 jogos  de cara ou coroa? 

Distribuição Weibull

A Distribuição Weibull modela a quantidade de tempo que demora para algo falhar, ou o tempo entre as falhas. 

Pode ser utilizada para responder perguntas como:

  1. Quanto tempo demora para uma lâmpada queimar?
  2. Quanto tempo demora para um consumidor enjoar de um produto? 
Published On: agosto 17th, 2021 / Categories: Data Science /

Aprenda a conseguir trabalho

Se inscreva para receber acesso gratuito ao módulo Conseguindo Trabalho!

Obrigado por se inscrever!
Houve um erro ao enviar sua inscrição. Tente novamente mais tarde.

Ao acessar, você concorda em receber nossos comunicados.