Wiki AIA 13-17
Advertisement

Editora: Oquesana Silva

Colaboradores: Airton Camilotti, Danilo Burko, Guilherme Garrido, Larissa Fabri, Luiz Brandão

Análise de dados em pesquisa: Tendência central/ Dispersão[]

ESTATÍSTISTICA[]

1. Descritiva: descrição de dados

A. Tabular: resultados em forma de tabelas

B. Gráfica: descreve o que foi encontrado na forma de gráficos

2. Analítica: relaciona as características, testa as diferenças entre os grupos, compara.

3. Inferencial: a estatística inferencial compreende as técnicas por meio das quais são tomadas decisões sobre uma população estatística, decisões estas baseadas unicamente na observação de uma amostra ou na elaboração de um juízo. Também definida como aquela que identifica padrões de comportamento entre os indivíduos citados

Análise de dados[]

Consiste em trabalhar com o material coletado, buscando tendências, padrões, relações e inferências. Esta presente em todas as etapas da pesquisa, mas é mais sistemática após o encerramento da coleta de dados.

Medidas de Tendência Central e Dispersão[]

As distribuições de frequência de dados contínuos são definidos por dois tipos de medidas ou parâmetros: medida de tendência central e medidas de dispersão.

 Medida de Tendência Central[]

  É a representação por meio de um valor único ou central, determinado conjunto de informações que variam.

O primeiro passo ao examinar a distribuição é olhar para a tendência central das observações . A maioria dos tipos de dados médicos tendem a se agrupar de tal maneira que a densidade dos valores observados é maior perto do centro da distribuição. O próximo passo é determinar a distribuição em maior detalhe e olhar para a moda, mediana e a média, que são três medidas da tendência central.

Moda[]

É o valor mais comumente observado, o que ocorre com maior frequência,em um conjunto de dados. A moda é de algum interesse na clínica, mas raramente é de valor estatístico.Não é incomum que uma distribuição tenha mais de um valor para a moda. Neste caso, será uma distribuição bimodal, com uma população, por exemplo, que contém duas partes cada uma tendo uma distribuição diferente.

3,4,5,7,7,7,9 e 9  A moda é 7 porque é o número que ocorre maior número de vezes.

Existem conjuntos de dados que não representam moda, porque nenhum valor se repete maior número de vezes, e existem conjuntos de dados com duas ou mais modas. Assim, o conjunto de números: 1, 2, 3, 4, e 5 não tem moda, e o conjunto de números

1, 2, 2, 3, 4, 4, e 5  tem duas modas 2 e 4

A moda, diferentemente das medidas de tendencia central, pode ser obtida mesmo que a variável seja qualitativa. Nesse exemplo de tipos sanguíneos em número de indivíduos:

Tipo O em 47 // Tipo A 441 // Tipo B 123 //Tipo AB 25.  Nesse exemplo a moda será o sangue tipo A, que apareceu maior número de vezes.

Mediana[]

  • Divide fisicamente a distribuição em duas partes. Depende do ponto central também denominada percentil 50 ou quartil mediana

Se a amostra é constituída por um número ímpar de dados, a mediana é o valor que fica no centro dos dados ordenados. Por exemplo a mediana dos valores

1, 2, 3, 5 e 9    é  3

Se a amostra é constituída por um número de dados par a mediana é a media aritmética dos dois valore que ficam na posição central dos dados ordenados. Por exemplo a mediana dos valores é a média aritmética dos números 3 e 4, ou seja a mediana é 3,5.

1, 2, 3, 4, 7 e 9

Média[]

Média é a soma   de todos os valores observados (xi) dividido pelo número total de observações.É uma representação da média aritmética das observações. Utiliza todos os valores da amostra, mas apresenta como ponto negativo ser muito sensível a valores extremos

Medidas de Dispersão

Depois que a tendência central é determinada, o próximo passo é determinar o quanto estão espalhados (dispersos) os números. Isso pode ser feito calculando medidas baseadas na média. 1.' Medidas de Dispersão com Base em Percentis': os percentis, os quais chamados algumas vezes de quantis, são as porcentagens das observações abaixo do ponto indicado, quando todas as observações são ordenadas de maneira decrescente. A mediana, discutida anteriormente, é o percentil 50. O percentil 75 é o ponto abaixo do qual estão 75% das observações, ou acima dele estão 25% dos dados (quartil Q3), enquanto que o 25 é o ponto abaixo do qual estão 25% das observações (quartil Q1). Quartis.gif A ' 'distância interquartílica ou amplitude interquartílica é a distância entre o primeiro e o terceiro quartis dos valores refletindo a distância entre o valor mais alto e o mais baixo, no conjunto de dados, os percentis 75 e 25 respectivamente, algumas vezes abreviada como Q3-Q1. A vantagem de usar percentis é que eles podem ser aplicados a qualquer conjunto de dados contínuos. Seu uso em medicina fica quase inteiramente limitado a fins descritivos, mas nessa função os percentis são quase sempre clinicamente úteis. AIQ = Q3 - Q1

Simple.box

Box plot






Apresentada no diagrama de caixas (Box plot)


 Amplitude

Por definição amplitude é a diferença entre o maior e o menor dado observado. A amplitude não mede  bem a dispersão dos dados porque, em seu cálculo usam-se apenas os valores extremos e não todos os dados.


Variância

Os dados distribuem-se em torno da média. Então o grau de dispersão de um conjunto de dados pode ser medido pelos desvios em relação à média. Desvio de dados em relação à média é a diferença entre cada dado e a média do conjunto. Por exemplo, se a média de idade numa família for 30 anos, a pessoa que tiver 54 anos terá um desvio em relação a idade média de: 54 - 30 = 24 anos

Como cada dado tem um desvio em relação á média, para julgar o grau de dispersão de uma amostra é preciso observar todos os desvios. Não se pode calcular a média dos desvios porque a soma é sempre igual a zero.

Considere os seguintes dados 0, 4, 6, 8, e 7  a média dos dados é 5. Os desvios em relação a média, são os seguintes: 0-5=-5 // 4-5=-1 // 6-5=1 // 8-5=3 // 7-5=2.   Em conjunto, esses desvios mostram o grau de dispersão dos dados em torno da média. Mas a soma dos desvios é igual a zero (- 5 - 1 +1+3+2 = -6 +6 = 0 )

Qualquer que seja o conjunto de dados,a soma dos desvios é sempre zero por que os valores positivos e negativos se anulam. Então para medir a despesão dos dados em torno da média os estatísticos usam a soma dos quadrados dos desvios. Como os quadrados de números negativos são positivos, toda soma de quadrados é positiva ou, no mínimo nula (a soma dos quadrados dos desvios só é nula quando todos os desvios são iguais a zero)


Desvio Padrão

Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados . Existe uma medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade dos dados é o desvio padrão, definido como a raiz quadrada da variância, com o sinal positivo. O desvio padrão é representado por  s.

Coeficiente de Variação

O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem.

Bibliografia[]

Silva, Oquesana. Anotação da aula de Informática em Saúde. Univille. 20/06/2013.

Jekel, James; Katz, David; Elmore, Joann. Epidemiologia Bioestatística e Medina Preventiva. 2. ed. Porto Alegre: Artmed, 2005.

Vieira, Sonia. Introdução á Bioestatística. 3 ed. Rio de Janeiro: Campus, 1980.







                            

Advertisement