Explorando

Estude mais sobre Estatística assistindo ao vídeo da Série O Mundo da Matemática.

Episódio 2 – Tema: Saúde e ergonomia – Título: Endireita essa coluna!


A partir da dor nas costas de Julinho, provavelmente devido à má postura e falta de atividade física, ele e seus amigos elaboram um instrumento de pesquisa que aplicam na escola para saber se outros colegas passam pelo mesmo problema. Oportunidade perfeita para aprenderem um pouco mais sobre Medidas de Tendência Central e de Dispersão. link para assistir a este Episódio
Assista ao Vídeo

Faça o download do Vídeo
Faça o download do Guia do Professor

 

Primeiro, responderemos ao questionamento:

1. Qual a idade média em que as pessoas tiveram maior incidência de Síndrome Respiratória Aguda Grave por Influenza A (H1N1) nas 28 primeiras semanas epidemiológicas?

Para isso, organizaremos as informações contidas no quadro da Figura 2 em uma tabela de frequências.



As tabelas de frequências ou distribuições de frequências resumem a informação contida na amostra, ordenando os seus valores e agrupando-os em classes de valores repetidos ou de valores distribuídos por intervalos.

Na tabulação dos dados, fazemos uma lista de todos os valores de um atributo e à frente de cada um colocamos o número de vezes que esse atributo ou valor ocorreu. Esta é a tabela de frequências absolutas. A frequência absoluta (FA), ou apenas frequência de um valor, é o número de vezes que uma determinada variável assume esse valor.

Existem, ainda, a frequência relativa (FR), absoluta acumulada acumulada (FAA) e frequência relativa acumulada (FRA). A frequência relativa é a porcentagem relativa à frequência absoluta. A frequência acumulada de um valor é o numero de vezes que uma variável assume um valor inferior ou igual a esse valor. Finalmente, a frequência relativa acumulada é a porcentagem relativa à frequência acumulada.

Podem calcular-se frequências absolutas e relativas de todas as variáveis, sejam elas qualitativas ou quantitativas. Variáveis quantitativas são aquelas que são numericamente mensuráveis e as qualitativas são aquelas que se baseiam em qualidades e não podem ser mensuráveis.

As variáveis quantitativas podem ser variáveis discretas (obtidas por contagem), como acontece na situação ora estudada, em que a variável em questão é a idade da pessoa que adquiriu SRAG por influenza A. Consideram-se, neste caso, as idades completas das pessoas, as quais são representadas por números inteiros positivos. Já as variáveis contínuas (obtidas por medida) podem ser exemplificadas com a altura ou com a massa de um indivíduo.

Passemos à construção da tabela de frequências.

Para preencher a coluna referente à frequência absoluta, basta transcrever as informações já contidas no gráfico. Para construir a coluna de frequência relativa, considera-se a porcentagem que a frequência absoluta de cada intervalo representa perante a amostra toda, o que implica em realizar uma regra de três simples. Para o caso do primeiro intervalo, por exemplo, fazemos:


Casos
Porcentagem
200
100
200.x = 1.100 → x = 100/200
1
x
x ≅ 0,45

Faixa Etária¹
(em anos)
Frequência Absoluta
(FA)
Frequência Relativa (FR)
em % **
Frequência Absoluta
Acumulada (FAA)
Frequência Relativa Acumulada (FRA)
em % **
0 1
1
0,45
1
0,45
1 10
18
8,18
19
8,63
10 15
19
8,64
38
17,27
15 20
20
9,09
58
26,36
20 50
139
63,18
197
89,54
50 65
22
10
219
99,54
65 90*
1
0,45
220
99,99
Total
220
100
220
100

¹ O símbolo é usado para representar os intervalos, de tal modo que o primeiro valor está incluso na classe, enquanto o segundo não está.
* Consideraremos, como hipótese e para efeito de cálculos, que o último intervalo vai de 65 a 90.
** Realizamos aproximações para duas casas decimais, usando de arredondamento.

Construída a tabela de frequências, podemos determinar qual a idade média em que as pessoas tiveram maior incidência de Síndrome Respiratória Aguda Grave por Influenza A (H1N1) nas 28 primeiras semanas epidemiológicas. Para isso, utilizaremos algumas das medidas de tendência central, as quais são utilizadas para expressar, por meio de um único número, em torno de qual valor tende a se concentrar um conjunto de dados numéricos. No caso, em torno de qual idade houve maior incidência de casos da gripe suína?

Dentre as medidas de tendência central usuais estão a média aritmética, a moda e a mediana. Estas medidas são encontradas de maneiras específicas de acordo com a forma como se apresentam os dados: não agrupados, agrupados em uma distribuição de frequências por valores simples ou agrupados em uma distribuição de frequências por classes. Na situação em estudo, em que as informações dadas estão divididas em sete classes, utilizaremos as seguintes fórmulas para calcular as medidas de tendência central.

Média Aritmética ()


sendo n o total de casos (220), Fi a frequência de cada intervalo e xi a média aritmética entre os extremos de cada intervalo.


Faixa Etária¹
(em anos)
Frequência Absoluta
(FA)
xi
xi.Fi
0 1
1
0,5
0,5
1 10
18
5,5
99
10 15
19
12,5
2375
15 20
20
17,5
350
20 50
139
35
4865
50 65
22
57,5
1265
65 90*
1
77,5
77,5
Total
220
9032

¹ O símbolo é usado para representar os intervalos, de tal modo que o primeiro valor está incluso na classe, enquanto o segundo não está.
* Consideraremos, como hipótese e para efeito de cálculos, que o último intervalo vai de 65 a 90.

Logo, segundo a média aritmética, a idade média de incidência de casos de SRAG pelo vírus da gripe suína é


Moda (Mo)

A moda é o valor mais frequente na distribuição. Para encontrar o valor da moda quando os dados não estão agrupados ou quando estão agrupados em uma distribuição de frequências por valores simples, basta identificar o valor que mais aparece no conjunto de informações. Quando os dados estão agrupados em uma distribuição de frequências por classes, utilizamos, para o cálculo da moda, a seguinte fórmula, conhecida como fórmula de Czuber.


Em que:

λi é o limite inferior da classe modal.
Δ1 é a diferença entre a frequência simples da classe modal e da classe anterior à modal.
Δ2 é a diferença entre a freqüência simples da classe modal e da classe posterior à modal.
h é a amplitude da classe modal.

Portanto, considerando que a classe modal é aquela em que está o maior número de casos da SRAG por influenza A, utilizaremos a classe 20 50, obtendo:


Logo, segundo a moda, a idade de incidência de casos de SRAG pelo vírus da gripe suína é de 35 anos.

Mediana (Md)

A mediana é o elemento que ocupa a posição central da distribuição, deixando 50% dos demais valores antes dele e 50% depois. Assim como no caso do cálculo para a moda, para calcular a mediana quando os dados não estão agrupados ou quando estão agrupados em uma distribuição de frequências por valores simples, basta identificar o valor que ocupa a posição central no conjunto de informações. Quando os dados estão agrupados em uma distribuição de frequências por classes, utilizamos, para o cálculo da mediana, a seguinte relação.


Em que:

λi é o limite inferior da classe mediana.
n é o número de elementos da amostra.
Fi é a frequência simples da classe mediana.
Fac,ant é a freqüência acumulada da classe imediatamente anterior à classe mediana.
h é a amplitude da classe mediana.

Assim, considerando a classe mediana como aquela em que se encontra o termo que ocupa a posição central quando os dados estão organizados em ordem crescente ou decrescente, fazemos n/2 , obtendo, neste caso, 110 (220/2). Para encontrar a classe em que se encontra o elemento da posição 110, pode ser útil considerar a coluna referente às frequências absolutas acumuladas, como podemos observar a seguir.


Faixa Etária¹
(em anos)
Frequência Absoluta
(FA)
Frequência Absoluta
Acumulada (FAA)
0 1
1
1
1 10
18
19
10 15
19
38
15 20
20
58
20 50
139
197
50 65
22
219
65 90*
1
220
Total
220
220

¹ O símbolo é usado para representar os intervalos, de tal modo que o primeiro valor está incluso na classe, enquanto o segundo não está.
* Consideraremos, como hipótese e para efeito de cálculos, que o último intervalo vai de 65 a 90.

Consideramos a classe mediana destacada uma vez que até a classe imediatamente anterior, como observa-se na FAA, só temos os elementos até a posição 58. Já na classe seguinte, as posições chegam a 197, a partir do que, concluímos que a posição 110 procurada está ali. A partir de então, passamos a calcular a mediana deste conjunto de informações:


Logo, segundo a mediana, a idade de incidência de casos de SRAG pelo vírus da gripe suína é de 31 anos.

As três medidas são consideradas representativas da situação em estudo e, portanto, respostas para o problema que investigamos.

A fim de complementar nosso estudo sobre a incidência de SRAG por influenza A, é importante, além de termos uma idade média em que a incidência é maior (41 anos, pela média aritmética), saber como os demais dados se comportam em torno dessa média. Procuraremos, então, responder ao segundo questionamento:

2. Qual a variabilidade em torno da média nestas 28 primeiras semanas epidemiológicas?

Para investigar a variabilidade dos dados em torno da média, utilizamos algumas medidas de dispersão. As medidas de dispersão indicam se os valores estão próximos uns dos outros, ou separados, em torno de uma medida de posição: a média. Nesta investigação, trataremos do desvio médio, da variância e do desvio padrão.

O desvio médio analisa a média dos desvios em torno do valor médio. Para seu cálculo, utilizamos, quando os dados estão agrupados em uma distribuição de frequências por classe, como na situação:


sendo n o total de casos (220), Fi a freqüência de cada intervalo, xi a média aritmética entre os extremos de cada intervalo e a média do conjunto de dados.

Faz-se conveniente, para organizar os cálculos, utilizar a tabela de frequências.


Faixa Etária¹
(em anos)
Frequência Absoluta
(FA)
xi
|xi-|
|xi-|.Fi
0 1
1
0,5
|0,5–41|=40,5
40,5
1 10
18
5,5
|5,5-41|=35,5
639
10 15
19
12,5
|12,5–41|=28,5
541,5
15 20
20
17,5
|17,5–41|=23,5
470
20 50
139
35
|35–41|=6
834
50 65
22
57,5
|57,5–41|=16,5
363
65 90*
1
77,5
|77,5–41|=36,5
36,5
Total
220
2924,5

¹ O símbolo é usado para representar os intervalos, de tal modo que o primeiro valor está incluso na classe, enquanto o segundo não está.
* Consideraremos, como hipótese e para efeito de cálculos, que o último intervalo vai de 65 a 90.

 

 

Retorne ao Topo da página.