Matemàtiques 0.1 fins l'infinit

Matemàtiques per a l'ensenyament secundari

El canvas del títol no funciona
Matemàtiques 0.1 fins l'infinit. Matemàtiques per a l'ensenyament secundari

Estadística d’una variable

Nivell educatiu: 3r d’ESO

Paraules clau: estadística, qualitativa, quantitativa, discreta, contínua, GeoGebra

Resum

Aquest tema d’estadística descriptiva està orientat a l’ensenyament secundari. Normalment hi ha molta confusió entre les propietats estadístiques, quines es podem utilitzar en cada model estadístic. Per això el fil conductor del tema són els models estadístics.

Índex

Introducció

L’estadística és la ciència matemàtica encarregada de recopilar, ordenar, representar i analitzar conjunts amb una gran quantitat de dades. És el coneixement matemàtic més utilitzat per les altres ciències, també en l’economia i sobre tot en la premsa.

Podeu distingir entre l’estadística descriptiva, amb la funció de conèixer els conjunts de dades i l’estadística inferencial o inductiva, que estudia el comportament dels conjunts de dades.

Les primeres estadístiques es van aplicar a la població humana i per això hi ha un vocabulari estadístic molt relacionat amb la sociologia.

La població estadística és el conjunt estudiat i és fonamental que estiga perfectament definida. La lletra N majúscula s’utilitza per a indicar la grandària de la població.

L’individu és un element del conjunt i és molt important que els criteris que defineixen les estadístiques determinen sense error, si un individu pertany o no a la població estudiada.

La mostra és un subconjunt de la població, molt utilitzada quan s’estudien conjunts molt grans, per a simplificar i abaratir els costos econòmics dels estudis estadístics. La mostra ha de ser representativa de la població per minimitzar els errors produïts en l’estudi de la població. La lletra n minúscula s’utilitza per a indicar la grandària de la mostra. Normalment les fórmules utilitzen la n minúscula, però si estudieu una població completa podeu substituir-la per la N majúscula.

La variable estadística és la propietat estudiada i ha de ser mesurable en tots els individus que formen la població.

Per a realitzar una estadística necessitem una població i el valor de la variable de cada individu. Existeixen molts models estadístics per al tractament de la informació, en aquest curs ens centrarem solament en l’estadística descriptiva amb tres models. El model qualitatiu que utilitzareu per a variables qualitatives amb valors expressats amb paraules, el model quantitatiu discret per a variables que poden expressar-se amb nombres naturals o enters i el model quantitatiu continu per a variables que necessiten els nombres racionals o reals. No oblideu mai que les variables quantitatives tenen unitats i moltes de les característiques estadístiques que estudiareu també les tenen.

Exemples d’estadístiques qualitatives serien: la intenció de vot, la marca del mòbil, la satisfacció en un servei, les notes literals dels alumnes…

Exemples d’estadístiques quantitatives discretes serien: quantitat de fills d’una família, quantitat d’aparells electrònics que tenen les persones, quantitat d’aparells defectuosos en processos de fabricació…

Exemples d’estadístiques quantitatives contínues serien: Estudi de l’edat, de l’altura, del sou…

Les taules són les estructures principals d’ordenació de la informació, faciliten el càlcul i l’anàlisi estadístic. Penseu que les dues estructures més importants del la informació digital tenen forma de taula: els fulls de càlcul i les bases de dades.

Els models estadístics comparteixen algunes propietats i solament s’expliquen la primera vegada que apareixen. Ara estudiareu els tres models estadístics amb el mateix exemple analitzat de tres formes diferents.

Les notes escolars al llarg de la història passen per diferents models: les paraules insuficient, suficient, bé, notable, excel·lent que podeu analitzar qualitativament, els nombres 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 que podeu analitzar quantitativament de forma discreta i els nombres decimals que apareixen en els exàmens que podeu analitzar quantitativament de forma contínua.

El model estadístic qualitatiu

La taula

Aquest és el model més senzill i els valors de la variable estan definits amb paraules, poden ser nominals si no tenen ordre i ordinals si tenen ordre, però el seu tractament matemàtic és idèntic.

La intenció de vot i la marca de mòbil són variables nominals, i la satisfacció (ninguna, poca, molta, moltíssima) i les notes (insuficient, suficient, bé, notable, excel·lent) són ordinals.

Per analitzar la taula d’aquest model estadístic observareu l’exemple següent.

Les notes de matemàtiques dels 500 alumnes de l’institut.

x_i f_i h_i h_i\% a_i A_i
Insuficient 75 0.15 15 54 54
Suficient 125 0.25 25 90 144
150 0.30 30 108 252
Notable 100 0.20 20 72 324
Excel·lent 50 0.10 10 36 360
500 1.00 100 360

 

x_i. La primera columna conté els valors que pot prendre la variable estadística. El subíndex indica la línia on està situada la informació: x_1 és insuficient, x_2 és suficient, x_3 és bé, x_4 és notable i x_5 és excel·lent.

f_i. La segona columna conté les freqüències absolutes. Comptabilitza la quantitat d’individus que tenen la variable amb el mateix valor. També tenen subíndex, f_1=75\mbox{ alumnes}, f_2=125\mbox{ alumnes}, f_3=150\mbox{ alumnes}, f_4=100\mbox{ alumnes} i f_5=50\mbox{ alumnes}. Aquesta columna i l’anterior representen el punt de partida del càlcul de la taula. Baix de la columna està la grandària de la mostra, que és la suma de totes les freqüències absolutes n=f_1+f_2+f_3+f_4+f_5. Aquesta suma es representa amb la lletra grega sigma majúscula, com cada estadística té una quantitat de línies diferents la fórmula general s’escriu de la forma \displaystyle{n=\sum{f_i}}, i es lleig “La població és el sumatori de totes les freqüències absolutes”.

\displaystyle{h_i=\frac{f_i}{n}}. La tercera columna conté les freqüències relatives, redueix tota l’estadística a la unitat, i és calcula dividint la freqüència absoluta de cada línea entre la quantitat de mostra. Evidentment també tenen subíndexs, \displaystyle{h_1=\frac{f_1}{n}}, \displaystyle{h_1=\frac{75}{500}}, h_1=0.15. El sumatori de les freqüències relatives és la unitat 1=\displaystyle{\sum{h_i}} i permet verificar que els càlculs són correctes.

\displaystyle{h_i\%=100\cdot h_i}. La quarta columna conté les freqüències relatives expressades en percentatge i es calcula multiplicant per 100 les freqüències relatives. La columna ha de sumar cent, \displaystyle{100=\sum{h_i\%}}. Aquesta columna és de les més importants, la més utilitzada en els informes estadístics, si mireu els articles periodístics observareu que estan farcits de percentatges.

a_i=360^{\circ} \cdot h_i. La cinquena columna conté els angles dels sectors que representen cada informació en el diagrama de sectors. Es calcula multiplicant la columna de les freqüències relatives per 360^{\circ}. La suma de la columna és de 360^{\circ} i té una utilitat exclusiva per a dibuixar el gràfic de sectors de forma manual amb el semicercle graduat o transportador d’angles, actualment qualsevol full de càlcul dibuixa el gràfic automàticament.

SemicercleGraduat

\displaystyle{A_i=\sum_{k=1}^{k=i}{a_k}}. La sisena columna conté els angles acumulats i el valor de cada fila es calcula sumant a cada angle els anteriors. A_1=a_1, A_2=a_1+a_2, A_3=a_1+a_2+a_3, A_4=a_1+a_2+a_3+a_4, A_5=a_1+a_2+a_3+a_4+a_5. Aquesta columna és interessant per a dibuixar manualment el diagrama de sectors amb un cercle graduat o transportador complet d’angles.

CercleGraduat

El paràmetre estadístic

Mo. La moda és un valor de centralització estadístic i és el valor de la variable amb màxima freqüència, Mo=B\acute{e}. Si existeix un empat de màximes freqüències parlareu d’estadístiques bimodals, trimodals…

Representació del diagrama de barres

És un gràfic on les dades es representen amb rectangles separats i equidistants, del mateix ample i l’altura és proporcional a la freqüència. L’eix horitzontal té el nom dels valors de la variable estadística i l’eix vertical les freqüències. També podeu afegir en el centre de cada columna o en la part superior la freqüència relativa en percentatge.

Les notes de matemàtiques dels 500 alumnes de l’institut.

barres1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

Per a comparar varies estadístiques es dibuixen en el mateix gràfic i totes les barres que representen la mateixa informació de cada estadística es dibuixen juntes, i cada estadística d’un color diferent.

Les marques de les freqüències poden fer-se amb el sistema \left( 1 \cdot 10^n, \, 2 \cdot 10^n, \, 5 \cdot 10^n \right) és a dir, utilitzant els següents increments per a les ordenades: 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, …

La informació gràfica ha de ser molt visual i no es recomanen gràfics molt estrets o molt amples que impossibiliten una interpretació adequada de la informació.

Representació del diagrama de sectors

És un gràfic on les dades es representen amb sectors circulars seguint els següents procediments.

La forma més senzilla és amb un cercle graduat que permet dibuixar la circumferència i els angles acumulats sense moure el transportador. Aquest procediment no necessita moure l’aparell i per això és molt precís.

Les notes de matemàtiques dels 500 alumnes de l’institut.

cercle1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

Amb el semicercle graduat el procediment és més llarg, requereix dibuixar dos semicircumferències, girar el transportador per a dibuixar cada angle i si els angle superen els 180^{\circ} necessitareu un altre gir per completar l’angle. Aquest procediment necessita girar moltes vegades l’aparell i per això és molt imprecís.

Les notes de matemàtiques dels 500 alumnes de l’institut.

semicercle1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

També podeu representar la informació en un semicercle, multiplicant les freqüències relatives per 180^{\circ}, a_i=180 \cdot h_i. Aquest gràfic és molt típic en la representació de les dades electorals municipals, autonòmiques i estatals.

Programes informàtics

Hi ha infinitat d’aplicacions informàtiques que calculen i dibuixen estadístiques amb moltíssimes possibilitats de disseny, però he preferit utilitzar un programa que calcule solament les taules, les dades i els gràfics més bàsics. En el programa “Taules i gràfics estadístics“, creat amb GeoGebra, podeu introduir la informació, separant cada element amb comes de la forma següent.

1, Les notes de matemàtiques, Insuficient, 75, Suficient, 125, Bé, 150, Notable, 100, Excel·lent, 50

Primer escriviu el nombre 1 per informar al programa que es tracta d’una estadística qualitativa.

Després escriviu el títol de l’estadística.

I a continuació el nom de cada valor seguit de la seua freqüència.

Finalment pitgeu la tecla enter.

Ara disposareu de la taula, de les dades estadístiques, del gràfic de sectors amb dos controls per a modificar la grandària i el gràfic de barres amb tres control per a modificar l’altura i l’ample.

qualitativaGG

El model estadístic quantitatiu discret

Abans d’estudiar aquest model heu d’estudiar en profunditat el model qualitatiu.

La taula

Aquest model permet estudiar poblacions amb variables quantitatives discretes, variables que utilitzen els nombres naturals o enters. Per exemple, podeu estudiar la quantitat de germans, la quantitat de viatges realitzats.

Per analitzar la taula d’aquest model estadístic observareu l’exemple següent.

Les notes de matemàtiques dels 500 alumnes de l’institut.

x_i f_i h_i h_i\% H_i\% a_i A_i x_i \cdot f_i f_i \cdot \left( x_i- \overline{x} \right)^2
1 5 0.01 1 1 3.6 3.6 5 123.008
2 10 0.02 2 3 7.2 10.8 20 156.816
3 20 0.04 4 7 14.4 25.5 60 175.232
4 40 0.08 8 15 28.8 54.0 160 153.664
5 125 0.25 25 40 90.0 144.0 625 115.200
6 150 0.30 30 70 108.0 252.0 900 0.240
7 60 0.12 12 82 43.2 295.2 420 64.896
8 40 0.08 8 90 28.8 324.0 320 166.464
9 30 0.06 6 96 21.6 345.6 270 277.248
10 20 0.04 4 100 14.4 360.0 200 326.432
500 1.00 100 360.0 2980 1559.200

x_i. La primera columna conté els valors que pot prendre la variable estadística. Els subíndex tenen el mateix significat que en el model qualitatiu, indicant a quina fila pertany la informació. x_3=3 \mbox{ punts}.

f_i. La segona columna conté les freqüències absolutes, comptabilitza la quantitat d’individus que tenen la variable amb el mateix valor. També tenen subíndex, f_3=20 \mbox{ alumnes}. Aquesta columna i l’anterior representen el punt de partida del càlcul de la taula. Baix de la columna està la grandària de la mostra \displaystyle{n=\sum{f_i}}. n=500 \mbox{ alumnes}.

\displaystyle{h_i=\frac{f_i}{n}}. La tercera columna conté les freqüències relatives, redueix tota l’estadística a la unitat, i és calcula dividint la freqüència absoluta entre la quantitat de mostra. Observeu que la suma de les freqüències relatives sempre és la unitat, \displaystyle{1=\sum{h_i}}.

h_i\%=100 \cdot h_i. La quarta columna conté les freqüències relatives en percentatge i es calcula multiplicant per 100 les freqüències relatives. Observeu que la suma de les freqüències relatives en percentatge sempre és \displaystyle{100=\sum{h_i\%}}, i no oblideu que aquesta columna és la més utilitzada en els informes estadístics.

\displaystyle{H_i\%=\sum_{k=1}^{k=i}{h_k\%}}. La cinquena columna conté les freqüències relatives acumulades en percentatge i es calcula sumant a cada freqüència relativa en percentatge, totes les anteriors, H_1\%=h_1\%, H_2\%=h_1\%+h_2\%, H_3\%=h_1\%+h_2\%+h_3\%… Aquesta columna és fonamental per a calcula la mediana, els quartils, i els percentils estadístics.

a_1=360 \cdot h_i. La sisena columna conté els angles del gràfic de sectors. Es calcula multiplicant la columna de freqüències relatives per 360^{\circ}. La suma de la columna és de 360^{\circ} i té una utilitat exclusiva per a dibuixar manualment el gràfic de sectors amb el semicercle graduat o transportador d’angles.

\displaystyle{A_i=\sum_{k=1}^{k=i}{a_k}}. La setena columna conté els angles acumulats i cada fila es calcula sumant-li els angles anteriors. Aquesta columna és interessant per a dibuixar manualment el diagrama de sectors amb un cercle graduat o transportador complet d’angles.

x_i \cdot f_i. La huitena columna conté el producte de les dues primeres columnes, representa la quantitat de propietat que hi ha en una fila. La suma de la columna \displaystyle{\sum{x_i \cdot f_i}} representa la quantitat total de propietat de l’estadística. Amb aquesta suma i la suma de freqüències podeu calcula la mitjana \displaystyle{\overline{x}=\frac{\sum{x_i \cdot f_i}}{\sum{f_i}}}, important per a calcular la columna següent.

f_i \cdot \left( x_i- \overline{x} \right)^2. La novena columna conté les desviacions elevades al quadrat dels valors, respecte de la mitjana. La suma de la columna \displaystyle{\sum{f_i \cdot \left( x_i- \overline{x} \right)^2}} representa el sumatori de totes les desviacions quadràtiques de les dades i permet calcular la desviació típica de l’estadística.

Els paràmetres estadístics

Mo. La moda és un paràmetre de centralització i es calcula buscant el valor de la variable de màxima freqüència. Té les unitats de la variable, Mo=6\mbox{ punts}.

\displaystyle{\overline{x}=\frac{\sum{x_i \cdot f_i}}{\sum{f_i}}}. La mitjana també és un paràmetre de centralització i es calcula dividint la quantitat de propietat entre la quantitat de mostra. La mitjana representa la quantitat de propietat que tindria un individu si poguéssiu repartir-la tota. També té les unitats de la variable, \overline{x}=5.96\mbox{ punts}.

Me. La mediana és un paràmetre de centralització, és el valor que divideix la població en dos parts iguals. El primer 50\% de la població té una quantitat de propietat igual o inferior a la mediana i l’altre 50\% té una quantitat de propietat igual o superior a la mediana. Per a calcular la mediana heu de buscar el valor 50 en la columna de freqüències relatives acumulades en percentatge. Si existeix, calculeu la semisuma del valor de la variable d’aquesta línea i la següent, \displaystyle{ Me=\frac{x_{(\mbox{classe amb }H_i\%=50)}+x_{seg\ddot{u}ent}} {2} }. Si no existeix, és el valor de la variable amb la freqüència acumulada en percentatge més petita superior a 50, \displaystyle{Me=x_{(\mbox{classe amb }H_i\%>50)}}. Evidentment té unitats, Me=6\mbox{ punts}, 70 és el percentatge més petit superior a 50 i està en la sisena línea.

Q_1. El primer quartil és un paràmetre de posició, el valor que divideix la població en dos parts. El primer 25\% de la població té una quantitat de propietat igual o inferior al primer quartil i l’altre 75\% té una quantitat de propietat igual o superior al primer quartil. Per a calcular el primer quartil heu de buscar el valor 25 en la columna de freqüències relatives acumulades en percentatge. Si existeix, calculeu la semisuma del valor de la variable d’aquesta línea i la següent, \displaystyle{Q_1=\frac{x_{(\mbox{classe amb }H_i\%=25)}+x_{seg\ddot{u}ent}}{2}}. Si no existeix, és el valor de la variable amb la freqüència acumulada en percentatge més petita superior a 25, \displaystyle{Q_1=x_{(\mbox{classe amb }H_i\%>25)}}. Evidentment té unitats, Q_1=5\mbox{ punts}, 40 és el percentatge més petit superior a 25 i està en la cinquena línea.

Q_2=Me. El segon quartil és la mediana.

Q_3. El tercer quartil és un paràmetre de posició, el valor que divideix la població en dos parts. El primer 75\% de la població té una quantitat de propietat igual o inferior al tercer quartil i l’altre 25\% té una quantitat de propietat igual o superior al tercer quartil. Per a calcula el tercer quartil heu de buscar el valor 75 en la columna de freqüències relatives acumulades en percentatge. Si existeix, calculeu la semisuma del valor de la variable d’aquesta línea i la següent, \displaystyle{Q_3=\frac{x_{(\mbox{classe amb }H_i\%=75)}+x_{se\ddot{u}uent}}{2}}. Si no existeix, és el valor de la variable amb la freqüència acumulada en percentatge més petita superior a 75, \displaystyle{Q_3=x_{(\mbox{classe amb }H_i\%>75)}}. Evidentment té unitats, Q_3=7\mbox{ punts}, 82 és el percentatge més petit superior a 75 i està en la setena línea.

P_j\leq j\leq 100. Els percentils són paràmetres de posició, el valor que divideix la població en dos parts. El primer j\% de la població té una quantitat de propietat igual o inferior a P_j i l’altre (100-j)\% té una quantitat de propietat igual o superior a P_j. Per a calcular aquest valor heu de buscar el valor de j en la columna de freqüències relatives acumulades en percentatge. Si existeix, calculeu la semisuma del valor de la variable d’aquesta línea i la següent, \displaystyle{P_j=\frac{x_{(\mbox{classe amb }H_i\%=j)}+x_{seg\ddot{u}ent}}{2}}. Si no existeix, és el valor de la variable amb la freqüència acumulada en percentatge més petita superior a j, \displaystyle{P_j=x_{(\mbox{classe amb }H_i\%>j)}}. Evidentment té unitats, \displaystyle{P_{90}=\frac{9 \mbox{ punts}+10 \mbox{ punts}}{2}}=9.5 \mbox{ punts}, podeu observar el percentatge 90 en la taula. No oblideu les igualtats: P_{25}=Q_1, P_{50}=Q_2=Me, i P_{75}=Q_3.

R=x_{m\grave{a}xima}-x_{m\acute{i}nima}. El rang és un paràmetre de dispersió, es calcula restant el valor màxim i el mínim de la variable. També té uniat R=10 \mbox{ punts}-1 \mbox{ punts}=9 \mbox{ punts}.

\left(Q_1 \, , \, Q_3 \right). El rang interquartílic és interval que representa al 50\% central de la mostra, (5 \, , \, 7)\mbox{ punts}.

\displaystyle{\sigma=\sqrt{\frac{{\sum{f_i \cdot \left( {x_i - \overline x } \right)^2 }}}{{\sum {f_i}}}}}. La desviació típica representada per la lletra grega sigma minúscula \sigma, és un paràmetre de dispersió que mesura la mitjana de les desviacions quadràtiques, es calcula amb l’arrel de la divisió de l’última columna entre la suma de les freqüències. També té unitats, \displaystyle{\sigma=\sqrt{\frac{1559.2}{500}} =1.7659\mbox{ punts}}. Permet determinar la homogeneïtat d’una estadística, si el valor és nul l’estadística és totalment homogènia i conforme creix és menys homogènia o més heterogènia. També permet comparar estadístiques amb les mateixes unitats.

\left( \overline{x}-\sigma \, , \, \overline{x}+\sigma \right). El rang mitjà és l’interval centrat en la mitjana que inclou aproximadament el 68\% de les dades, (4.19 \, , \, 7.73)\mbox{ punts}.

\overline{x}\pm \sigma. L’entorn mitjà, és una altra forma d’expressar el rang mitjà. (5.96\pm 1.77)\mbox{ punts}.

\displaystyle{CV=\frac{\sigma}{\overline{x}}}. El coeficient de variació és un paràmetre de dispersió, es calcula amb el quocient de la desviació típica entre la mitjana. Les característiques són similars a la desviació típica, però amb un avantatge important, no té unitats i per això, permet comparar la homogeneïtat o heterogeneïtat de qualsevol estadística, \displaystyle{CV=\frac{1.7659 \mbox{ punts}}{5.69\mbox{ punts}}=0.2963}.

Representació del diagrama de barres

És un gràfic amb les mateixes característiques del model qualitatiu.

Les notes de matemàtiques dels 500 alumnes de l’institut.

discreta_barres

Representació del polígon de freqüències

És un gràfic amb les mateixes característiques que el de barres, però substituint els rectangles per una línea trencada que uneix els centres dels costats superiors dels rectangles. Aquest tipus de gràfics s’utilitzen molt per a models amb variables temporals.

Les notes de matemàtiques dels 500 alumnes de l’institut.

poligon1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

Representació del diagrama de sectors

És un gràfic amb les mateixes característiques del model qualitatiu.

Les notes de matemàtiques dels 500 alumnes de l’institut.

discreta_sectors

Programes informàtics

També podeu utilitzar el programa d’estadística “Taules i gràfics estadístics“, creat amb GeoGebra, podeu introduir la informació, separant cada element amb comes de la forma següent.

2, Les notes de matemàtiques, punts, 1, 5, 2, 10, 3, 20, 4, 40, 5, 125, 6, 150, 7, 60, 8, 40, 9, 30, 10, 20

Primer, escriviu el nombre 2 per informar que es tracta d’una estadística quantitativa discreta.

Després escriviu el títol de l’estadística.

A continuació la unitat.

Finalment els valors seguits de la seua freqüència.

Una vegada cliqueu enter, disposareu de la taula, les dades estadístiques, el gràfic de sectors amb dos punts de controls per a modificar la grandària, el gràfic de barres i el poligonal amb tres punts de control per a modificar l’altura i l’ample.

Les notes de matemàtiques dels 500 alumnes de l’institut.

discretaGG

La calculadora científica

Totes les calculadores científiques tenen un mòdul estadístic adaptat als models estadístics quantitatius discrets. En aquesta explicació s’utilitzen les calculadores CASIO fx 570 SP X i CASIO fx 991 SP X.

Activeu la columna de freqüències: casio1 casio2 casio3

Entreu al mòdul estadístic (entrareu directament en l’editor estadístic): casio4 casio5 casio6

Escriviu les dades en les columnes de valors i de freqüències, després de cada nombre cliqueu el botó   i desplaceu-vos amb les tecles de desplaçament. casio7

Sortiu de l’editor estadístic sense sortir del mòdul estadístic per a fer càlculs: casio8

Podeu tornat a entrar en l’editor estadístic per a modificar les dades en qualsevol moment:  casio9  casio10

Podeu observar els paràmetres estadístics: casio9 casio11  casio12 casio13

Podeu calcular el rang: casio9 casio14 casio15 casio16 casio17 casio9 casio14 casio15 casio18 casio19

Podeu calcular el coeficient de variació: casio9 casio14 casio20 casio21 casio22 casio9 casio14 casio20 casio23 casio24

Podeu sortir del mòdul estadístic entrant en altre mòdul (s’esborraran les dades estadístiques): casio25 .

El model estadístic quantitatiu continu

Abans d’estudiar aquest model heu d’estudiar en profunditat el model quantitatiu discret.

La taula

Aquest model permet estudiar poblacions amb variables quantitatives contínues, variables que utilitzen els nombres racionals o reals. Per exemple, podeu estudiar els ingressos econòmics de les persones, les altures de les persones, les temperatures de les poblacions.

En aquestes estadístiques la varietat de valors és extraordinària, si cada valor s’escriu en una línea, necessitaríeu taules molt llargues. Per a simplificar els càlculs, s’agrupen les dades en intervals. Els intervals han de ser incompatibles, es a dir, no han de tenir elements comuns, i la unió de tots els intervals ha de representar a tota l’estadística. Cada valor solament pot ser d’una única classe estadística. Si un interval finalitza obert, el següent ha de començar tancat i viceversa. La selecció dels intervals afecta als resultats estadístics.

Hi ha un parell de fòrmules per determinar una recomanació de la quantitat d’intervals i l’amplitud, però s’ha de considerar simplement una recomanació i utilitzar aquets valors de forma prudent.

Intervals=\sqrt{N} indica la quantitat d’intervals.

Amplitud=\dfrac{x_{m\grave{a}xima}-x_{m\acute{i}nima}}{\sqrt{N}} indica l’ample dels intervals.

En el nostre exemple Intervals=\sqrt{500}=22,3 i Amplitud=\dfrac{10-0}{\sqrt{500}}=0,44 que podriem aproximar a 20 intervals de 0,5 punts d’ample, però en aquest cas els intervals queden establerts per la tradició normativa del sistema educatiu.

Per analitzar la taula d’aquest model estadístic observareu l’exemple següent. Ara les notes de l’alumnat tenen decimals i aquestes s’agrupen en intervals, per exemple 4.2\in [0 \, , \, 5), 6.7\in [6 \, , \, 7)

Les notes de matemàtiques dels 500 alumnes de l’institut.

Interval_i x_i f_i h_i h_i\% H_i\% Altura_i a_i A_i x_i \cdot f_i f_i \cdot \left( x_i- \overline{x} \right)^2
[0 \, , \, 5) 2.5 75 0.15 15 15 15 54 54 187.5 1054.6875
[5 \, , \, 6) 5.5 125 0.25 25 40 125 90 144 687.5 70.3125
[6 \, , \, 7) 6.5 150 0.30 30 70 150 108 252 975.0 9.3750
[7 \, , \, 9) 8.0 100 0.20 20 90 50 72 324 800.0 306.2500
[9 \, , \, 10] 9.5 50 0.10 10 100 50 36 360 475.0 528.1250
500 1.00 100 360 3125.0 1968.7500

Interval_i. La primera columna conté totes les classes en forma d’intervals \left[ E_{\mbox{inferior}} \, , \, E_{\mbox{superior}} \right). El primer nombre és l’extrem inferior i el segon l’extrem superior. L’extrem superior d’una classe ha de coincidir amb l’extrem inferior de la següent, un extrem ha de ser obert i l’altre tancat.

\displaystyle{x_i=\frac{E_{sup_i}+E_{inf_i}}{2}}. La segona columna conté les marques de classe i es calcula amb la semisuma dels extrems de l’interval. Per exemple \displaystyle{x_1=\frac{5\mbox{ punts}+0\mbox{ punts}}{2}}=2.5\mbox{ punts}. Aquesta columna és la utilitzada per a introduir la informació en les calculadores.

f_i. La tercera columna conté la freqüència absoluta de cada classe, i la suma és la quantitat de mostra, \displaystyle{n=\sum{f_i}}.

\displaystyle{h_i=\frac{f_i}{n}}. La quarta columna conté les freqüències relatives.

h_i\%=100 \cdot h_i. La cinquena columna conté les freqüències relatives en percentatge.

\displaystyle{H_i\%=\sum_{k=1}^{k=i}{h_k\%}}. La sisena columna conté les freqüències relatives acumulades en percentatge.

\displaystyle{altura_i=\frac{f_i}{E_{sup_i}-E_{inf_i}}}. La setena columna conté l’altura dels rectangles en l’histograma. L’histograma és un gràfic amb rectangles de base variable i l’àrea proporcional a la freqüència. Com l’àrea d’un rectangle és base per altura, A=b \cdot a, podeu aïllar l’altura, \displaystyle{a=\frac{A}{b}}. L’àrea és la freqüència i la base l’ample de la classe.

a_i=360 \cdot h_i. La huitena columna conté els angles dels sectors.

\displaystyle{A_i=\sum_{k=1}^{k=i}{a_k}}. La novena columna conté els angles acumulats.

x_i \cdot f_i. La desena columna conté la quantitat de propietat de cada classe. Amb la mitjana \displaystyle{\overline{x}=\frac{\sum{x_i \cdot f_i}}{\sum{f_i}}} podeu calcular la columna següent.

\displaystyle{f_i(x_i-\overline{x})^2}. La onzena columna conté la desviació quadràtica de la classe.

Els paràmetres estadístics

Mo. La moda es calcula buscant el valor de la variable de màxima freqüència, podeu expressar aquest valor en forma d’interval (interval modal) Mo\in [6\, , \, 7)\mbox{ punts}, o amb la marca de classe, Mo=6.5\mbox{ punts}

\displaystyle{\overline{x}=\frac{\sum{x_i \cdot f_i}}{\sum{f_i}}}. La mitjana, \displaystyle{\overline{x}=\frac{3125\mbox{ punts}}{500}}=6.25\mbox{ punts}. L’interval mitjà és el que inclou la mitjana, \overline{x}\in [6\, , \, 7)\mbox{ punts}.

R=E_{sup_{\acute{u}ltim}}-E_{inf_1}. El rang, es calcula restant el extrem superior de l’última classe i l’extrem inferior de la primera classe. R=10\mbox{ punts}-0\mbox{ punts}=10\mbox{ punts}.

\displaystyle{\sigma=\sqrt{\frac{{\sum{f_i \cdot \left( {x_i - \overline x } \right)^2 }}}{{\sum {f_i}}}}}. La desviació típica, \displaystyle{\sigma=\sqrt{\frac{1968.75}{500}} =1.9843\mbox{ punts}}.

\left( \overline{x}-\sigma\, , \, \overline{x}+\sigma \right). El rang mitjà, (4.27\, , \, 8.23)\mbox{ punts}.

\overline{x}\pm \sigma. L’entorn mitjà, és altra forma d’expressar el rang mitjà, (6.25\pm 1.98)\mbox{ punts}.

\displaystyle{CV=\frac{\sigma}{\overline{x}}}. El coeficient de variació, \displaystyle{CV=\frac{1.9843 \mbox{ punts}}{6.25\mbox{ punts}}=0.3175}.

La mediana o percentil 50 Me=P_{50}, el primer quartil o percentil 25 Q_1=P_{25}, el tercer quartil o percentil 75 Q_3=P_{75} i la resta de percentils es calculen per interpolació lineal del polígon de freqüències relatives en percentatge, que voreu després d’estudiar el gràfic.

Representació del diagrama de sectors

És un gràfic amb les mateixes característiques del model qualitatiu i del model quantitatiu discret.

Les notes de matemàtiques dels 500 alumnes de l’institut.

continua_sectors

Representació de l’histograma

Prepareu l’eix abscisses amb una partició que represente tots els intervals, de forma proporcional a la seua grandària de forma contínua, prepareu l’eix d’ordenades amb intervals fins l’altura màxima. Dibuixeu els rectangles i escriviu en la part superior de cada classe la freqüència absoluta i la relativa en percentatge.

Les notes de matemàtiques dels 500 alumnes de l’institut.

histograma1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

Representació del polígon de freqüències relatives acumulades en percentatge

Prepareu l’eix abscisses amb una partició que represente tots els intervals, de forma proporcional a la seua grandària de forma contínua, prepareu l’eix d’ordenades amb intervals des del zero fins al 100.

Marqueu el primer punt (E_{inf_1} \, , \, 0), en el primer extrem inferior i altura zero.

Marqueu la resta de punts amb els valors de la columna de freqüències relatives acumulades en percentatge. (E_{sup_i}\, , \, H_i\%).

Uniu en una línea poligonal els punts. Evidentment el gràfic comença en una altura zero i finalitza en una altura 100.

Les notes de matemàtiques dels 500 alumnes de l’institut.

poligonal1

Fotograma anterior <clic en la part esquerra de la imatge>, fotograma posterior <clic en la part dreta de la imatge>

Càlcul de percentils

P_0=E_{inf_1}. El percentil zero és l’extrem inferior de la primera classe.

P_{100}=E_{sup_{m\grave{a}xim}}. El percentil cent és l’extrem superior de l’última classe.

P_i=E_{sup_i}. Si el percentatge apareix en la columna de freqüències relatives acumulades en percentatge, el percentil és l’extrem superior de l’interval.

\displaystyle{P_{0}=0\mbox{ punts}}.

\displaystyle{P_{15}=5\mbox{ punts}}.

\displaystyle{P_{40}=6\mbox{ punts}}.

\displaystyle{P_{70}=7\mbox{ punts}}.

\displaystyle{P_{90}=9\mbox{ punts}}.

\displaystyle{P_{100}=10\mbox{ punts}}.

Per a la resta de percentils heu d’interpolar en el segment on estiga el percentatge més petit que supere al buscat J \in [0,100] .

\displaystyle{P_j=\frac{J}{H_i\%}\left( E_{sup_1}-E_{inf_1} \right)+E_{inf_1}} si el percentatge està en la primera classe.

\displaystyle{P_{10}=\frac{10}{15}\left( 5-0 \right)+0=3.33\mbox{ punts}}

Resulta molt difícil recordar aquesta fórmula, però sencill recordar l’expressió contínua d’una recta \displaystyle{\frac{x-x_0}{x_1-x_0}=\frac{y-y_0}{y_1-y_0} }.

Aquest interval té dos punts coneguts el \displaystyle{\left(  0\% \, , \, 0 \, punts \right)} i \displaystyle{\left(  15\% \, , \, 5\, punts \right)}

Substituint en l’equació de la recta \displaystyle{\frac{pecentatge-0}{15-0}=\frac{nota-0}{5-0} }. Ara podeu calcular les notes substituint  percentatges o calcular percentatges substituin notes.

\displaystyle{P_j=\frac{J-H_{i-1}\%}{H_i\%-H_{i-1}\%}\left( E_{sup_i}-E_{inf_i} \right)+E_{inf_i}} si el percentatge està en altra classe.

\displaystyle{Q_1=P_{25}=\frac{25-15}{40-15}\left( 6-5 \right)+5=5.4\mbox{ punts}}

Aquest interval té dos punts coneguts el \displaystyle{\left(  15\% \, , \, 5 \, punts \right)} i \displaystyle{\left(  40\% \, , \, 6\, punts \right)}

Substituint en l’equació de la recta \displaystyle{\frac{pecentatge-15}{40-15}=\frac{nota-5}{6-5} }. Ara podeu calcular les notes substituint  percentatges o calcular percentatges substituin notes.

En el cas particular del primer quartil \displaystyle{\frac{25-15}{40-15}=\frac{Q_1-5}{6-5} }

\displaystyle{Me=P_{50}=\frac{50-40}{70-40}\left( 7-6 \right)+6=6.3333\mbox{ punts}}

Aquest interval té dos punts coneguts el \displaystyle{\left(  40\% \, , \, 6 \, punts \right)} i \displaystyle{\left(  70\% \, , \, 7\, punts \right)}

Substituint en l’equació de la recta \displaystyle{\frac{pecentatge-40}{70-40}=\frac{nota-6}{7-6} }. Ara podeu calcular les notes substituint  percentatges o calcular percentatges substituin notes.

En el cas particular de la mediana \displaystyle{\frac{50-40}{70-40}=\frac{Me-6}{7-6} }.

\displaystyle{Q_3=P_{75}=\frac{75-70}{90-70}\left( 9-7 \right)+7=7.5\mbox{ punts}}

Aquest interval té dos punts coneguts el \displaystyle{\left(  70\% \, , \, 7 \, punts \right)} i \displaystyle{\left(  90\% \, , \, 9\, punts \right)}

Substituint en l’equació de la recta \displaystyle{\frac{pecentatge-70}{90-70}=\frac{nota-7}{9-7} }. Ara podeu calcular les notes substituint  percentatges o calcular percentatges substituin notes.

En el cas particular del tercer quartil \displaystyle{\frac{75-70}{90-70}=\frac{Q_3-7}{9-7} }.

(Q_1 \, , \, Q_3). El rang interquartílic, (5.4 \, , \, 7.5)\mbox{punts}.

Programes informàtics

En aquest cas, també podeu utilitzar el programa d’estadística “Taules i gràfics estadístics“, creat amb GeoGebra, la informació la separareu amb comes de la forma següent.

3, Les notes de matemàtiques, punts, [0,5), 75, [5,6), 125, [6,7), 150, [7,9), 100, [9,10], 50

Primer, escriviu el nombre 3 per informar que es tracta d’una estadística quantitativa contínua.

Després escriviu el títol de l’estadística.

A continuació la unitat.

Finalment els intervals seguits de la seua freqüència. Cada interval comença on finalitza l’anterior.

Una vegada cliqueu enter, disposareu de la taula, les dades estadístiques, el gràfic de sectors amb dos punts de control per a modificar la grandària, l’histograma i el polígon de freqüències amb tres punts de control per a modificar l’altura i l’ample. Sobre la línea poligonal apareix un punt lliscant que permet calcular percentils.

Les notes de matemàtiques dels 500 alumnes de l’institut.

continuaGG

La calculadora científica

Avis important!

Les calculadores científiques bàsiques no tenen un mòdul estadístic adaptat al model estadístic quantitatiu continu, per tant el seu ús queda restringit al càlcul de la mitjana i la desviació típica. No oblideu d’introduir en la columna de les dades, les marques de classe.

El primer quartil, la mediana i el tercer quartil no estan calculats amb les interpolacions del gràfic de freqüències relatives acumulades en percentatge.





?>