Mostra estadística

De L'Enciclopèdia, la wikipedia en valencià
Anar a la navegació Anar a la busca

En estadística, una mostra és un subconjunt de casos o individus d'una població estadística. En diverses aplicacions interessa que una mostra siga una mostra representativa i per a això deu triar-se una tècnica de mostreig adequada que produïxca una mostra aleatòria adequada (contràriament s'obté una mostra biaixada l'interés de la qual i utilitat és més llimitat depenent del grau de biaix que presente).

Introducció[editar | editar còdic]

Les mostres s'obtenen en l'intenció d'inferir propietats de la totalitat de la població, per a lo cual deuen ser representatives de la mateixa (una mostra representativa es denomina tècnicament mostra aleatòria). Per a complir esta característica l'inclusió de subjectes en la mostra deu seguir una tècnica de mostreig. En tals casos, pot obtindre's una informació similar a la d'un estudi exhaustiu en major rapidea i menor cost (vegen-se les ventages de l'elecció d'una mostra, més avall).

Per una atra part, en ocasions, el mostreig pot ser més exacte que l'estudi de tota la població perque el maneig d'un menor número de senyes provoca també menys errors en la seua manipulació. En qualsevol cas, el conjunt d'individus de la mostra són els subjectes realment estudiats.

El número de subjectes que componen la mostra sol ser prou inferior a la població total, encara que suficient gran com per a que l'estimació dels paràmetros determinats tinga un nivell de confiança adequat. Per a que el tamany de la mostra siga idòneu cal recórrer al seu càlcul.

Atres definicions relacionades[editar | editar còdic]

Espai mostral[editar | editar còdic]

El espai mostral del que es pren una mostra concreta està format pel conjunt de totes les possibles mostres que es poden extraure d'una població per mig d'una determinada tècnica de mostreig.

Per a una població finita de n individus l'espai mostral està format per <math>2^n</math> subconjunts possibles. En la pràctica a voltes s'usen espais mostrals idealisats en número infinit de punts indexats per un conjunt variables reals.

Paràmetro o Estadístic mostral[editar | editar còdic]

Un paràmetro estadístic o simplement un estadístic mostral és qualsevol valor calculat a partir de la mostra, com per eixemple la mija, variansa o una proporció, que descriu a una població i pot ser estimat a partir d'una mostra. Un estadístic mostral és un tipo de variable aleatòria, i que com a tal, té una distribució de provabilitat concreta, freqüentment caracterisada per un conjunt finit de paràmetros.

Estimació[editar | editar còdic]

Una estimació estadística és qualsevol tècnica per a conéixer un valor aproximat d'un paràmetro referit a la població, a partir dels estadístics mostrals calculats a partir dels elements de la mostra. Si s'estima el suficient número de paràmetros pot aproximar-se de manera raonable la distribució de provabilitat de la població per a certes variables aleatòries.


Nivell de confiança[editar | editar còdic]

El nivell de confiança d'una asseveració basada en la inferència estadística és una mesura de la bondat de l'estimació realisada a partir d'estadístics mostrals. Usualment s'usen nivells de confiança per a intervals de confiança o ben p-valores que medixen la provabilitat de errors de tipo I (provabilitat de rebujar una certa hipòtesis sent que esta era correcta)

Eixemple[editar | editar còdic]

Es té una població de 222.222 habitants i es vol conéixer quants d'ells són hòmens i quants d'ells són dònes. Es conjectura que prop del 50% són dònes i el restant hòmens, pero es vol seleccionar una mostra per a determinar quants hòmens i dònes hi ha en la mostra i a partir d'ahí inferior el percentage exacte d'hòmens i dònes en la població total. La descripció d'una mostra, i els resultats obtenguts sobre ella, pot ser del tipo mostrat en el següent eixemple:

Dimensió de la població: 222.222 habitantes
Probabilitat del event: Hombre o Mujer 50%
Nivell de confiança: 90%
Desviació tolerada: 5%
Resultat 196
Tamany de la mostra: 270

L'interpretació d'eixes senyes seria la següent:

  1. La població a investigar té 222.222 habitants i volem saber quànts són hòmens o dònes.
  2. Estimem en un 50% per a cada sexe i per al propòsit de l'estudi és suficient un 90% de seguritat en un nivell entre 90 - 5 i 90 + 5.
  3. Generem una taula de 280 números a l'encert entre 1 i 222.222 i en un cens numerat comprovem el gènero per als seleccionats.

Ventages de l'elecció d'una mostra[editar | editar còdic]

L'estudi de mostres és preferible, en la majoria dels casos, per les següents raons:

  1. Si la població és molt gran (en ocasions, infinita, com ocorre en determinats experiments aleatoris) i, per tant, impossible d'analisar en la seua totalitat.
  2. Les característiques de la població varien si l'estudi es prolonga massa temps.
  3. Reducció de costs: en estudiar una chicoteta part de la població, les despeses de arreplegada i tractament de les senyes seran menors que si els obtenim del total de la població.
  4. Rapidea: en reduir el temps de arreplegada i tractament de les senyes, es conseguix major rapidea.
  5. Viabilitat: l'elecció d'una mostra permet la realisació d'estudis que serien impossible fer-ho sobre el total de la població.
  6. La població és suficientment homogénea respecte a la característica mesura, en lo que resultaria inútil malgastar recursos en un anàlisis exhaustiu (per eixemple, mostres sanguínees).
  7. El procés d'estudi és destructiu o és necessari consumir un artícul per a extraure la mostra (eixemples: vida mija d'una pera, càrrega soportada per una corda, precisió d'un proyectil, etc.).

Descripció matemàtica d'una mostra aleatòria[editar | editar còdic]

L'us de mostres per a deduir fiablement característiques de la població requerix que es tracte en mostres aleatòries. Si la mostra estadística considerada no constituïx una mostra aleatòria les conclusions basades en dita mostra no són fiables i en general estaran biaixades en algun aspecte.

En térmens matemàtics, donada una variable aleatòria X en una distribució de provabilitat F, una mostra aleatòria de tamany N és un conjunt finit de N variables independents, en la mateixa distribució de provabilitat F.[1]

Una atra forma més intuïtiva, d'entendre una mostra és considerar que una mostra és una successió de N experiments independents d'una mateixa cantitat. És important diferenciar una mostra de tamany N, o més exactament un mostreig de tamany N, del resultat concret dels N experiments (que com a conjunt de valors fixos, en sí mateixa, no és una mostra). El concepte de mostra inclou d'alguna manera el procediment triat per a obtindre les senyes (és dir, si les variables aleatòries considerades són independents entre sí, i si tenen la mateixa distribució).

En general, resulta molt fàcil comprovar si una determinada mostra és o no aleatòria, cosa que a soles pot fer-se considerant un atre tipo de mostrejos aleatoris robusts que permeten dir si la primera mostra era aleatòria o no.

Referències[editar | editar còdic]

  1. Samuel S. Wilks, Mathematical Statistics, John Wiley, 1962, Section 8.1