V??rifi?? contenu

??chantillonnage (statistiques)

Sujets connexes: Math??matiques

?? propos de ce ??coles s??lection Wikipedia

Cette s??lection de wikipedia a ??t?? choisi par des b??n??voles aidant les enfants SOS de Wikipedia pour cette s??lection Wikipedia pour les ??coles. Tous les enfants disponibles pour le parrainage de SOS Enfants des enfants sont pris en charge dans une maison de famille pr??s de la charit??. Lire la suite ...

L'??chantillonnage est la partie de la pratique statistique concern??e par la s??lection des observations individuelles destin??es ?? donner une certaine connaissance de la population de pr??occupation, en particulier aux fins de inf??rence statistique. Chaque observation mesure une ou plusieurs propri??t??s (poids, localisation, etc.) d'une entit?? observable ??num??r??s de distinguer des objets ou des personnes. Les poids de sondage doivent souvent ??tre appliqu?? aux donn??es pour tenir compte de la conception de l'??chantillon. Les r??sultats de la th??orie des probabilit??s et th??orie statistique sont utilis??es pour guider la pratique.

Le processus d'??chantillonnage comprend plusieurs ??tapes:

  • D??finition de la population de pr??occupation
  • Sp??cification d'une base de sondage , un un ensemble d'??l??ments ou d'??v??nements possibles pour mesurer
  • Sp??cification d'une m??thode d'??chantillonnage pour s??lectionner des ??l??ments ou des ??v??nements du cadre
  • D??termination de la taille de l'??chantillon
  • Mise en ??uvre du plan d'??chantillonnage
  • ??chantillonnage et collecte des donn??es
  • Revoir le processus d'??chantillonnage

d??finition de la population

Pratique statistique succ??s est bas?? sur cibl??e d??finition du probl??me. Typiquement, nous cherchons ?? agir sur certains population, par exemple lorsqu'un lot de mati??res ?? partir de la production doit ??tre lib??r?? au client ou condamn?? ?? la ferraille ou de reprise.

Sinon, nous cherchons des connaissances sur le syst??me de cause dont la population est le r??sultat, par exemple quand un chercheur effectue une exp??rience sur des rats avec l'intention de gagner un aper??u de la biochimie qui peuvent ??tre appliqu??s au b??n??fice de l'homme . Dans ce dernier cas, la population concern??e peut ??tre difficile ?? sp??cifier, comme dans le cas de la mesure de certaines caract??ristiques physiques telles que la conductivit?? ??lectrique de cuivre .

Cependant, dans tous les cas, le temps pass?? ?? faire la population de pr??occupation pr??cise est souvent bien pass??, souvent parce qu'il soul??ve de nombreuses questions, les ambigu??t??s et les questions qui, autrement, auraient ??t?? n??glig??s ?? ce stade.

Base de sondage

Dans le cas le plus simple, comme la condamnation d'un lot de mati??res de la production ( l'??chantillonnage d'acceptation par lots), il est possible d'identifier et de mesurer chaque article dans la population et d'inclure l'un d'eux dans notre ??chantillon. Toutefois, dans le cas plus g??n??ral, ce ne est pas possible. Il ne existe aucun moyen d'identifier tous les rats dans l'ensemble de tous les rats. Il n'y a pas moyen d'identifier chaque ??lecteur ?? une ??lection prochaine (avant l'??lection).

Ces populations impr??cises ne se pr??tent pas ?? l'??chantillonnage dans l'une des fa??ons ci-dessous et ?? laquelle nous avons pu appliquer la th??orie statistique.

Pour y rem??dier, nous cherchons une base de sondage qui a la propri??t?? que nous pouvons identifier chaque ??l??ment et inclure tout dans notre ??chantillon. Par exemple, dans un sondage d'opinion, bases de sondage possibles incluent:

  • Registre ??lectoral
  • Annuaire t??l??phonique
  • Shoppers dans Anytown, High Street le lundi apr??s-midi avant l'??lection.

La base de sondage doit ??tre repr??sentatif de la population et ce est une question en dehors du champ de la th??orie statistique qui exige le jugement des experts dans le sujet particulier ?? l'??tude. Tous les cadres ci-dessus omettent certaines personnes qui vont voter ?? la prochaine ??lection et contenir certaines personnes qui ne veulent pas. Les gens ne sont pas dans le cadre ne ont aucune chance d'??tre ??chantillonn??s. La th??orie statistique nous renseigne sur les incertitudes dans l'extrapolation d'un ??chantillon au ch??ssis. En extrapolant ?? partir de cadre ?? la population, son r??le est de motivation et suggestif.

Il ya, cependant, une forte division de vues sur l'acceptabilit?? d'un ??chantillonnage repr??sentatif ?? travers diff??rents domaines d'??tudes. Pour le philosophe, la proc??dure d'??chantillonnage repr??sentatif n'a aucune justification car il ne est pas la fa??on dont la v??rit?? est poursuivi en philosophie. "Pour le scientifique, cependant, un ??chantillonnage repr??sentatif est la seule proc??dure justifi??e pour le choix des objets individuels pour une utilisation comme base de g??n??ralisation, et est donc g??n??ralement la seule base acceptable pour d??terminer la v??rit??." (Andrew A. Marin) . Il est important de comprendre cette diff??rence d'orienter clairement de prescriptions confusion trouv??s dans de nombreuses pages web.

En d??finissant le cadre, pratique, les questions ??conomiques, ??thiques et techniques doivent ??tre abord??es. La n??cessit?? d'obtenir des r??sultats en temps opportun peut emp??cher l'extension de la trame loin dans l'avenir.

Les difficult??s peuvent ??tre extr??mes lorsque la population et le cadre sont disjoints. Ce est un probl??me particulier dans pr??visions o?? des inf??rences fond??es sur l'avenir sont fabriqu??s ?? partir historique donn??es. En fait, dans 1703, lorsque Jacob Bernoulli propos?? de Gottfried Leibniz la possibilit?? d'utiliser les donn??es de mortalit?? historiques pour pr??dire la probabilit?? de d??c??s pr??matur?? d'un homme vivant, Gottfried Leibniz a reconnu le probl??me en r??pondant:

??La nature a cr???? des mod??les originaires de la d??claration des ??v??nements, mais seulement pour la plupart. Les nouvelles maladies inondent la race humaine, de sorte que peu importe combien vous avez fait des exp??riences sur des cadavres, vous ne avez pas de ce fait impos?? une limite sur la nature des ??v??nements de sorte que dans l'avenir, ils ne pouvaient pas varier. "

Apr??s avoir ??tabli le cadre, il ya un certain nombre de moyens pour l'organisation ?? am??liorer l'efficacit?? et l'efficacit??.

Ce est ?? ce stade que le chercheur doit d??cider si l'??chantillon est en fait d'??tre ensemble de la population et serait donc un recensement.

M??thode d'??chantillonnage

Dans ne importe lequel des types de trame identifi??e ci-dessus, une vari??t?? de m??thodes d'??chantillonnage peut ??tre utilis??e, individuellement ou en combinaison.

L'??chantillonnage par quotas

Dans l'??chantillonnage par quotas, la population est d'abord segment?? en sous-groupes mutuellement exclusifs, tout comme dans ??chantillonnage stratifi??. Puis jugement est utilis?? pour s??lectionner les sujets ou les unit??s de chaque segment sur la base d'un pourcentage d??termin??. Par exemple, un intervieweur peut ??tre dit pour ??chantillonner 200 femelles et 300 m??les ??g??s de 45 et 60.

Ce est cette deuxi??me ??tape qui rend la technique un des ??chantillonnage non probabiliste. Dans ??chantillonnage par quotas la s??lection de l'??chantillon est non al??atoire. Par exemple enqu??teurs pourraient ??tre tent??s d'interroger ceux qui regardent le plus utile. Le probl??me est que ces ??chantillons peuvent ??tre biais??e parce que tous ne obtient une chance de la s??lection. Cet ??l??ment al??atoire est sa plus grande faiblesse et de quotas par rapport probabilit?? a ??t?? un sujet de controverse depuis de nombreuses ann??es.

L'??chantillonnage al??atoire simple

Dans un ??chantillon al??atoire simple d'une taille donn??e, tous les sous-ensembles de la trame sont donn??s une probabilit?? ??gale. Chaque ??l??ment du cadre a donc une probabilit?? ??gale de s??lection: le cadre ne est pas subdivis?? ou partag??. Il est possible que l'??chantillon ne sera pas compl??tement al??atoire.

L'??chantillonnage stratifi??

Lorsque la population embrasse un certain nombre de cat??gories distinctes, le cadre peut ??tre organis?? par ces cat??gories dans s??par?? "strates". Un ??chantillon est ensuite s??lectionn?? dans chaque ??strate?? s??par??ment, produisant un ??chantillon stratifi??. Les deux principales raisons pour utiliser un plan d'??chantillonnage stratifi?? sont [1] pour se assurer que des groupes particuliers au sein d'une population soient ad??quatement repr??sent??s dans l'??chantillon, et pour am??liorer l'efficacit?? en acqu??rant un plus grand contr??le sur la composition de l'??chantillon. Dans le second cas, des gains importants en mati??re d'efficacit?? (soit tailles inf??rieures d'??chantillon ou une plus grande pr??cision) peuvent ??tre obtenus en faisant varier la fraction d'??chantillonnage d'une strate ??. La taille de l'??chantillon est en g??n??ral proportionnelle ?? la taille relative des strates. Toutefois, si les ??carts diff??rent sensiblement entre les strates, les ??chantillons devraient ??tre proportionnelle ?? la strate ??cart-type . Stratification disproportionn??e peut fournir une meilleure pr??cision que la stratification proportionnelle. Typiquement, les strates devraient ??tre choisis pour:

  • avoir des moyens qui diff??rent sensiblement les uns des autres
  • minimiser la variance dans les strates et de maximiser la variance entre les strates.

L'??chantillonnage en grappes

Parfois, il est moins cher de ??cluster?? l'??chantillon d'une certaine mani??re, par exemple en s??lectionnant r??pondants provenant de certaines zones seulement, ou certains seulement p??riodes de temps. (Presque tous les ??chantillons sont en quelque sorte ??cluster?? dans le temps -. Bien que ce est rarement prise en compte dans l'analyse)

L'??chantillonnage en grappes est un exemple de " deux ??tapes d'??chantillonnage ??ou?? ??chantillonnage ?? plusieurs degr??s ??: dans la premi??re ??tape d'un ??chantillon de zones est choisi; dans la deuxi??me ??tape d'un ??chantillon de r??pondants dans ces zones est s??lectionn??.

Cela peut r??duire Voyage et d'autres co??ts administratifs. Cela signifie ??galement que l'on n'a pas besoin d'un base de sondage pour l'ensemble de la population, mais seulement pour les grappes s??lectionn??es. L'??chantillonnage en grappes augmente g??n??ralement la variabilit?? des estimations de l'??chantillon ci-dessus que l'??chantillonnage al??atoire simple, selon la fa??on dont les groupes diff??rent entre eux, par rapport ?? la variation intra-cluster.

L'??chantillonnage al??atoire

Dans l'??chantillonnage al??atoire, aussi connu comme l'??chantillonnage probabiliste, chaque combinaison d'??l??ments du cadre, ou strate, a une probabilit?? connue de se produire, mais ces probabilit??s ne sont pas n??cessairement ??gale. Avec toute forme de pr??l??vement il ya un risque que l'??chantillon peut ne pas repr??senter ad??quatement la population mais avec ??chantillonnage al??atoire, il est un grand corps de la th??orie statistique qui quantifie le risque et permet ainsi un ??chantillon de taille appropri??e pour ??tre choisi. En outre, une fois que l'??chantillon a ??t?? pris la l'erreur d'??chantillonnage associ??e aux r??sultats mesur??s peut ??tre calcul??e. Avec l'??chantillonnage non al??atoire, il ne existe aucune mesure de l'erreur d'??chantillonnage associ??e. Bien que ces m??thodes peuvent ??tre moins cher ce est en grande partie vide de sens car il n'y a pas de mesure de la qualit??. Il ya plusieurs formes d'??chantillonnage al??atoire. Par exemple, dans ??chantillonnage al??atoire simple, chaque ??l??ment a une probabilit?? ??gale d'??tre s??lectionn??. Une autre forme de l'??chantillonnage al??atoire est ??chantillonnage de Bernoulli dans lequel chaque ??l??ment a une probabilit?? ??gale d'??tre s??lectionn??, comme dans l'??chantillonnage al??atoire simple. Toutefois, l'??chantillonnage de Bernoulli conduit ?? une variable taille de l'??chantillon, tandis que lors de l'??chantillonnage al??atoire simple de la taille de l'??chantillon reste constante. ??chantillonnage de Bernoulli est un cas particulier de ??chantillonnage de Poisson dans lequel chaque ??l??ment peut avoir une autre probabilit?? d'??tre choisi. D'autres exemples comprennent de l'??chantillonnage probabiliste ??chantillonnage stratifi?? et ??chantillonnage ?? plusieurs degr??s ..

??chantillonnage al??atoire appari??

Proc??d?? d'affectation participants ?? des groupes dans lesquels les participants sont des paires de premier correspond ?? une caract??ristique et ensuite affect??s au hasard ?? des groupes individuellement. (Brown, Cozby, Kee, et Worden, 1999, p.371).

La proc??dure pour l'??chantillonnage al??atoire peut ??tre assortie inform?? avec les contextes suivants,

a) Deux ??chantillons dans lesquels les membres sont clairement jumel??s, ou sont en correspondance explicitement par le chercheur. Par exemple, des mesures ou des paires de jumeaux identiques IQ.

b) Les ??chantillons dans lesquels le m??me attribut, ou variable, est mesur??e deux fois sur chaque sujet, dans des circonstances diff??rentes. Commun??ment appel?? mesures r??p??t??es. Les exemples incluent les temps d'un groupe d'athl??tes pour 1500 avant et apr??s une semaine de formation sp??ciale; les rendements laitiers de vaches avant et apr??s avoir ??t?? nourris avec un r??gime alimentaire particulier. Babu HM

L'??chantillonnage syst??matique

S??lection (par exemple) tous les 10 e nom de l'annuaire t??l??phonique est appel?? toutes les 10 ??chantillons, ce qui est un exemple de ??chantillonnage syst??matique. Ce est un type de l'??chantillonnage probabiliste ?? moins que le r??pertoire lui-m??me ne est pas randomis??. Il est facile ?? mettre en ??uvre et de la stratification induite peut rendre efficace, mais elle est particuli??rement vuln??rable aux p??riodicit??s dans la liste. Si la p??riodicit?? est pr??sente et la p??riode est un multiple de 10, puis partialit?? en d??coulera. Il est important que le premier nom choisi ne est pas simplement la premi??re dans la liste, mais est choisie (par exemple) le 7, o?? 7 est un nombre entier al??atoire compris entre 1, ..., 10 -1. Chaque i??me ??chantillonnage 10 est particuli??rement utile pour le pr??l??vement efficace de bases de donn??es.

??chantillonnage m??canique

??chantillonnage m??canique est g??n??ralement utilis?? dans ??chantillonnage solides , liquides et gaz , utilisant des dispositifs tels que grappins, godets, sondes de voleur, le COLIWASA et diviseur ?? rifles.

Il faut faire attention ?? se assurer que l'??chantillon est repr??sentatif de la trame. Beaucoup de travail dans ce domaine a ??t?? d??velopp?? par Pierre Gy.

??chantillonnage de commodit??

Parfois appel?? benne ou d'??chantillonnage d'opportunit??, ce est la m??thode de choix d'articles arbitrairement et de mani??re non structur??e du cadre. Bien que presque impossible de traiter avec rigueur, ce est la m??thode la plus couramment employ??e dans de nombreuses situations pratiques. Dans la recherche en sciences sociales, ??chantillonnage boule de neige est une technique similaire, o?? les sujets d'??tude existants soient utilis??s pour recruter plus de sujets dans l'??chantillon.

Ligne ?? l'origine d'??chantillonnage

Ligne d'intersection ??chantillonnage est une m??thode d'??l??ments d'??chantillonnage dans une r??gion o?? un ??l??ment est ??chantillonn??e si un segment de ligne choisi, appel?? ??transect??, l'??l??ment de coupe.

Types de donn??es

Cat??gorique et num??rique

Il existe deux types de variables al??atoires:. Cat??goriques et num??riques variables al??atoires cat??goriques donnent des r??ponses telles que ??oui?? ou ??non??. Les variables cat??goriques peuvent produire plus de deux r??ponses possibles. Par exemple: ??Quel jour de la semaine vous ??tes le plus susceptible de laver les v??tements? 'Variables al??atoires num??riques donnent des r??ponses num??riques, tels que votre taille en centim??tres.

Il existe deux types de variables num??riques:. Discr??tes et continues des variables al??atoires discr??tes produisent des r??ponses num??riques ?? partir d'un processus de comptage. Un exemple est ??combien de fois visitez-vous la machine de tr??sorerie dans un mois habituel? 'Variables al??atoires continues produisent des r??ponses ?? partir d'un processus de mesure. La hauteur est un exemple d'une variable continue parce que la r??ponse prend une valeur ?? partir d'un intervalle. Pr??cision de l'instrument (s) de mesure peut conduire ?? des observations li??es. Une observation li??e se produit lorsque l'appareil de mesure ne est pas sensible ou assez sophistiqu?? pour d??tecter les diff??rences suppl??mentaires dans les donn??es exp??rimentales ou de l'enqu??te.

G??n??ralement variable al??atoire continue n??cessite moins d'??chantillons que de la variable al??atoire discr??te. Cela peut ??tre justifi??e par r??f??rence ?? la Th??or??me central limite

??chantillonnage et collecte de donn??es

Bonne collecte de donn??es implique:

  • Apr??s le processus d'??chantillonnage d??fini
  • Garder les donn??es par ordre chronologique
  • Notant commentaires et autres ??v??nements contextuels
  • Enregistrement non-r??ponses

La plupart des livres d'??chantillonnage et des documents ??crits par des non-statisticiens se concentrent uniquement dans l'aspect de la collecte de donn??es, qui est juste une petite partie du processus d'??chantillonnage.

Examen du processus d'??chantillonnage

Apr??s le pr??l??vement, un examen doit ??tre tenu du processus exact suivie dans l'??chantillonnage, plut??t que celui pr??vu, afin d'??tudier les effets que les divergences pourraient avoir sur l'analyse ult??rieure. Un probl??me particulier est celui des non-r??ponses.

La non-r??ponse

En ??chantillonnage de l'enqu??te, la plupart des personnes identifi??es comme faisant partie de l'??chantillon peut ne pas ??tre dispos??s ?? participer ou impossible ?? contacter. Dans ce cas, il ya un risque de diff??rences entre (par exemple) le vouloir et ne veulent pas, conduisant ?? biais de s??lection dans les conclusions. Ce est souvent adress??e par des ??tudes de suivi qui font une tentative r??p??t??e de contacter le insensible et de caract??riser leurs similitudes et les diff??rences avec le reste de la trame. Les effets peuvent ??galement ??tre att??nu??s en pond??rant les donn??es lorsque rep??res d??mographiques sont disponibles.

Poids d'enqu??te

Dans de nombreuses situations de la fraction d'??chantillon peut ??tre modifi??e par strate et des donn??es devra ??tre pond??r?? pour repr??senter correctement la population. Ainsi, par exemple, un ??chantillon al??atoire simple de personnes au Royaume-Uni pourrait inclure certains dans les ??les ??cossaises ??loign??es qui seraient excessivement co??teux ?? d??guster. Une m??thode moins co??teuse serait d'utiliser un ??chantillon stratifi?? avec strates urbaines et rurales. L'??chantillon rural pourrait ??tre sous-repr??sent??s dans l'??chantillon, mais pond??r??e de mani??re appropri??e dans l'analyse pour compenser.

Plus g??n??ralement, les donn??es doivent g??n??ralement ??tre pond??r??s si la conception de l'??chantillon ne donne pas chaque individu une chance ??gale d'??tre s??lectionn??. Par exemple, lorsque les m??nages ont des probabilit??s de s??lection ??gales, mais une personne est interview?? au sein de chaque m??nage, ce qui donne des gens de m??nages de grande taille une moindre chance d'??tre interview??. Cela peut ??tre comptabilis??e en utilisant les poids de sondage. De m??me, les m??nages avec plus d'une ligne de t??l??phone ont une plus grande chance de d'??tre s??lectionn?? dans un ??chantillon de composition al??atoire, et les poids peuvent ajuster pour cela.

Les poids peuvent ??galement servir ?? d'autres fins, comme aider ?? corriger la non-r??ponse.

Histoire

L'??chantillonnage al??atoire en utilisant beaucoup est une vieille id??e, mentionn??e ?? plusieurs reprises dans la Bible. En 1786, Pierre Simon Laplace estime la population de la France en utilisant un ??chantillon, avec estimateur par le ratio. Il a ??galement calcul?? les estimations probabilistes de l'erreur. Elles ne ont pas exprim?? aussi moderne intervalles de confiance, mais que la taille de l'??chantillon qui serait n??cessaire pour obtenir une sup??rieure particuli??re li??e ?? l'erreur d'??chantillonnage avec une probabilit?? 1000/1001. Ses estimations utilis??es Le th??or??me de Bayes avec un uniforme probabilit?? a priori et il a assum?? son ??chantillon ??tait la th??orie random.The des statistiques de petits ??chantillons d??velopp?? par William Sealy Gossett mis le sujet sur une base plus rigoureuse dans le 20e si??cle. Cependant, l'importance de l'??chantillonnage al??atoire ne ??tait pas universellement appr??ci??e et aux Etats-Unis en 1936 Pr??vision Digest litt??raire d'une victoire r??publicaine ?? la ??lection pr??sidentielle se est mal pass?? mal, en raison de graves partialit??. Une taille d'un million de l'??chantillon a ??t?? obtenu par les listes d'abonn??s de magazines et annuaires t??l??phoniques. Il ne ??tait pas appr??ci?? que ces listes ont ??t?? fortement sollicit??s vers les r??publicains et l'??chantillon obtenu, bien que tr??s grande, ??tait profond??ment vici??.

R??cup??r?? ?? partir de " http://en.wikipedia.org/w/index.php?title=Sampling_(statistics)&oldid=208695328 "