
Estad??stica
Antecedentes de las escuelas de Wikipedia
SOS Children produjo este sitio web para las escuelas, as?? como este sitio web video sobre ??frica . Para comparar obras de caridad de patrocinio este es el mejor v??nculo de patrocinio .


La estad??stica es una ciencia matem??tica referente a la recolecci??n, an??lisis, interpretaci??n o explicaci??n, y la presentaci??n de datos. Es aplicable a una amplia variedad de disciplinas acad??micas, desde los naturales y sociales ciencias a las humanidades , y al gobierno y los negocios.
Los m??todos estad??sticos pueden utilizarse para resumir o describir una colecci??n de datos; se llama estad??sticas descriptivas. Adem??s, los patrones en los datos pueden ser modelada en una forma que representa aleatoriedad y la incertidumbre en las observaciones, y luego utilizados para sacar conclusiones sobre el proceso o poblaci??n estudiada; se llama estad??stica inferencial. Tanto la estad??stica descriptiva e inferencial comprenden estad??stica aplicada. Hay tambi??n una disciplina llamada estad??stica matem??tica, que se ocupan de la base te??rica de la asignatura.
Las estad??sticas de palabras es tambi??n el plural de estad??stica (singular), que se refiere al resultado de la aplicaci??n de un algoritmo estad??stico a un conjunto de datos, como en estad??sticas econ??micas, las estad??sticas de delincuencia, etc.
Historia
Estad??sticas surgieron, a m??s tardar en el siglo 18 , a partir de la necesidad de los Estados de recoger datos sobre sus pueblos y econom??as, con el fin de administrarlos. Su significado ampliado a principios del siglo 19 para incluir la recopilaci??n y an??lisis de datos en general. Estad??sticas actuales se emplean ampliamente en el gobierno, los negocios y las ciencias naturales y sociales.
Debido a sus or??genes en el gobierno y su visi??n del mundo centrada en los datos, las estad??sticas se considera que no es un subcampo de las matem??ticas, sino m??s bien un campo distinto que utiliza las matem??ticas. Sus fundamentos matem??ticos se establecieron en las 17a y 18a siglos con el desarrollo de la teor??a de la probabilidad . El m??todo de los m??nimos cuadrados , una t??cnica central de la disciplina, fue inventado en el siglo 19 por varios autores. Desde entonces las nuevas t??cnicas de probabilidad y estad??stica han estado en continuo desarrollo. Modernos equipos han acelerado c??lculo estad??stico a gran escala, y tambi??n han hecho posibles m??todos nuevos que ser??an poco pr??cticas para llevar a cabo manualmente.
Visi??n de conjunto
En la aplicaci??n de las estad??sticas a un problema cient??fico, industrial o social, se parte de un proceso o poblaci??n a ser estudiada. Esto podr??a ser una poblaci??n de personas de un pa??s, de granos de cristal en una roca, o de productos manufacturados por una f??brica en particular durante un per??odo determinado. En cambio, puede ser un proceso observado en varias ocasiones; los datos recogidos sobre este tipo de "poblaci??n" constituyen lo que se llama un series de tiempo.
Por razones pr??cticas, en lugar de compilar datos sobre toda una poblaci??n, por lo general se estudia un subconjunto elegido de la poblaci??n, llamada muestra . Se recogen datos sobre la muestra en un estudio observacional o entorno experimental. Los datos se sometieron a an??lisis estad??stico, que sirve para dos prop??sitos relacionados: descripci??n y inferencia.
- La estad??stica descriptiva se pueden utilizar para resumir los datos, ya sea num??rica o gr??ficamente, para describir la muestra. Ejemplos b??sicos de descriptores num??ricos son la media y la desviaci??n est??ndar . Sumarizaciones gr??ficas incluyen varios tipos de tablas y gr??ficos.
- La estad??stica inferencial se utiliza para modelar patrones en los datos, lo que representa el azar y hacer inferencias sobre la poblaci??n mayor. Estas inferencias pueden tomar la forma de respuestas a preguntas s?? / no ( prueba de hip??tesis), estimaciones de caracter??sticas num??ricas ( de estimaci??n), descripciones de asociaci??n ( correlaci??n ), o el modelado de las relaciones ( regresi??n ). Otro t??cnicas de modelado incluyen ANOVA, series de tiempo, y miner??a de datos.
"... Es s??lo la manipulaci??n de la incertidumbre que nos interesa. Nosotros no estamos interesados en la materia que es incierto. Por lo tanto no estudiamos el mecanismo de la lluvia; s??lo si llover?? ".
El concepto de correlaci??n es particularmente notable. El an??lisis estad??stico de una conjunto de datos puede revelar que dos variables (es decir, dos propiedades de la poblaci??n en estudio) tienden a variar entre s??, como si est??n conectados. Por ejemplo, un estudio de los ingresos anuales y la edad de muerte entre las personas puede encontrar que los pobres tienden a tener vidas m??s cortas que las personas ricas. Las dos variables se dice que est??n correlacionados. Sin embargo, no se puede inferir inmediatamente la existencia de una relaci??n causal entre las dos variables (ver La correlaci??n no implica causalidad). Los fen??menos correlacionados podr??a ser causado por un tercer fen??meno, previamente no considerada, llamado acecho variable.
Si la muestra es representativa de la poblaci??n, a continuaci??n, inferencias y conclusiones de la muestra se pueden extender a la poblaci??n en su conjunto. Un problema importante consiste en determinar el grado en que la muestra elegida es representativo. Estad??sticas ofrece m??todos para calcular y corregir la aleatoriedad en la muestra y en el procedimiento de recogida de datos, as?? como m??todos para dise??ar experimentos robustos en el primer lugar (v??ase dise??o experimental).
El concepto matem??tico fundamental empleada en la comprensi??n de tales aleatoriedad es probabilidad . Estad??stica matem??tica (tambi??n llamadas teor??a estad??stica) es la rama de la matem??tica aplicada que utiliza la teor??a y la probabilidad de an??lisis para examinar la base te??rica de la estad??stica.
El uso de cualquier m??todo estad??stico es v??lido s??lo cuando el sistema o poblaci??n bajo consideraci??n satisface los supuestos matem??ticos b??sicos del m??todo. El mal uso de las estad??sticas pueden producir errores sutiles pero importantes en la descripci??n e interpretaci??n - sutil en que los profesionales experimentados, incluso a veces a hacer este tipo de errores, y serio en que puede afectar a la pol??tica social, la pr??ctica m??dica y la fiabilidad de las estructuras, como puentes y centrales nucleares. Aun cuando las estad??sticas se aplican correctamente, los resultados pueden ser dif??ciles de interpretar para una persona no experta. Por ejemplo, el significaci??n estad??stica de una tendencia en los datos - que mide el grado en que la tendencia podr??a ser causada por la variaci??n aleatoria en la muestra - puede no estar de acuerdo con el propio sentido intuitivo de su significado. El conjunto de habilidades b??sicas de estad??sticas (y el escepticismo) que necesitan las personas para hacer frente a la informaci??n en su vida cotidiana se conoce como cultura estad??stica.
M??todos estad??sticos
Los estudios experimentales y de observaci??n
Un objetivo com??n para un proyecto de investigaci??n estad??stica es investigar causalidad, y en particular para llegar a una conclusi??n sobre el efecto de los cambios en los valores de predictores o variables independientes sobre la respuesta o variables dependientes. Hay dos tipos principales de estudios estad??sticos causales, estudios experimentales y estudios observacionales. En ambos tipos de estudios, se observ?? el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de la variable dependiente. La diferencia entre los dos tipos es en realidad c??mo se llev?? a cabo el estudio. Cada uno puede ser muy eficaz.
Un estudio experimental consiste en tomar mediciones del sistema en estudio, la manipulaci??n del sistema, y luego tomar mediciones adicionales usando el mismo procedimiento para determinar si la manipulaci??n puede haber modificado los valores de las mediciones. En contraste, un estudio observacional no implica la manipulaci??n experimental. En su lugar los datos son recogidos y las correlaciones entre los predictores y la respuesta se investigan.
Un ejemplo de un estudio experimental es el famoso Estudios de Hawthorne que intentaban probar cambios en el ambiente de trabajo en la planta de Hawthorne de la Western Electric Company. Los investigadores estaban interesados en si el aumento de la iluminaci??n aumentar??a la productividad de la trabajadores de la l??nea de montaje. Los investigadores midieron primero productividad en la planta entonces modificarse la iluminaci??n en un ??rea de la planta para ver si los cambios en la iluminaci??n afectar??an la productividad. Como resultado, la productividad mejor?? en todas las condiciones experimentales (v??ase Efecto Hawthorne). Sin embargo, el estudio es hoy fuertemente criticado por errores en los procedimientos experimentales, espec??ficamente la falta de una grupo de control y blindedness .
Un ejemplo de un estudio observacional es un estudio que explora la relaci??n entre fumar y el c??ncer de pulm??n. Este tipo de estudio por lo general utiliza una encuesta para recoger observaciones sobre el ??rea de inter??s y luego realizar el an??lisis estad??stico. En este caso, los investigadores recoger??an observaciones de los fumadores y los no fumadores, quiz??s a trav??s de un estudio de casos y controles y, a continuaci??n, mira el n??mero de casos de c??ncer de pulm??n en cada grupo.
Los pasos b??sicos para un experimento son:
- planificar la investigaci??n, incluidas las fuentes de informaci??n, que determinan la selecci??n de sujetos de investigaci??n y ??ticos consideraciones para la investigaci??n y el m??todo propuesto,
- Dise??o del experimento concentr??ndose en el modelo del sistema y la interacci??n de las variables independientes y dependientes,
- resumir una colecci??n de observaciones para presentar su comunalidad suprimiendo detalles ( estad??sticas descriptivas),
- llegar a un consenso sobre lo que las observaciones nos dicen sobre el mundo que observamos ( inferencia estad??stica),
- documentar y presentar los resultados del estudio.
Niveles de medici??n
- Ver: Stanley Stevens "Escalas de medici??n" (1946): nominal, ordinal, de intervalo, la relaci??n
Hay cuatro tipos de mediciones o escalas de medici??n utilizados en las estad??sticas. Los cuatro tipos o niveles de medici??n (nominal, ordinal, intervalo y proporci??n) tienen diferentes grados de utilidad en estad??stica investigaci??n. Mediciones de relaci??n, donde se definen tanto un valor de cero y distancias entre diferentes mediciones, proporcionan la mayor flexibilidad en los m??todos estad??sticos que se puede utilizar para el an??lisis de los datos. Mediciones de intervalo tienen distancias significativas entre las mediciones, pero no tiene valor significativo cero (como mediciones de coeficiente intelectual o mediciones de temperatura en Fahrenheit). Mediciones ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden significativo a esos valores. Las medidas nominales no tienen ning??n orden de importancia significativa entre los valores.
Variables conformes s??lo con las mediciones nominales u ordinales est??n juntos a veces se llaman las variables categ??ricas, ya que no se pueden medir razonablemente num??ricamente, mientras que las mediciones ratio y el intervalo se agrupan como cuantitativa o las variables continuas debido a su naturaleza num??rica.
Las t??cnicas estad??sticas
Algunos muy conocidos estad??stica pruebas y procedimientos para investigaci??n observaciones son:
- La prueba t de Student
- prueba de chi-cuadrado
- An??lisis de la varianza (ANOVA)
- Mann-Whitney
- An??lisis de regresi??n
- An??lisis de factores
- Correlaci??n
- Coeficiente de correlaci??n de Pearson
- Coeficiente de correlaci??n de Spearman
- An??lisis de Series
Disciplinas especializadas
Algunos campos de uso indagaci??n estad??stica aplicada tan extensivamente que tienen terminolog??a especializada. Estas disciplinas son:
- La ciencia actuarial
- Econom??a Aplicada informaci??n
- Bioestad??stica
- Manos a la Obra y El remuestreo jackknife
- Estad??sticas de las empresas
- La miner??a de datos (aplicaci??n de estad??sticas y reconocimiento de patrones para descubrir el conocimiento a partir de datos)
- Demograf??a
- Estad??sticas econ??micas (Econometr??a)
- Estad??sticas de energ??a
- Estad??sticas de Ingenier??a
- Estad??sticas Ambientales
- Epidemiolog??a
- Geograf??a y Sistemas de Informaci??n Geogr??fica, m??s espec??ficamente en El an??lisis espacial
- Procesamiento de im??genes
- An??lisis Multivariante
- Estad??sticas psicol??gicos
- Calidad
- Estad??sticas sociales
- Alfabetizaci??n estad??stica
- Los modelos estad??sticos
- Los estudios estad??sticos
- An??lisis de procesos y Quimiometr??a (para el an??lisis de los datos de la qu??mica anal??tica y ingenier??a qu??mica)
- El an??lisis de supervivencia
- La ingenier??a de confiabilidad
- Estad??sticas en varios deportes, especialmente b??isbol y cricket
Estad??sticas forman una herramienta clave en la base de negocio y de fabricaci??n, as??. Se utiliza para entender la variabilidad sistemas de medici??n, los procesos de control (como en estad??stica de control de procesos o SPC), para resumir los datos, y para tomar decisiones basadas en datos. En estos papeles es una herramienta clave, y tal vez la ??nica herramienta fiable.
Computaci??n estad??stica
Los aumentos r??pidos y sostenidos en el c??mputo de partida de alimentaci??n de la segunda mitad del siglo 20 han tenido un impacto considerable en la pr??ctica de la ciencia estad??stica. Los primeros modelos estad??sticos fueron casi siempre de la clase de modelos lineales, sino poderosas computadoras, junto con num??ricos adecuados algoritmos , provocaron un resurgimiento del inter??s en modelos no lineales (especialmente redes neuronales y ??rboles de decisi??n) y la creaci??n de nuevos tipos, como modelos lineales generalizados y modelos multinivel.
El aumento de potencia de c??lculo ha llevado tambi??n a la creciente popularidad de los m??todos computacionalmente intensivas con base en muestreo, tales como pruebas de permutaci??n y la de arranque, mientras que t??cnicas como la Muestreo de Gibbs han hecho los m??todos bayesianos m??s factible. La revoluci??n de la computadora tiene implicaciones para el futuro de las estad??sticas, con un nuevo ??nfasis en las estad??sticas "emp??ricos" "experimentales" y. Un gran n??mero de tanto uso general y especial paquetes estad??sticos est??n ahora disponibles para los profesionales.
Mal uso
Hay una percepci??n general de que el conocimiento estad??stico es con demasiada frecuencia intencionalmente mal uso, mediante la b??squeda de maneras de interpretar los datos que son favorables al presentador. Un famoso dicho atribuido a Benjamin Disraeli es " Hay tres clases de mentiras:. Mentiras, malditas mentiras y estad??sticas "Y el presidente de Harvard Lawrence Lowell escribi?? en 1909 que las estad??sticas ", como las empanadas de ternera, son buenas si usted conoce a la persona que los hizo, y est??n seguros de los ingredientes."
Si varios estudios parecen contradecirse entre s??, entonces el p??blico puede venir a desconfiar de este tipo de estudios. Por ejemplo, un estudio puede sugerir que una dieta o actividad eleva la presi??n arterial , mientras que otro puede sugerir que disminuye la presi??n arterial. La discrepancia puede deberse a variaciones sutiles en el dise??o experimental, como las diferencias en los grupos de pacientes o protocolos de investigaci??n, que no se entienden f??cilmente por los no expertos. (Informes de los medios a veces omiten esta informaci??n contextual vitales por completo.)
Al elegir (o rechazar o modificar) una determinada muestra, los resultados pueden ser manipulados; tirar los valores extremos es uno de los medios de hacerlo. Estas manipulaciones no tienen por qu?? ser maliciosas o tortuosa; que pueden surgir de sesgos no intencionales de la investigadora. Los gr??ficos utilizados para resumir los datos tambi??n pueden ser enga??osas.
Las cr??ticas m??s profundas provienen del hecho de que el enfoque de la prueba de hip??tesis, ampliamente utilizado y en muchos casos requeridos por ley o reglamento, obliga a una hip??tesis (la hip??tesis nula) para ser "favoreci??", y tambi??n se puede parecer a exagerar la importancia de las peque??as diferencias en los grandes estudios. Una diferencia que es estad??sticamente muy significativa todav??a puede ser de ninguna importancia pr??ctica. (Ver la cr??tica de la prueba de hip??tesis y controversia sobre la hip??tesis nula.)
Una respuesta ha sido un mayor ??nfasis en la p-valor sobre s??lo informar si una hip??tesis fue rechazada en el nivel dado de importancia. El p-valor, sin embargo, no indica el tama??o del efecto. Otro m??todo cada vez m??s com??n es informar intervalos de confianza. Aunque ??stos se producen a partir de los mismos c??lculos como pruebas de hip??tesis o los valores de p, que describen tanto el tama??o del efecto y la incertidumbre que lo rodea.