Tabla de contenido
¿Qué es una distribución de chi-cuadrado (C2)? ¿Cómo se usa la distribución de chi-cuadrado (C2)? La estadística de chi-cuadradoInvestigación académica para la distribución de chi-cuadrado (c2)
¿Qué es una distribución Chi-Cuadrado (C2)?
En teoría de probabilidad y estadística, la distribución Chi-cuadrado, también conocida como distribución Chi-cuadrado o distribución X2, con k grados de libertad, es la distribución de una suma de cuadrados de k variables normales regulares estándar independientes. La distribución chi es un caso único de distribución gamma y se encuentra entre las distribuciones de probabilidad más ampliamente aplicadas en estadística inferencial. Se usa comúnmente en la evaluación de hipótesis o en el desarrollo de un rango aceptable de desviación.
Volver a : INVESTIGACIÓN, ANÁLISIS Y CIENCIA DE DECISIÓN
¿Cómo se usa la distribución Chi-Cuadrado (C2)?
El chi-cuadrado se aplica en las pruebas regulares de chi-cuadrado para la bondad de ajuste de una distribución testificada a una hipotética. Más específicamente, mide la independencia de los dos métodos de agrupación de información cualitativa y aproximación del rango de confianza para la desviación estándar poblacional de la distribución normal a partir de una desviación estándar representativa. Otros estudios matemáticos, como el análisis de varianza por rangos de Friedman, aplican la distribución chi-cuadrado. La distribución de chi-cuadrado se emplea más comúnmente en la prueba de hipótesis. A pesar de las distribuciones populares, por ejemplo, la distribución normal y las distribuciones exponenciales, la distribución chi-cuadrado rara vez se aplica en el modelado directo de ocurrencias ordinarias. Da como resultado la siguiente evaluación de hipótesis:
- Test Chi-cuadrado de independencia en tablas de contingencia
- Prueba de chi-cuadrado de bondad de ajuste de datos observados a distribuciones hipotéticas
- Prueba de razón de verosimilitud para modelos anidados
- Prueba de rango logarítmico en el análisis de supervivencia
- Prueba de CochranMantelHaenszel para tablas de contingencia estratificadas
Además de las aplicaciones anteriores, la distribución chi-cuadrado es parte de la definición de distribución t y distribución F útil en pruebas t que son un análisis de varianza y análisis de regresión. La razón principal del uso extensivo de chi-cuadrado en la evaluación de postulados es su asociación con la distribución normal. Muchas pruebas de hipótesis utilizan estadísticas de prueba, por ejemplo, estadística t en una prueba t. Para estas pruebas t, a medida que el tamaño de la muestra, n, aumenta, la distribución de la muestra de la estadística de prueba se mueve a la distribución normal en un concepto de teorema de límite central. Como resultado de que las estadísticas de prueba se distribuyen asintóticamente normalmente, dado que el tamaño de la muestra es lo suficientemente grande, la distribución aplicada para la prueba de hipótesis puede estimarse mediante una distribución normal. El proceso de probar hipótesis utilizando una distribución normal se entiende bien y es relativamente fácil. La distribución chi-cuadrado más simple es el cuadrado de la distribución normal estándar. En caso de probar una hipótesis usando una distribución normal, se puede usar una distribución de chi-cuadrado. Además, la distribución Chi-cuadrado se aplica generalmente porque pertenece a una clase de pruebas de razón de verosimilitud (LRT). Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. La distribución chi-cuadrado más simple es el cuadrado de la distribución normal estándar. En caso de probar una hipótesis usando una distribución normal, se puede usar una distribución de chi-cuadrado. Además, la distribución Chi-cuadrado se aplica generalmente porque pertenece a una clase de pruebas de razón de verosimilitud (LRT). Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. La distribución chi-cuadrado más simple es el cuadrado de la distribución normal estándar. En caso de probar una hipótesis usando una distribución normal, se puede usar una distribución de chi-cuadrado. Además, la distribución Chi-cuadrado se aplica generalmente porque pertenece a una clase de pruebas de razón de verosimilitud (LRT). Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. En caso de probar una hipótesis usando una distribución normal, se puede usar una distribución de chi-cuadrado. Además, la distribución Chi-cuadrado se aplica generalmente porque pertenece a una clase de pruebas de razón de verosimilitud (LRT). Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. En caso de probar una hipótesis usando una distribución normal, se puede usar una distribución de chi-cuadrado. Además, la distribución Chi-cuadrado se aplica generalmente porque pertenece a una clase de pruebas de razón de verosimilitud (LRT). Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal. Los LRT poseen características favorables específicamente; proporciona la alta potencia en el rechazo de la hipótesis nula. Por otro lado, las estimaciones normales y de chi-cuadrado no son válidas asintóticamente, y se da preferencia a una distribución t en lugar de una estimación normal o una aproximación de chi-cuadrado para un tamaño de muestra pequeño. Ramsey indicó que la prueba binomial exacta normalmente es más poderosa que una aproximación normal.
La estadística de chi-cuadrado
Supongamos que realizamos el siguiente experimento estadístico. Elegimos una muestra aleatoria de n de una población normal, con una desviación estándar igual a . Se encuentra que la desviación estándar es s . con esta información podemos definir una estadística denominada chi-cuadrado utilizando esta ecuación 2 = [ ( n – 1 ) * s2 ] / 2 La distribución de la estadística chi-cuadrado se denomina distribución chi-cuadrado. La distribución chi-cuadrado viene dada por la siguiente función de densidad de probabilidad: Y = Y0 * ( 2 ) ( v/2 – 1 ) * e -2 / 2 Donde Y0 es una constante que depende del número de grados de libertad, 2 es el estadístico chi-cuadrado, v = n – 1 es el número de grados de libertad, y ees una constante igual a la base del sistema de logaritmo natural (estimado 2.71828). Y0 se define de modo que el área bajo la curva chi-cuadrado sea igual a 1.
Investigación académica para la distribución de Chi Square (c2)
La relación de las gráficas de control con el análisis de varianza y chi – pruebas cuadradas , Scheffe, H. (1947). Revista de la Asociación Estadounidense de Estadística , 42 (239), 425-431. Este artículo muestra algunas conexiones establecidas por caminos simples e intuitivos entre estos métodos estadísticos: gráficos de control de Shewhart, análisis de varianza y pruebas de chi-cuadrado.
Observaciones sobre una transformación multivariada, Rosenblatt, M. (1952). Los Anales de estadísticas matemáticas , 23 (3), 470-472. Este artículo señala y discute una transformación simple de una distribución k variable continua absoluta en una distribución uniforme en el hipercubo k dimensional. Se puede ilustrar que el vector aleatorio Z=TX se distribuye uniformemente en el hipercubo k-dimensional.- Chi – prueba cuadrada para distribuciones continuas con parámetros de cambio y escala, Nikulin, MS (1974). Teoría de la probabilidad y sus aplicaciones , 18 (3), 559-568. Este artículo examina el problema de verificación de la hipótesis nula de que la función de distribución de variables aleatorias distribuidas similares independientes pertenecientes a una familia de funciones continuas depende del factor de desplazamiento y el factor escalar en la función de distribución dada. Dividiendo la recta en k-intervalos por los puntos y agrupando sobre estos intervalos, se obtiene un vector de frecuencia y un vector de probabilidad.
Límites en las aproximaciones normales a las distribuciones de Student y chi – cuadrado , Wallace, DL (1959). Los Anales de Estadística Matemática , 30 (4), 1121-1130. El documento aborda la conversión de los valores de la cola superior de t o chi-cuadrado varía con n grados de libertad a desviaciones normales. El objetivo principal de este documento es desarrollar límites en la desviación de la normal real se desvía en la medida en que la desviación absoluta está limitada por an-12cn -12 uniformemente a lo largo de la cola.- Distribuciones
bivariadas de algunas proporciones de variables aleatorias chi – cuadrado independientes no centrales , Hawkins, DL y Han, CP (1986). Comunicaciones en Estadística-Teoría y Métodos , 15 (1), 261-277. El documento ilustra el examen de proporciones de tres pares de distribución bivariada de variables aleatorias independientes no centrales de chi-cuadrado. Estas relaciones surgen del problema de calcular la potencia combinada de pruebas F simultáneas en balanceadas en ANOVA y ANCOVA balanceadas.
Sobre la elección del número de intervalos de clase en la aplicación de la prueba chi-cuadrado , Mann, HB, & Wald, A. (1942). Los Anales de Estadística Matemática , 13 (3), 306-317. El documento establece que para verificar si una muestra se ha tomado de una población con una distribución de probabilidad particular, el rango de la variable se divide en algún rango de clase y se calcula la estadística. Bajo la hipótesis nula, es claro que la estadística; tiene asintóticamente la distribución chi-cuadrado con k-1 grados de libertad cuando cada número de población es grande. Cuando se hace una elección con respecto al número de intervalos de clase, normalmente es posible obtener la hipótesis alternativa con probabilidades de clase similares a las probabilidades de clase bajo la hipótesis nula.
Funciones de densidad de la distribución chi – cuadrada bivariada , Gunst, RF y Webster, JT (1973). Revista de computación y simulación estadística , 2 (3), 275-288. Este documento tenía como objetivo proporcionar un enfoque experimental para resolver los desafíos de aproximación y prueba simultánea que enfrentan los experimentadores. Se introdujo el Chi-cuadrado bivariado que permite la programación directa por computadora. Se propone una estimación que reduce el tipo de dependencia general a una forma específica, sustentada en un sólido razonamiento teórico. La última función del Chi-cuadrado bivariado es calcular la función de densidad de una combinación lineal de variables irregulares privadas de Chi-cuadrado.
Sobre la función de potencia límite de la prueba chi – cuadrada de frecuencia , Mitra, SK (1958). Los Anales de Estadística Matemática , 29 (4), 1221-1233. El artículo afirma que muchos autores han estudiado la función de potencia de la prueba X2 de frecuencia mediante la obtención de una muestra grande de la expresión de la prueba X2 de bondad de ajuste simple. Como resultado de los desafíos para encontrar la función de potencia de la prueba de frecuencia X2 con regularidad, se proporcionó una sugerencia de la derivación de su factor limitante de Pitman y una ilustración en el caso de ajuste de bondad simple. El concepto de poder asintótico se ha aplicado en varias áreas, incluida la conclusión no paramétrica, y demostró su utilidad en comparación con varias pruebas consistentes o diseños alternativos para el estudio.- Una familia de distribuciones chi – cuadrado
transformadas , Rahman, MS y Gupta, RP (1992). Comunicaciones en Estadística-Teoría y Métodos , 22 (1), 135-146. El documento define una familia de distribuciones de Chi-cuadrado transformado, una clase especial de familia de distribución exponencial. Se dan terminologías externas para los predictores insesgados de varianza mínima con menos varianza de una función de un factor de esta familia. También se encuentra el signo is y la función de potencia para diferentes pruebas de hipótesis para los elementos de esta familia.
Seguimiento de las medias y la variabilidad del proceso con un gráfico chi – cuadrado no central, Costa, AFB y Rahim, MA (2004). Revista de Estadística Aplicada , 31 (10), 1171-1183. Convencionalmente, un gráfico X es útil para controlar el promedio del proceso y un gráfico R para regular la variación del proceso. Estos gráficos son insensibles a pequeños cambios en los factores del proceso. Una mejor opción para estos gráficos es el gráfico de control de promedio móvil ponderado exponencial (AWMA) para controlar el promedio del proceso y la capacidad de variación que es altamente efectivo para detectar pequeños cambios en el proceso. Además, el gráfico de control EWMA basado en datos de Chi-cuadrado no centrado es más efectivo para identificar la variabilidad promedio.
Sobre las pruebas de bondad de ajuste chi – cuadrado para distribuciones continuas , Watson, GS (1958). Revista de la Real Sociedad Estadística. Serie B (Metodológica) , 44-72. El documento sugiere que Dado que en una prueba de bondad de ajuste de Chi-cuadrado, los factores desconocidos se aproximan a partir de la probabilidad de las observaciones continuas antes de la agrupación. Se estudian los impactos en la distribución del criterio de prueba.