Tema 14

Pruebas no paramétricas

Competencias

¿Qué competencias desarrollarás?

Explora


Dentro de una investigación, ¿te imaginas lo complicado que llega a ser si se levantan encuestas en dos muestras diferentes y los resultados son completamente diferentes?

Con el SPSS es posible resumir más rápido este caso, al igual que saber si la hipótesis se aprueba o no.

En este tema conocerás sobre las pruebas no paramétricas. ¡Aprende más hoy!

Subtemas

Subtemas

Conoce

14.1. Dos muestras independientes

Para iniciar el tema es necesario comprender la relación entre las muestras y tener en cuenta que las pruebas no paramétricas se basan en rangos o en signos en lugar de datos reales; además de que son usadas comúnmente cuando se cumple con los supuestos básicos de las pruebas paramétricas, es decir, utilizan pruebas que tienen como parámetro la distribución normal de datos, al igual cuando las muestras son pequeñas por lo difícil que es asumir y evaluar la normalidad de los datos cuando se cuenta con variables en escalas menores del intervalo.

Entonces, para la revisión de dos muestras independientes se emplea lo siguiente.

Por ejemplo, si dos muestras son sobre la misma población se espera que el estadístico U sea igual, de tal manera que U se calcula como el número de veces que los valores de la muestra 1 sobrepasan los valores de la muestra 2. 

Cuando la muestra es menor a 30, el sistema estadístico SPSS asigna de manera automática el significado exacto a partir del estadístico U; se obtiene el doble de la probabilidad de valores menores o igual a U.

Por ejemplo:
Si el grupo A tiene los valores 3, 4, 5, y 7, y el grupo B tiene los valores 1, 2 y 6, entonces, se obtienen 7 puntos en el orden de 3, 4, 5, 7, 1, 2 y 6, respectivamente.

Se multiplican los tamaños de la muestra: Grupo A = 4 sujetos y Grupo B = 3 sujetos, es decir, 4 × 3 = 12.

Se calcula:



En donde N es el número de sujetos en cada grupo; en este caso, el grupo A tiene 4 sujetos, por lo que:



Se suma el orden del grupo A por lo que:

3 + 4 + 5 + 7 = 19

También se suma el resultado de N y se resta el resultado de la multiplicación de los sujetos, por lo que:

12 + 10 - 19 = 3

De tal manera que el resultado de la prueba U de Mann-Whitney es de 3.

Dentro de la estadística, la hipótesis es una afirmación acerca de un parámetro de la población, pero la hipótesis nula afirma que dos parámetros o fenómenos no tienen una relación entre ellos. En este sentido, la hipótesis nula afirma que no hay diferencia entre los grupos, es decir, la distribución del número entre ambos es la misma. Este último sistema ofrece el resultado contrastando la hipótesis nula de forma más amigable.

14.2. Dos muestras relacionadas

Además de la prueba U de Mann-Whitney se encuentra otra, conócela a continuación.

CNCI Virtual Multimedia Prueba de rangos de Wilcoxon

La prueba de Wilcoxon es una prueba no paramétrica de comparación de dos muestras relacionadas, las cuales:

Se considera como una alternativa no paramétrica a la prueba t para muestras relacionadas, la cual es empleada para comprar dos muestras relacionadas, emparejadas o de medidas repetidas en una sola muestra que se evalúa si sus rangos medios de población son diferentes.

Su procedimiento es parecido a la prueba U de Mann-Whitney, pero se ordenan las diferencias a partir de los pares de observaciones considerando la importancia, después, se suman los rangos positivos y negativos, por último, se calcula el estadístico Z para su suma. Cuando dentro de la población las medianas son iguales, la hipótesis nula supone los valores de las variables dependientes.

Se utiliza para comparar datos de dos mediciones de rangos, en este caso, las medianas o valores centrales de las muestras; conviene destacar que esta prueba determina que la diferencia no se deba al azar, así como que muestre una diferencia significativa en la estadística.

14.3. K muestras independientes

Para la revisión de muestras independientes se utilizan las pruebas K, también conocidas como test de Kruskal-Wallis. Dichas pruebas son una evolución de la prueba U de Mann-Whitney para el caso de tres o más muestras.

Para su cálculo se comparan las medianas de las muestras para determinar si provienen de diferentes poblaciones. Al igual que en la prueba U de Mann-Whitney, se ordenan y clasifican los valores de mayor a menor. Cuando dos puntuaciones son iguales, se promedia el valor de ambas filas.

En este caso se deberá tomar en cuenta que la hipótesis nula sugiere que la distribución de las muestras poblacionales es la misma entre las diferentes categorías. Si no se rechaza la hipótesis nula, la variable muestra el mismo patrón entre todas las categorías, es decir, no existe diferencia. Cuando existe diferencia en al menos una, entonces se produce la prueba; ésta no identifica dónde ocurren las diferencias o cuántas son en realidad. Se recurre a pruebas post hoc que permiten conocer las diferencias entre medias para identificar dónde ocurren las diferencias. El SPSS ofrece la prueba U de Mann-Whitney para corregir cada par mediante el ajuste de Bonferroni, o prueba post hoc, que permite comparar las medias de los niveles t después de haber rechazado la hipótesis nula.

Dos Santos (2017) señala que en el siguiente ejemplo que una agencia de viajes necesita analiza la probabilidad de que tres tipos de familias soliciten un paquete de crucero por el Caribe, para ello, se encuestó a los clientes y se ponderaron los resultados de la siguiente forma.

La agencia pretende conocer si hay diferencias entre los grupos para elaborar una estrategia de mercado personalizada para cada grupo.

La hipótesis nula afirma que no existen diferencias entre las catergorías presentadas, ya que la distribución de la probabilidad de tomar un crucero entre los tres grupos es la misma.

En el SPSS se selecciona el menú Analizar-pruebas no paramétricas y en él se selecciona la opción Más moderna, muestras independientes.

Imagen 1. Resultado del test de Kruskal-Wallis.

Con este resultado se sugiere rechazar la hipótesis nula porque quiere decir que sí hay diferencias entre los grupos, pero no se sabe cuál grupo es distinto.

También existe otro tipo de prueba para encontrar la suma de rangos en las muestras independientes.

En la prueba de la mediana se contrasta la hipótesis nula de que los datos provengan de la misma población con medianas iguales; para contrastarlas se requiere que la variable sea medida por lo menos en una escala ordinal.

Dentro del SPSS en el cuadro de diálogo en la opción Contrastar variables se encuentran las variables que recogen puntuaciones de los grupos. En la variable Agrupación se muestra la variable determinada de los grupos, es decir, actúa como un factor y se indica en Definir el rango los valores para el máximo y mínimo que correspondan por categoría. En el recuadro Tipo de prueba se activan las pruebas que se requieren realizar.

14.4. K muestras relacionadas

En el caso de las muestras relacionadas K, se emplea el test de Friedman que sirve para analizar los promedios poblacionales cuando se tienen puntuaciones en múltiples ocasiones o en condiciones experimentales.

Para calcularlo se parte de un diseño donde se tiene más de tres muestras o tratamientos relacionados de una muestra de sujetos independientes entre sí, la escala al menos debe ser ordinaria y todas de igual tamaño.

En situaciones donde se requiere examinar una clasificación de sujetos u objetos en función de sus características o valores de los jueces, es necesario acudir a lo siguiente.

CNCI Virtual Multimedia Coeficiente de concordancia Kendall o W

Entonces con esto se tiene que el test de Friedman establece la hipótesis nula: n promedios poblacionales iguales entre sí; mientras que el coeficiente de concordancia W establece que n conjuntos de puntuaciones comparados son independientes entre sí.

Ambos índices permiten conocer la relación entre los datos analizados y con ello obtener datos más precisos que ayuden a la objetividad del estudio.

Relaciona


Arturo está a punto de realizar una investigación de mercado, para ello, se ha enfocado en dos comunidades casi opuestas dentro del país y ha obtenido información de 25 personas en cada lugar, con lo que recopiló datos completamente distintos entre cada una de ellas.

¿Qué pruebas debería emplear Arturo para conseguir la información que necesita?, ¿por qué?

Aplica

Actividad formativa

AF7 - T14

Instrucciones: En fuentes confiables investiga sobre la prueba U de Mann-Whitney, la prueba de rangos de Wilcoxon, el coeficiente de concordancia Kendall, la pruebas K o Kruskal-Wallis y el test de Friedman para luego hacer un ensayo de investigación.