DISEÑO MUESTRAL
El diseño muestral con el cual trabajamos es estrictamente probabilístico, único método conocido que permite efectuar inferencias al Universo, e interpretar los resultados estadísticamente, calculando además, a priori, la precisión a obtener, y, a posteriori, calcular la precisión realmente obtenida. Además permite efectuar los tests estadísticos necesarios para determinar si las diferencias encontradas entre los diversos parámetros estimados, son estadísticamente significativas. Por lo tanto, cualquier intento de selección en base a cuotas queda totalmente excluido en cualquiera de las etapas de selección.
El universo, conjunto de elementos objeto de interés en el estudio, corresponderá a todos los hogares que están conectados a la red telefónica a lo largo del país, la población será el universo en función de determinadas variables, como son las variables geográficas (regiones, provincias, comunas) y socioeconómicas (estratos ABC1, C2, C3, D y E) y posteriormente otro tipo de variables como son sexo, edad, tendencia política, etc.
El texto de W. Edwards Deming “Sample Design in Business Research”(1), está dedicado en su totalidad a este tipo de muestreo probabilístico específico. Más aún, él destaca que desde que conoció de esta técnica, aprendiéndola del afamado estadístico hindú Mahalanobis, no ha usado otro método en su vida profesional. (2)
Este método se caracteriza por replicar un determinado diseño muestral, cualquiera sea su complejidad, en un número determinado de muestras probabilísticas de idéntico diseño, de menor tamaño, y cada una de ellas igualmente representativa del Universo de Estudio.
Ventajas comparativas del diseño Replicado en relación a los diseños tradicionales. La muestra obtenida es científicamente válida, de la cual se pueden obtener no solamente las estimaciones deseadas, sino también estimaciones de los márgenes de error muestral a que están sometidas las estimaciones de los parámetros, y a los niveles de confianza que el investigador deseare, tomando en consideración todas las complejidades del diseño muestral utilizado.
Una ventaja adicional de este método, es que se cumple con el precepto de jamás efectuar reemplazos(3) en una muestra probabilística, evitando por lo tanto, perder las características de una muestra probabilística totalmente válida.
Una nueva ventaja de este método es la de que permite calcular los márgenes de error muestral con algoritmos de fácil elaboración y de alta confiabilidad, en lugar del uso indiscriminado y erróneo de las fórmulas correspondientes al “muestreo aleatorio simple”, a pesar de no se éste el diseño realmente utilizado en el estudio.
Una ventaja adicional del submuestreo interpenetrante es la de poder realizar la encuesta telefónica en forma modular, submuestra tras submuestra, hasta obtener el tamaño muestral deseado. Incluso, si por causas de fuerza mayor se debiera interrumpir el trabajo, la muestra ya obtenida sería representativa del Universo y podría ser fácilmente procesada e inflactada al Universo, a pesar de su menor tamaño.
Otra ventaja estriba en el hecho de que el número de intentos de llamadas se mantiene prácticamente homogéneo a través de toda la muestra, vale decir se mantiene casi constante el tamaño de los conglomerados finales, lo que impide un número excesivo de entrevistas, lo que aumentaría el margen de error muestral.
Otra ventaja de este diseño, es el de proporcionarnos una estimación del coeficiente de correlación intraclase para cualquiera de las variables bajo estudio. Esta estimación nos servirá luego para estimar con mayor propiedad el tamaño muestral necesario para obtener una precisión deseada, en futuros estudios. Esta estimación del coeficiente de correlación intraclase, nos permitirá también calcular el valor del “design effect” utilizado por primera vez por Leslie Kish, lo que puede transformarse en una gran ayuda, casi podríamos decir imprescindible, para la realización de análisis log-lineales, al permitirnos por medio de “ingeniería inversa”, configurar una muestra aleatoria simple sin inflactar, a partir de los datos inflactados del estudio original. Esta conversión a una muestra simulada, autoponderada, de tamaño real (equivalente al tamaño muestral nominal obtenido del estudio, dividido por el “design effect”), permite aplicar toda la batería de análisis log-lineales que se deseen.
Por último, e igualmente muy importante, debemos mencionar el hecho que el diseño propuesto es dinámico, vale decir sus estimaciones –valores inflactados al universo- no precisan de datos estadísticos secundarios respecto a la población (estimaciones poblacionales), sino que, automáticamente, detectan el crecimiento de la población, u otro movimiento poblacional, desde la fecha del último censo hasta la fecha de la encuesta.
(1) Editorial John Wiley & Sons, Inc.,1960 (2) Ver nota al pié de página, en el texto ya citado, págs. 186,187 (3) Texto de W. E. Deming, pág. 24