Muestreo (estadísticas)

dentro de cualquiera de los tipos de marcos identificados anteriormente, se puede emplear una variedad de métodos de muestreo, individualmente o en combinación.,f el marco

disponibilidad de información auxiliar sobre las unidades en el marco

requisitos de precisión, y la necesidad de medir la precisión

Si se espera un análisis detallado de la muestra

preocupaciones de costo/operación

muestreo aleatorio simple editar

Artículo principal: muestreo aleatorio Simple

una representación visual de la selección de una muestra aleatoria simple

en una muestra aleatoria simple (SRS) de un tamaño dado, todos los subconjuntos de un marco de muestreo tienen la misma probabilidad de ser seleccionados., Por lo tanto, cada elemento del marco tiene una probabilidad de selección igual: el marco no está subdividido ni particionado. Además, cualquier par de elementos dado tiene la misma posibilidad de selección que cualquier otro par (y de manera similar para triples, y así sucesivamente). Esto minimiza el sesgo y simplifica el análisis de los resultados. En particular, la varianza entre los resultados individuales dentro de la muestra es un buen indicador de varianza en la población general, lo que hace que sea relativamente fácil estimar la precisión de los resultados.,

el muestreo aleatorio Simple puede ser vulnerable al error de muestreo porque la aleatoriedad de la selección puede resultar en una muestra que no refleja la composición de la población. Por ejemplo, una simple muestra aleatoria de diez personas de un país dado producirá, en promedio, cinco hombres y cinco mujeres, pero es probable que un ensayo dado represente excesivamente a un sexo e infrarrepresente al otro. Las técnicas sistemáticas y estratificadas intentan superar este problema «utilizando información sobre la población» para elegir una muestra más «representativa».,

Además, el muestreo aleatorio simple puede ser engorroso y tedioso cuando se toma un muestreo de una población objetivo grande. En algunos casos, los investigadores están interesados en preguntas de investigación específicas para subgrupos de la población. Por ejemplo, los investigadores podrían estar interesados en Examinar si la capacidad cognitiva como predictor del desempeño laboral es igualmente aplicable a todos los grupos raciales., El muestreo aleatorio Simple no puede acomodar las necesidades de los investigadores en esta situación, porque no proporciona submuestras de la población, y otras estrategias de muestreo, como el muestreo estratificado, pueden usarse en su lugar.,

muestreo Sistemáticoeditar

Artículo principal: muestreo sistemático

una representación visual de la selección de una muestra aleatoria utilizando la técnica de muestreo sistemático

el muestreo sistemático (también conocido como muestreo por intervalos) se basa en organizar la población del estudio de acuerdo con algún esquema de elementos a intervalos regulares a través de esa lista ordenada. El muestreo sistemático implica un inicio aleatorio y luego procede con la selección de cada elemento kth a partir de entonces., En este caso, k = (Tamaño de la población / tamaño de la muestra). Es importante que el punto de partida no sea automáticamente el primero de la lista, sino que se elija aleatoriamente entre el primero y el elemento kth de la lista. Un ejemplo sencillo sería seleccionar cada 10º nombre del directorio telefónico (una muestra’ cada 10º’, también conocida como’muestreo con un salto de 10′).

siempre que el punto de partida sea Aleatorio, el muestreo sistemático es un tipo de muestreo probabilístico., Es fácil de implementar y la estratificación inducida puede hacerlo eficiente, si la variable por la que se ordena la lista está correlacionada con la variable de interés. El muestreo «cada 10» es especialmente útil para un muestreo eficiente de las bases de datos.

por ejemplo, supongamos que deseamos probar personas de una calle larga que comienza en un área pobre (casa No.1) y termina en un distrito caro (casa No. 1000)., Una simple selección aleatoria de direcciones de esta calle podría fácilmente terminar con demasiadas de la gama alta y muy pocas de la gama baja (o viceversa), lo que lleva a una muestra no representativa. Seleccionar (por ejemplo) cada número de la calle 10 a lo largo de la calle asegura que la muestra se distribuya uniformemente a lo largo de la calle, representando todos estos distritos. (Tenga en cuenta que si siempre comenzamos en la casa #1 y terminamos en #991, la muestra está ligeramente sesgada hacia el extremo inferior; seleccionando aleatoriamente el inicio entre #1 y #10, este sesgo se elimina.,

sin embargo, el muestreo sistemático es especialmente vulnerable a las periodicidades en la lista. Si la periodicidad está presente y el período Es un múltiplo o factor del intervalo utilizado, es especialmente probable que la muestra no sea representativa de la población total, lo que hace que el esquema sea menos preciso que el muestreo aleatorio simple.

por ejemplo, considere una calle donde las casas impares están todas en el lado norte (caro) de la carretera, y las casas pares están todas en el lado sur (barato)., Bajo el esquema de muestreo dado anteriormente, es imposible obtener una muestra representativa; o las casas muestreadas serán Todas del lado impar, caro, o todas serán del lado par, barato, a menos que el investigador tenga conocimiento previo de este sesgo y lo evite mediante el uso de un salto que asegura saltar entre los dos lados (cualquier salto impar).

otro inconveniente del muestreo sistemático es que incluso en escenarios donde es más preciso que el SRS, sus propiedades teóricas dificultan la cuantificación de esa precisión., (En los dos ejemplos de muestreo sistemático que se dan anteriormente, gran parte del error de muestreo potencial se debe a la variación entre casas vecinas, pero como este método nunca selecciona dos casas vecinas, la muestra no nos dará ninguna información sobre esa variación.)

El muestreo sistemático también se puede adaptar a un enfoque no EPS; para un ejemplo, consulte la discusión de las muestras de PPS a continuación.,

muestreo Estratificadoeditar

Artículo principal: muestreo estratificado

una representación visual de la selección de una muestra aleatoria utilizando la técnica de muestreo estratificado

Cuando la población abarca un número de categorías distintas, el marco se puede organizar «estratos separados».»Cada estrato se muestrea como una subpoblación independiente, de la cual los elementos individuales se pueden seleccionar al azar., La relación entre el tamaño de esta selección aleatoria (o muestra) y el tamaño de la población se denomina fracción de muestreo. El muestreo estratificado presenta varios beneficios potenciales.

primero, dividir la población en estratos distintos e independientes puede permitir a los investigadores sacar inferencias sobre subgrupos específicos que pueden perderse en una muestra aleatoria más generalizada.,

en segundo lugar, la utilización de un método de muestreo estratificado puede conducir a estimaciones estadísticas más eficientes (siempre que los estratos se seleccionen en función de la pertinencia para el criterio en cuestión, en lugar de la disponibilidad de las muestras). Incluso si un enfoque de muestreo estratificado no conduce a una mayor eficiencia estadística, tal táctica no resultará en menos eficiencia que el simple muestreo aleatorio, siempre que cada estrato sea proporcional al tamaño del grupo en la población.,

En tercer lugar, a veces se da el caso de que los datos están más fácilmente disponibles para los estratos individuales preexistentes dentro de una población que para la población general; en tales casos, el uso de un enfoque de muestreo estratificado puede ser más conveniente que la agregación de datos entre grupos (aunque esto puede estar potencialmente en desacuerdo con la importancia previamente señalada de utilizar estratos relevantes para el criterio).,

finalmente, dado que cada estrato se trata como una población independiente, se pueden aplicar diferentes enfoques de muestreo a diferentes estratos, lo que potencialmente permite a los investigadores utilizar el enfoque más adecuado (o más rentable) para cada subgrupo identificado dentro de la población.

hay, sin embargo, algunos inconvenientes potenciales para el uso de muestreo estratificado. En primer lugar, la identificación de estratos y la aplicación de ese enfoque pueden aumentar el costo y la complejidad de la selección de muestras, así como aumentar la complejidad de las estimaciones de población., En segundo lugar, al examinar múltiples criterios, las variables estratificadoras pueden estar relacionadas con algunos, pero no con otros, complicando aún más el diseño y reduciendo potencialmente la utilidad de los estratos. Finalmente, en algunos casos (como los diseños con un gran número de estratos, o aquellos con un tamaño mínimo de muestra especificado por grupo), el muestreo estratificado puede requerir potencialmente una muestra más grande que otros métodos (aunque en la mayoría de los casos, el tamaño de muestra requerido no sería mayor que el requerido para el muestreo aleatorio simple).,

un enfoque de muestreo estratificado es más efectivo cuando se cumplen tres condiciones

La variabilidad dentro de los estratos se minimiza
La variabilidad entre estratos se maximiza
Las variables sobre las que se estratifica la población están fuertemente correlacionadas con la variable dependiente deseada.

ventajas sobre otros métodos de muestreo

Se centra en subpoblaciones importantes e ignora las irrelevantes.
Permite el uso de diferentes técnicas de muestreo para diferentes subpoblaciones.
Mejora la precisión / eficiencia de la estimación.,
Permite un mayor equilibrio de la potencia estadística de las pruebas de diferencias entre estratos mediante el muestreo de números iguales de estratos que varían ampliamente en tamaño.

desventajas

requiere la selección de variables de estratificación relevantes que pueden ser difíciles.
no Es útil cuando no hay subgrupos homogéneos.
Puede ser costoso de implementar.

Poststratificación

la estratificación a veces se introduce después de la fase de muestreo en un proceso llamado «poststratificación»., Este enfoque se implementa típicamente debido a la falta de conocimiento previo de una variable estratificadora apropiada o cuando el experimentador carece de la información necesaria para crear una variable estratificadora durante la fase de muestreo. Aunque el método es susceptible a las trampas de los enfoques post hoc, puede proporcionar varios beneficios en la situación correcta. La implementación generalmente sigue una muestra aleatoria simple. Además de permitir la estratificación en una variable auxiliar, la poststratificación se puede utilizar para implementar la ponderación, lo que puede mejorar la precisión de las estimaciones de una muestra.,

sobremuestreo

el muestreo basado en la elección es una de las estrategias de muestreo estratificado. En el muestreo basado en la elección, los datos se estratifican en el objetivo y se toma una muestra de cada estrato para que la clase objetivo rara esté más representada en la muestra. El modelo se construye a partir de esta muestra sesgada. Los efectos de las variables de entrada en el objetivo a menudo se estiman con más precisión con la muestra basada en la elección, incluso cuando se toma un tamaño de muestra general más pequeño, en comparación con una muestra aleatoria. Los resultados generalmente deben ajustarse para corregir el sobremuestreo.,

probability-proportional-to-size samplingEdit

en algunos casos, el diseñador de la muestra tiene acceso a una «variable auxiliar» o «medida de tamaño», que se cree que está correlacionada con la variable de interés, para cada elemento de la población. Estos datos se pueden utilizar para mejorar la precisión en el diseño de la muestra. Una opción es utilizar la variable auxiliar como base para la estratificación, como se discutió anteriormente.

otra opción es el muestreo de probabilidad proporcional al tamaño (‘PPS’), en el que la probabilidad de selección para cada elemento se establece para ser proporcional a su medida de tamaño, hasta un máximo de 1., En un diseño simple de PPS, estas probabilidades de selección pueden usarse como base para el muestreo de Poisson. Sin embargo, esto tiene el inconveniente de tamaño de muestra variable, y diferentes porciones de la población todavía pueden estar sobrerrepresentadas o subrepresentadas debido a la variación aleatoria en las selecciones.

La teoría del muestreo sistemático se puede utilizar para crear una probabilidad proporcional al tamaño de la muestra. Esto se hace tratando cada recuento dentro de la variable de tamaño como una sola unidad de muestreo. Las muestras se identifican seleccionando a intervalos pares entre estos recuentos dentro de la variable de tamaño., Este método a veces se llama PPS-secuencial o muestreo de unidades monetarias en el caso de auditorías o muestreo forense.

ejemplo: supongamos que tenemos seis escuelas con poblaciones de 150, 180, 200, 220, 260, y 490 estudiantes respectivamente (total 1500 estudiantes), y queremos utilizar la población estudiantil como base para una muestra de PPS de tamaño tres. Para hacer esto, podríamos asignar los números de la primera escuela 1 a 150, la Segunda Escuela 151 A 330 (= 150 + 180), La Tercera Escuela 331 a 530, y así sucesivamente a la última escuela (1011 a 1500)., Luego generamos un inicio aleatorio entre 1 y 500 (igual a 1500/3) y contamos a través de las poblaciones escolares por múltiplos de 500. Si nuestro comienzo Aleatorio fuera 137, seleccionaríamos las escuelas a las que se les han asignado los números 137, 637 y 1137, es decir, la primera, la cuarta y la sexta escuelas.

el enfoque PPS puede mejorar la precisión para un tamaño de muestra dado concentrando la muestra en elementos grandes que tienen el mayor impacto en las estimaciones de población., El muestreo de PPS se usa comúnmente para encuestas de negocios, donde el tamaño del elemento varía mucho y la información auxiliar a menudo está disponible; por ejemplo, una encuesta que intenta medir el número de noches de huéspedes en hoteles podría usar el número de habitaciones de cada hotel como una variable auxiliar. En algunos casos, una medida más antigua de la variable de interés se puede utilizar como una variable auxiliar cuando se intenta producir estimaciones más actuales.,

Cluster samplingEdit

una representación visual de la selección de una muestra aleatoria utilizando la técnica de muestreo de clústeres

artículo principal: muestreo de clústeres

a veces es más rentable seleccionar a los encuestados en grupos (‘clústeres’). El muestreo a menudo está agrupado por geografía o por períodos de tiempo. (Casi todas las muestras están en cierto sentido’ agrupadas ‘ en el tiempo, aunque esto rara vez se tiene en cuenta en el análisis.,) Por ejemplo, si encuestamos hogares dentro de una ciudad, podríamos elegir seleccionar 100 cuadras de la ciudad y luego entrevistar a todos los hogares dentro de las cuadras seleccionadas.

La agrupación puede reducir los gastos de viaje y administrativos. En el ejemplo anterior, un entrevistador puede hacer un solo viaje para visitar varios hogares en una cuadra, en lugar de tener que conducir a una cuadra diferente para cada hogar.

también significa que no se necesita un marco de muestreo que enumere todos los elementos de la población objetivo., En su lugar, los clústeres se pueden elegir a partir de un marco a nivel de clúster, con un marco a nivel de elemento creado solo para los clústeres seleccionados. En el ejemplo anterior, la muestra solo requiere un mapa de ciudad a nivel de bloque para las selecciones iniciales, y luego un mapa a nivel de hogar de los 100 bloques seleccionados, en lugar de un mapa a nivel de hogar de toda la ciudad.

El muestreo de conglomerados (también conocido como muestreo agrupado) generalmente aumenta la variabilidad de las estimaciones de la muestra por encima de la del muestreo aleatorio simple, dependiendo de cómo los conglomerados difieren entre sí en comparación con la variación dentro del conglomerado., Por esta razón, el muestreo de clústeres requiere una muestra más grande que SRS para lograr el mismo nivel de precisión, pero el ahorro de costos de la agrupación aún podría hacer que esta sea una opción más barata.

El muestreo por conglomerados se implementa comúnmente como muestreo multietapa. Esta es una forma compleja de muestreo por conglomerados en la que dos o más niveles de unidades están incrustados uno en el otro. La primera etapa consiste en la construcción de los grupos que se utilizarán para muestrear., En la segunda etapa, se selecciona aleatoriamente una muestra de unidades primarias de cada grupo (en lugar de usar todas las unidades contenidas en todos los grupos seleccionados). En las etapas siguientes, en cada uno de esos grupos seleccionados, se seleccionan muestras adicionales de unidades, y así sucesivamente. Todas las unidades finales (individuos, por ejemplo) seleccionadas en el último paso de este procedimiento son entonces encuestadas. Esta técnica, por lo tanto, es esencialmente el proceso de tomar submuestras aleatorias de muestras aleatorias precedentes.,

el muestreo multietapa puede reducir sustancialmente los costos de muestreo, donde sería necesario elaborar la lista completa de la población (antes de que se puedan aplicar otros métodos de muestreo). Al eliminar el trabajo involucrado en la descripción de los clústeres que no se seleccionan, el muestreo multietapa puede reducir los grandes costos asociados con el muestreo de clústeres tradicional. Sin embargo, cada muestra puede no ser representativa de toda la población.,

muestreo de Cupoeditar

Artículo principal: muestreo de cupo

en el muestreo de cupo, la población se segmenta primero en subgrupos mutuamente excluyentes, al igual que en el muestreo estratificado. A continuación, el juicio se utiliza para seleccionar los sujetos o unidades de cada segmento en función de una proporción especificada. Por ejemplo, a un entrevistador se le puede pedir que tome una muestra de 200 mujeres y 300 hombres entre las edades de 45 y 60 años.

es este segundo paso el que hace que la técnica sea de muestreo no probabilístico. En el muestreo por Cuotas, la selección de la muestra no es aleatoria., Por ejemplo, los entrevistadores podrían verse tentados a entrevistar a aquellos que parecen más útiles. El problema es que estas muestras pueden estar sesgadas porque no todo el mundo tiene la oportunidad de selección. Este elemento aleatorio es su mayor debilidad y cuota versus probabilidad ha sido un asunto de controversia durante varios años.

Minimax samplingEdit

en conjuntos de datos desequilibrados, donde la relación de muestreo no sigue las estadísticas de población, se puede volver a muestrear el conjunto de datos de una manera conservadora llamada muestreo minimax., El muestreo minimax tiene su origen en la relación Minimax de Anderson cuyo valor se ha demostrado que es 0,5: en una clasificación binaria, los tamaños de clase-muestra deben elegirse por igual. Esta relación se puede demostrar que es una relación minimax solo bajo la suposición de clasificador LDA con distribuciones gaussianas. La noción de muestreo minimax se ha desarrollado recientemente para una clase general de reglas de clasificación, llamadas clasificadores inteligentes de clase., En este caso, la relación de muestreo de las clases se selecciona de modo que el error del clasificador de peor caso sobre todas las estadísticas de población posibles para las probabilidades anteriores de clase, sería el mejor.

muestreo Accidentaleditar

el muestreo Accidental (A veces conocido como muestreo por agarre, conveniencia u oportunidad) es un tipo de muestreo no probable que implica que la muestra se extrae de la parte de la población que está cerca de la mano. Es decir, se selecciona una población porque es fácilmente disponible y conveniente., Puede ser a través de la reunión de la persona o la inclusión de una persona en la muestra cuando uno se encuentra con ellos o elegido por encontrarlos a través de medios tecnológicos como internet o a través del teléfono. El investigador que utiliza una muestra de este tipo no puede hacer generalizaciones científicas sobre la población total de esta muestra porque no sería lo suficientemente representativa., Por ejemplo, si el entrevistador realizara una encuesta de este tipo en un centro comercial temprano por la mañana en un día determinado, las personas a las que podría entrevistar se limitarían a las que estuvieran allí en ese momento dado, lo que no representaría las opiniones de otros miembros de la sociedad en esa zona, si la encuesta se realizara en diferentes momentos del día y varias veces por semana. Este tipo de muestreo es más útil para las pruebas piloto., Varias consideraciones importantes para los investigadores que usan muestras de conveniencia incluyen:

¿Existen controles dentro del diseño de la investigación o experimento que puedan servir para disminuir el impacto de una muestra de conveniencia no aleatoria, asegurando así que los resultados sean más representativos de la población?
¿Hay buenas razones para creer que una muestra de conveniencia particular respondería o debería comportarse de manera diferente a una muestra aleatoria de la misma población?
¿La pregunta planteada por la investigación puede ser respondida adecuadamente usando una muestra de conveniencia?,

en la investigación en Ciencias Sociales, el muestreo de bolas de nieve es una técnica similar, donde los sujetos de estudio existentes se utilizan para reclutar más sujetos en la muestra. Algunas variantes del muestreo de bolas de nieve, como el muestreo impulsado por los encuestados, permiten el cálculo de las probabilidades de selección y son métodos de muestreo de probabilidad bajo ciertas condiciones.

muestreo Voluntarioeditar

más información: sesgo de auto-selección

el método de muestreo voluntario es un tipo de muestreo no probabilístico. Los voluntarios eligen completar una encuesta.,

Los voluntarios pueden ser invitados a través de anuncios en las redes sociales. La población objetivo de los anuncios se puede seleccionar por características como ubicación, edad, sexo, ingresos, ocupación, educación o intereses utilizando herramientas proporcionadas por el medio social. El anuncio puede incluir un mensaje sobre la investigación y un enlace a una encuesta. Después de seguir el enlace y completar la encuesta, el voluntario envía los datos para ser incluidos en la población de la muestra. Este método puede llegar a una población global, pero está limitado por el presupuesto de la campaña., Los voluntarios fuera de la población invitada también pueden ser incluidos en la muestra.

es difícil hacer generalizaciones a partir de esta muestra porque puede no representar la población total. A menudo, los voluntarios tienen un gran interés en el tema principal de la encuesta.

muestreo de intercepción de Líneaeditar

el muestreo de intercepción de línea es un método de muestreo de elementos en una región en la que un elemento se muestrea si un segmento de línea elegido, llamado «transecto», interseca el elemento.,

Panel samplingEdit

Panel sampling es el método de seleccionar primero un grupo de participantes a través de un método de muestreo aleatorio y luego pedir a ese grupo (potencialmente la misma) información varias veces durante un período de tiempo. Por lo tanto, cada participante es entrevistado en dos o más puntos de tiempo; cada período de recolección de datos se denomina «ola». El método fue desarrollado por el sociólogo Paul Lazarsfeld en 1938 como un medio para estudiar las campañas políticas., Este método de muestreo longitudinal permite estimar los cambios en la población, por ejemplo con respecto a las enfermedades crónicas, el estrés laboral y los gastos semanales de alimentos. El muestreo de Panel también se puede utilizar para informar a los investigadores sobre los cambios de salud dentro de la persona debido a la edad o para ayudar a explicar los cambios en las variables dependientes continuas, como la interacción conyugal. Se han propuesto varios métodos para analizar datos de panel, incluyendo MANOVA, curvas de crecimiento y modelado de ecuaciones estructurales con efectos retardados.,

Snowball samplingeditar

Snowball sampling implica encontrar un pequeño grupo de encuestados iniciales y usarlos para reclutar más encuestados. Es particularmente útil en los casos en que la población está oculta o es difícil de enumerar.

muestreo Teoricoeditar

esta sección necesita expansión. Usted puede ayudar añadiendo a ella. (Julio 2015)

el muestreo teórico se produce cuando las muestras se seleccionan sobre la base de los resultados de los datos recogidos hasta el momento con el objetivo de desarrollar una comprensión más profunda del área o desarrollar teorías., Se pueden seleccionar casos extremos o muy específicos para maximizar la probabilidad de que un fenómeno sea realmente observable.