Amostragem (estatísticas)

em qualquer dos tipos de quadros acima identificados, pode utilizar-se uma variedade de métodos de amostragem, individualmente ou em combinação.,f a moldura

  • a Disponibilidade de informações auxiliares sobre unidades no frame
  • requisitos de Precisão, e a necessidade de medição de precisão
  • Se a análise detalhada da amostra é esperado
  • Custo/preocupações operacionais
  • amostragem aleatória Simples Editar

    ver artigo Principal: Amostragem aleatória simples

    Uma representação visual de selecionar uma amostra aleatória simples

    Em uma amostra aleatória simples (SRS) de um determinado tamanho, todos os subconjuntos de um quadro de amostragem têm uma probabilidade igual de ser selecionado., Cada elemento do quadro tem uma probabilidade igual de seleção: o quadro não é subdividido ou particionado. Além disso, qualquer par de elementos tem a mesma chance de seleção que qualquer outro par (e similarmente para triplos, e assim por diante). Isto minimiza o viés e simplifica a análise dos resultados. Em particular, a variância entre os resultados individuais dentro da amostra é um bom indicador de variância na população global, o que torna relativamente fácil estimar a precisão dos resultados.,

    amostragem aleatória Simples pode ser vulnerável a amostragem de erro porque a aleatoriedade da seleção pode resultar em uma amostra que não reflete a composição da população. Por exemplo, uma simples amostra aleatória de dez pessoas de um determinado país produzirá, em média, cinco homens e cinco mulheres, mas um determinado julgamento é susceptível de representar um sexo em excesso e de sub-representar o outro. Técnicas sistemáticas e estratificadas tentam superar este problema “usando informações sobre a população” para escolher uma amostra mais “representativa”.,além disso, uma amostragem aleatória simples pode ser complicada e tediosa quando a amostragem é feita a partir de uma grande população-alvo. Em alguns casos, os investigadores estão interessados em questões de investigação específicas dos subgrupos da população. Por exemplo, os investigadores podem estar interessados em examinar se a capacidade cognitiva como um predictor do desempenho do trabalho é igualmente aplicável em todos os grupos raciais., Amostragem aleatória simples não pode acomodar as necessidades dos pesquisadores nesta situação, porque não fornece subamostras da população, e outras estratégias de amostragem, tais como amostragem estratificada, podem ser usados em vez disso.,

    Sistemático samplingEdit

    ver artigo Principal: amostragem Sistemática

    Uma representação visual de seleção de uma amostra aleatória usando a técnica de amostragem sistemática

    a amostragem Sistemática (também conhecido como intervalo de amostragem) baseia-se em organizar a população de estudo de acordo com algum esquema de encomenda e, em seguida, selecionando elementos em intervalos regulares, através de lista ordenada. A amostragem sistemática envolve um início Aleatório e, em seguida, prossegue com a seleção de cada elemento kth a partir daí., Neste caso, k=(tamanho da população/tamanho da amostra). É importante que o ponto de partida não seja automaticamente o primeiro da lista, mas é escolhido aleatoriamente de dentro do primeiro para o elemento kth na lista. Um exemplo simples seria seleccionar cada 10 nomes da lista telefónica (uma amostra “cada 10”, Também referida como “amostragem com um salto de 10”).enquanto o ponto de partida for Aleatório, a amostragem sistemática é um tipo de amostragem de probabilidade., É fácil de implementar e a estratificação induzida pode torná-lo eficiente, se a variável pela qual a lista é ordenada está correlacionada com a variável de interesse. A amostragem “a cada 10” é especialmente útil para uma amostragem eficiente a partir de bases de dados.por exemplo, suponha que desejamos experimentar pessoas de uma rua longa que começa em uma área pobre (casa No. 1) e termina em um distrito caro (casa No. 1000)., Uma simples seleção aleatória de endereços desta rua poderia facilmente acabar com muitos da extremidade alta e muito poucos da extremidade baixa (ou vice-versa), levando a uma amostra não representativa. A seleção (por exemplo) de cada número de rua 10 ao longo da rua garante que a amostra é distribuída uniformemente ao longo do comprimento da rua, representando todos esses distritos. (Note que se nós sempre começarmos na casa # 1 e terminarmos em # 991, a amostra é ligeiramente tendenciosa para a extremidade baixa; ao selecionar aleatoriamente o início entre #1 e #10, este viés é eliminado.,no entanto, a amostragem sistemática é especialmente vulnerável a periodicidade da lista. Se a periodicidade estiver presente e o período for múltiplo ou factor do intervalo utilizado, é especialmente provável que a amostra não seja representativa da população em geral, tornando o regime menos preciso do que uma amostragem aleatória simples.por exemplo, considere uma rua onde as casas ímpares estão todas no lado norte (caro) da estrada, e as casas pares estão todas no lado sul (barato)., Sob o esquema de amostragem dada acima, é impossível obter uma amostra representativa; ou as casas amostrados serão todos do ímpares, caro, ou eles vão ser todos do mesmo numeradas, barato lado, a menos que o pesquisador tenha conhecimento prévio deste preconceito e evita-lo por um usando uma ignorar o que garante a saltar entre os dois lados (qualquer um com número ímpar de inibição).outra desvantagem da amostragem sistemática é que, mesmo em cenários em que é mais precisa do que a SRS, as suas propriedades teóricas dificultam a quantificação dessa precisão., (Nos dois exemplos de amostragem sistemática que são apresentados acima, grande parte do erro de amostragem potencial é devido à variação entre casas vizinhas – mas como este método nunca seleciona duas casas vizinhas, a amostra não nos dará nenhuma informação sobre essa variação.)

    a amostragem sistemática também pode ser adaptada a uma abordagem não-EPS; por exemplo, veja a discussão de amostras de PPS abaixo.,

    Estratificada samplingEdit

    ver artigo Principal: amostragem Estratificada

    Uma representação visual de seleção de uma amostra aleatória usando a técnica de amostragem estratificada

    Quando a população abraça um número de categorias distintas, a moldura pode ser organizado por estas categorias em separado “estratos.”Cada estrato é então amostrado como uma subpopulação independente, da qual elementos individuais podem ser selecionados aleatoriamente., A relação entre o tamanho desta seleção aleatória (ou amostra) e o tamanho da população é chamada de fração de amostragem. Existem vários benefícios potenciais para a amostragem estratificada.

    primeiramente, dividindo a população em estratos distintos e independentes pode permitir aos pesquisadores extrair inferências sobre subgrupos específicos que podem ser perdidos em uma amostra aleatória mais generalizada.,em segundo lugar, a utilização de um método de amostragem estratificado pode conduzir a estimativas estatísticas mais eficientes (desde que os estratos sejam seleccionados com base na relevância para o critério em questão, em vez da disponibilidade das amostras). Mesmo que uma abordagem estratificada de amostragem não conduza a uma maior eficiência estatística, tal táctica não resultará em menos eficiência do que a simples amostragem aleatória, desde que cada estrato seja proporcional ao tamanho do grupo na população.,em terceiro lugar, é por vezes o caso de os dados estarem mais facilmente disponíveis para estratos individuais pré-existentes dentro de uma população do que para a população total; nesses casos, a utilização de uma abordagem de amostragem estratificada pode ser mais conveniente do que a agregação de dados entre grupos (embora isto possa potencialmente estar em desacordo com a importância anteriormente observada da utilização de estratos relevantes para critérios).,por último, uma vez que cada estrato é tratado como uma população independente, podem ser aplicadas diferentes abordagens de amostragem a diferentes estratos, permitindo potencialmente aos investigadores utilizar a abordagem mais adequada (ou mais rentável) para cada subgrupo identificado dentro da população.existem, no entanto, alguns potenciais inconvenientes na utilização de amostragem estratificada. Em primeiro lugar, identificar estratos e implementar tal abordagem pode aumentar o custo e a complexidade da selecção de amostras, bem como levar a uma maior complexidade das estimativas da população., Em segundo lugar, ao examinar vários critérios, variáveis estratificadas podem estar relacionadas a alguns, mas não a outros, complicando ainda mais o projeto, e potencialmente reduzindo a utilidade dos estratos. Por último, em alguns casos (como desenhos com um grande número de estratos, ou com um tamanho mínimo de amostra especificado por grupo), a amostragem estratificada pode requerer uma amostra maior do que outros métodos (embora, na maioria dos casos, o tamanho da amostra exigida não seja superior ao exigido para uma amostragem aleatória simples).,

    Uma amostragem estratificada abordagem é mais eficaz quando três condições são satisfeitas

    1. a Variabilidade dentro dos estratos são minimizados
    2. a Variabilidade entre os estratos são maximizadas
    3. As variáveis sobre as quais a população está estratificada estão fortemente correlacionados com o desejado variável dependente.

    vantagens sobre outros métodos de amostragem

    1. centra-se em subpopulações importantes e ignora as irrelevantes.
    2. Permite o uso de diferentes técnicas de amostragem para diferentes subpopulações.
    3. melhora a precisão/eficiência da estimativa.,permite um maior equilíbrio do poder estatístico dos testes de diferenças entre estratos por amostragem, números iguais dos estratos que variam muito em tamanho.desvantagens

    desvantagens

    1. requer a seleção de variáveis de estratificação relevantes que podem ser difíceis.
    2. não é útil quando não existem subgrupos homogéneos.
    3. Pode ser caro de implementar.a estratificação é por vezes introduzida após a fase de amostragem num processo chamado “pós-estratificação”., Esta abordagem é tipicamente implementada devido à falta de conhecimento prévio de uma variável estratificada apropriada ou quando o experimentador não tem a informação necessária para criar uma variável estratificada durante a fase de amostragem. Embora o método seja suscetível às armadilhas das abordagens post hoc, pode proporcionar vários benefícios na situação correta. A implementação geralmente segue uma amostra aleatória simples. Para além de permitir a estratificação numa variável auxiliar, a pós-estratificação pode ser utilizada para aplicar a ponderação, o que pode melhorar a precisão das estimativas de uma amostra.,a amostragem baseada na escolha é uma das estratégias de amostragem estratificada. Na amostragem baseada na escolha, os dados são estratificados sobre o alvo e é retirada uma amostra de cada estrato, de modo que a classe-alvo rara seja mais representada na amostra. O modelo é então construído sobre esta amostra tendenciosa. Os efeitos das variáveis de entrada sobre o alvo são muitas vezes estimados com mais precisão com a amostra baseada na escolha, mesmo quando uma amostra global menor é tomada, em comparação com uma amostra aleatória. Os resultados geralmente devem ser ajustados para corrigir a sobreamostragem.,

      Probabilidade proporcional ao tamanho samplingEdit

      Em alguns casos, a amostra designer tem acesso a uma “variável auxiliar” ou “tamanho medir”, que se acredita ser correlacionada com a variável de interesse, para cada elemento da população. Estes dados podem ser utilizados para melhorar a precisão no desenho da amostra. Uma opção é usar a variável auxiliar como base para a estratificação, como discutido acima.

      outra opção é a probabilidade proporcional à amostragem de tamanho (“PPS”), na qual a probabilidade de seleção para cada elemento é definida como sendo proporcional à sua medida de tamanho, até um máximo de 1., Em um simples projeto PPS, essas probabilidades de seleção podem então ser usadas como base para a amostragem de Poisson. No entanto, isso tem a desvantagem de tamanho de amostra variável, e diferentes porções da população ainda pode ser super ou sub – representado devido à variação de chance nas seleções.a teoria da amostragem sistemática pode ser usada para criar uma probabilidade proporcional ao tamanho da amostra. Isto é feito tratando cada contagem dentro da variável de tamanho como uma única unidade de amostragem. As amostras são então identificadas selecionando em intervalos pares entre essas contagens dentro da variável de tamanho., Este método é por vezes chamado PPS-amostragem sequencial ou por unidade monetária no caso de auditorias ou amostragem forense.

      Exemplo: Suponha que temos seis escolas com população 150, 180, 200, 220, 260, e 490 alunos, respectivamente (total de 1500 alunos), e queremos usar população estudantil como a base para um PPS amostra de tamanho três. Para isso, poderíamos alocar os números da primeira escola 1 a 150, a Segunda Escola 151 a 330 (= 150 + 180), a terceira escola 331 A 530, e assim por diante para a última escola (1011 a 1500)., Em seguida, geramos um início aleatório entre 1 e 500 (igual a 1500/3) e contamos através das populações escolares em múltiplos de 500. Se o nosso início aleatório fosse 137, escolheríamos as escolas que foram atribuídas números 137, 637 e 1137, isto é, a primeira, a quarta e a sexta escolas.

      a abordagem PPS pode melhorar a precisão para uma dada dimensão da amostra, concentrando a amostra em grandes elementos que têm o maior impacto nas estimativas da população., A amostragem PPS é comumente utilizada para pesquisas de empresas, onde o tamanho do elemento varia muito e informações auxiliares é muitas vezes disponível – por exemplo, uma pesquisa que tenta medir o número de noites de hóspedes gastas em hotéis pode usar o número de quartos de cada hotel como uma variável auxiliar. Em alguns casos, uma medida mais antiga da variável de interesse pode ser usada como uma variável auxiliar ao tentar produzir estimativas mais atuais.,

      Cluster samplingEdit

      Uma representação visual de seleção de uma amostra aleatória usando o cluster técnica de amostragem

      ver artigo Principal: Cluster de amostragem

      por Vezes, é mais custo-eficaz para selecionar os entrevistados em grupos (‘clusters’). A amostragem é muitas vezes agrupada pela geografia, ou por períodos de tempo. (Quase todas as amostras são, em certo sentido, “agrupadas” no tempo – embora isso raramente seja tido em conta na análise.,) Por exemplo, se examinarmos as famílias dentro de uma cidade, podemos optar por selecionar 100 blocos da cidade e, em seguida, entrevistar todas as famílias dentro dos blocos selecionados.o agrupamento pode reduzir os custos de viagem e administrativos. No exemplo acima, um entrevistador pode fazer uma única viagem para visitar várias famílias em um bloco, em vez de ter que dirigir para um bloco diferente para cada família.significa também que não é necessário um quadro de amostragem que enumere TODOS os elementos da população-alvo., Em vez disso, clusters podem ser escolhidos a partir de um quadro de nível de cluster, com um frame de nível de elemento criado apenas para os clusters selecionados. No exemplo acima, a amostra requer apenas um mapa de cidade de nível de bloco para seleções iniciais, e em seguida, um mapa de nível doméstico dos 100 blocos selecionados, em vez de um mapa de nível doméstico de toda a cidade.

      amostragem por aglomerado (também conhecida como amostragem agrupada) aumenta geralmente a variabilidade das estimativas da amostra acima da amostragem aleatória simples, dependendo de como os aglomerados diferem entre si em comparação com a variação dentro do aglomerado., Por esta razão, a amostragem por aglomerado requer uma amostra maior do que a SRS para alcançar o mesmo nível de precisão – mas a redução de custos com a agregação pode ainda tornar esta opção mais barata.

      luster sampling is commonly implemented as multi stage sampling. Trata-se de uma forma complexa de amostragem de aglomerados em que dois ou mais níveis de unidades estão incorporados um no outro. A primeira etapa consiste em construir os clusters que serão usados para a amostra., Na segunda fase, uma amostra de unidades primárias é aleatoriamente selecionada de cada aglomerado (em vez de usar todas as unidades contidas em todos os aglomerados selecionados). Nas fases seguintes, em cada um desses aglomerados selecionados, são selecionadas amostras adicionais de unidades, e assim por diante. Todas as unidades finais (indivíduos, por exemplo) selecionadas na última etapa deste procedimento são então pesquisadas. Esta técnica, portanto, é essencialmente o processo de recolha de subamostras aleatórias de amostras aleatórias anteriores.,a amostragem em várias fases pode reduzir substancialmente os custos da amostragem, em que a lista completa da população teria de ser construída (antes de poderem ser aplicados outros métodos de amostragem). Ao eliminar o trabalho envolvido na descrição de clusters que não são selecionados, a amostragem em várias fases pode reduzir os grandes custos associados à amostragem tradicional de clusters. No entanto, cada amostra pode não ser totalmente representativa de toda a população.,artigo principal: amostragem das quotas

      na amostragem das quotas, a população é primeiramente segmentada em subgrupos mutuamente exclusivos, tal como na amostragem estratificada. Então o julgamento é usado para selecionar os sujeitos ou unidades de cada segmento com base em uma proporção especificada. Por exemplo, um entrevistador pode ser aconselhado a amostrar 200 mulheres e 300 homens entre os 45 e os 60 anos de idade.

      é este segundo passo que faz da técnica uma amostragem não-probabilidade. Na amostragem das quotas, a selecção da amostra não é aleatória., Por exemplo, os entrevistadores podem ser tentados a entrevistar aqueles que parecem mais úteis. O problema é que estas amostras podem ser tendenciosas porque nem todos têm uma chance de seleção. Este elemento aleatório é a sua maior fraqueza e quota versus probabilidade tem sido uma questão de controvérsia por vários anos.

      minimax samplingEdit

      em conjuntos de dados desequilibrados, em que o rácio de amostragem não segue as Estatísticas da população, pode-se voltar a amostrar o conjunto de dados de uma forma conservadora chamada amostragem minimax., A amostragem minimax tem sua origem na razão Anderson minimax, cujo valor é provado ser 0,5: em uma classificação binária, o tamanho da classe-amostra deve ser escolhido igualmente. Esta razão pode ser provada como a razão minimax apenas sob a suposição de classificador LDA com distribuições Gaussianas. A noção de amostragem minimax é recentemente desenvolvida para uma classe geral de regras de classificação, chamado classificadores inteligentes de classe., Neste caso, a razão de amostragem das classes é selecionada de modo que o erro de classificação do pior caso em todas as estatísticas de população possíveis para as probabilidades prévias de classe, seria o melhor.

      amostragem acidental edit

      amostragem acidental (por vezes conhecida como recolha de amostras por conveniência ou oportunidade) é um tipo de amostragem não susceptível de ser testada que envolve a recolha de amostras a partir da parte da população que está próxima da mão. Ou seja, uma população é selecionada porque é prontamente disponível e conveniente., Pode ser através do encontro com a pessoa ou da inclusão de uma pessoa na amostra quando a pessoa se encontra com eles ou escolhido por encontrá-los através de meios tecnológicos, como a internet ou através de telefone. O pesquisador que usa tal amostra não pode cientificamente fazer generalizações sobre a população total desta amostra porque ela não seria representativa o suficiente., Por exemplo, se o entrevistador fosse realizar uma pesquisa em um shopping center de manhã cedo em um determinado dia, o povo que ele/ela poderia entrevistar seria limitado àqueles que dada naquele momento, que não representam os pontos de vista de outros membros da sociedade em tal área, se a pesquisa fosse realizada em diferentes momentos do dia e várias vezes por semana. Este tipo de amostragem é mais útil para o teste do piloto., Várias considerações importantes para os investigadores que utilizam amostras de conveniência incluem:

      1. existem controlos no âmbito do projecto de investigação ou da experiência que possam servir para diminuir o impacto de uma amostra de conveniência Não aleatória, garantindo assim que os resultados serão mais representativos da população?existe uma boa razão para acreditar que uma amostra de conveniência específica responderia ou deveria comportar-se de forma diferente de uma amostra aleatória da mesma população?
      2. É a pergunta que está sendo feita pela pesquisa que pode ser respondida adequadamente usando uma amostra de conveniência?,

      na investigação em Ciências Sociais, a amostragem de bolas de neve é uma técnica semelhante, onde indivíduos de estudo existentes são utilizados para recrutar mais indivíduos para a amostra. Algumas variantes da amostragem de bolas de neve, como a amostragem conduzida pelo respondente, permitem o cálculo das probabilidades de selecção e são métodos de amostragem de probabilidades em determinadas condições.

      amostragem voluntária Edit

      informação adicional: viés de auto-selecção

      o método de amostragem voluntária é um tipo de amostragem não-provável. Os voluntários escolhem completar uma pesquisa.,voluntários podem ser convidados através de anúncios nas redes sociais. A população-alvo para anúncios pode ser selecionada por características como Localização, Idade, Sexo, Renda, Ocupação, Educação ou interesses usando ferramentas fornecidas pelo meio social. O anúncio pode incluir uma mensagem sobre a pesquisa e link para uma pesquisa. Depois de seguir o link e completar a pesquisa, o voluntário apresenta os dados a serem incluídos na população da amostra. Este método pode atingir uma população global, mas é limitado pelo orçamento da campanha., Podem também ser incluídos na amostra voluntários fora da população convidada.

      é difícil generalizar a partir desta amostra porque ela pode não representar a população total. Muitas vezes, os voluntários têm um forte interesse no tema principal da pesquisa.

      a amostragem de intercepção de linha

      a amostragem de intercepção de linha é um método de amostragem de elementos numa região em que um elemento é amostrado se um segmento de linha escolhido, chamado “transect”, intersecta o elemento.,

      Painel samplingEdit

      painel amostragem é o método de primeiro selecionar um grupo de participantes através de um método de amostragem aleatória e, em seguida, pedir a esse grupo (potencialmente o mesmo) informação várias vezes ao longo de um período de tempo. Portanto, cada participante é entrevistado em dois ou mais pontos de tempo; cada período de coleta de dados é chamado de “onda”. O método foi desenvolvido pelo sociólogo Paul Lazarsfeld em 1938 como um meio de estudar campanhas políticas., Este método de amostragem longitudinal permite estimar as mudanças na população, por exemplo, no que se refere às doenças crónicas, para o stress no trabalho e para as despesas alimentares semanais. A amostragem de painéis também pode ser usada para informar os pesquisadores sobre mudanças de saúde dentro da pessoa devido à idade ou para ajudar a explicar mudanças em variáveis dependentes contínuas, tais como a interação conjugal. Tem havido vários métodos propostos de análise de dados do painel, incluindo MANOVA, curvas de crescimento e modelagem de equações estruturais com efeitos desfasados.,a amostragem de bolas de neve envolve encontrar um pequeno grupo de respondentes iniciais e usá-los para recrutar mais respondentes. É particularmente útil nos casos em que a população é oculta ou difícil de enumerar.

      samplingEdit teórico

      esta secção necessita de expansão. Você pode ajudar adicionando a ele. (Julho de 2015)

      amostragem teórica ocorre quando as amostras são selecionadas com base nos resultados dos dados coletados até agora com o objetivo de desenvolver uma compreensão mais profunda da área ou desenvolver teorias., Casos extremos ou muito específicos podem ser selecionados a fim de maximizar a probabilidade de um fenômeno será realmente observável.

    Share

    Deixe uma resposta

    O seu endereço de email não será publicado. Campos obrigatórios marcados com *