a fent meghatározott keretek bármelyikén belül különféle mintavételi módszerek alkalmazhatók, egyénileg vagy kombinációban.,f a keret
Egyszerű véletlen mintavétel Edit
vizuális ábrázolása kiválasztása az egyszerű véletlen minta
egyszerű véletlen minta (SRS) egy adott méretű, minden csoportjára, a mintavételi keret egyenlő a valószínűsége, hogy a kiválasztott., A keret minden elemének tehát egyenlő a kiválasztási valószínűsége: a keret nincs felosztva vagy felosztva. Ezenkívül minden adott elempárnak ugyanolyan esélye van a kiválasztásra, mint bármely más ilyen párnak (hasonlóan a háromszorosokhoz stb.). Ez minimalizálja az elfogultságot és egyszerűsíti az eredmények elemzését. Különösen a mintán belüli egyedi eredmények közötti variancia jó mutatója a varianciának a teljes populációban, ami viszonylag egyszerűvé teszi az eredmények pontosságának becslését.,
az egyszerű véletlenszerű mintavétel érzékeny lehet a mintavételi hibára, mivel a kiválasztás véletlenszerűsége olyan mintát eredményezhet, amely nem tükrözi a populáció összetételét. Például egy adott országból származó tíz emberből álló egyszerű véletlenszerű minta átlagosan öt férfit és öt nőt fog előállítani, de egy adott vizsgálat valószínűleg felülreprezentálja az egyik nemet, és alulreprezentálja a másikat. A szisztematikus és rétegzett technikák a “lakossággal kapcsolatos információk felhasználásával” próbálják megoldani ezt a problémát, hogy “reprezentatívabb” mintát válasszanak.,
továbbá az egyszerű véletlenszerű mintavétel nehézkes és unalmas lehet egy nagy célpopulációból történő mintavételkor. Bizonyos esetekben a nyomozók érdeklődnek a lakosság alcsoportjaira vonatkozó kutatási kérdések iránt. Például a kutatók érdekelhetik annak vizsgálatát, hogy a kognitív képesség, mint a munka teljesítményének előrejelzője, egyformán alkalmazható-e a faji csoportok között., Az egyszerű véletlenszerű mintavétel nem tudja kielégíteni a kutatók igényeit ebben a helyzetben, mert nem biztosítja a lakosság alcsoportjait, ehelyett más mintavételi stratégiák, például rétegzett mintavétel használható.,
Szisztematikus samplingEdit
vizuális ábrázolása kiválasztása véletlenszerű minta segítségével a szisztematikus mintavételi technika
Szisztematikus mintavétel (más néven intervallum mintavétel) támaszkodik intézi a vizsgálati populáció egyesek szerint a rendelési rendszer, majd kiválasztja az elemeket rendszeres időközönként át, hogy a rendezett lista. A szisztematikus mintavétel véletlenszerű indítást foglal magában, majd ezután minden kth elem kiválasztásával folytatódik., Ebben az esetben k=(populáció mérete / minta mérete). Fontos, hogy a kiindulási pont nem automatikusan az első a listán, hanem véletlenszerűen kiválasztott belül az első, hogy a kth elem a listában. Egyszerű példa lenne minden 10. név kiválasztása a telefonkönyvből (egy “minden 10.” minta, amelyet “mintavétel 10-es ugrással” is neveznek).
mindaddig, amíg a kiindulási pontot randomizálják, a szisztematikus mintavétel a valószínűségi mintavétel egyik típusa., Könnyen megvalósítható, az indukált rétegződés pedig hatékonyabbá teheti, ha a változó, amellyel a listát megrendelik, korrelál az érdeklődésre számot tartó változóval. “Minden 10.” mintavétel különösen hasznos a hatékony mintavétel adatbázisokból.
például tegyük fel, hogy egy hosszú utcából szeretnénk kipróbálni az embereket, amelyek egy szegény területen (1. ház) kezdődnek, és egy drága kerületben (1000 házszám) érnek véget., Egy egyszerű véletlen kiválasztása címek ebből az utcáról könnyen a végén túl sok a high end és túl kevés a low end (vagy fordítva), ami egy reprezentatív minta. Minden 10. utcai szám kiválasztása (pl.) biztosítja, hogy a minta egyenletesen oszlik el az utca hosszában, az összes kerületet képviselve. (Megjegyzendő, hogy ha az elején mindig a házban #1-kor ér véget #991, a mintát kicsit elfogult alacsony vége; által véletlenszerűen kiválasztja a start közötti #1, #10, ez a torzítás megszűnt.,
a szisztematikus mintavétel azonban különösen érzékeny a listán szereplő időszakokra. Ha periodicitás van jelen, és az időszak az alkalmazott intervallum többszöröse vagy tényezője, a minta különösen valószínű, hogy nem reprezentálja a teljes populációt, így a rendszer kevésbé pontos, mint az egyszerű véletlenszerű mintavétel.
például Vegyünk egy utcát, ahol a páratlan számozott házak mind az út északi (drága) oldalán vannak, a páros számozott házak pedig mind a déli (olcsó) oldalon vannak., A fent megadott mintavételi séma szerint lehetetlen reprezentatív mintát kapni; vagy a mintában szereplő házak mind páratlan számozott, drága oldalról származnak, vagy mindegyik páros számozott, olcsó oldalról származik, kivéve, ha a kutató korábban ismeri ezt az elfogultságot, és elkerüli azt egy ugrással, amely biztosítja a két oldal közötti ugrást (bármilyen páratlan számozott ugrás).
a szisztematikus mintavétel másik hátránya, hogy még azokban a forgatókönyvekben is, ahol pontosabb, mint az SRS, elméleti tulajdonságai megnehezítik e pontosság számszerűsítését., (A két példa a szisztematikus mintavétel, hogy a fenti, a lehetséges mintavételi hiba miatt variáció között, a szomszédos házak – hanem azért, mert ez a módszer soha nem választja két szomszédos házak, a minta nem ad semmilyen információt a variáció.)
a szisztematikus mintavétel adaptálható egy nem EPS megközelítéshez is; például lásd az alábbi PPS-minták megvitatását.,
rétegzett mintákszerkesztés
véletlenszerű minta kiválasztásának vizuális ábrázolása a rétegzett mintavételi technika segítségével
amikor a lakosság számos különálló kategóriát ölel fel, a keret lehet szervezni ezeket a kategóriákat Külön “rétegek.”Ezután minden egyes réteget önálló alpopulációként mintavételeznek, amelyből az egyes elemek véletlenszerűen kiválaszthatók., A véletlenszerű kiválasztás (vagy minta) méretének a populáció méretéhez viszonyított arányát mintavételi frakciónak nevezzük. A rétegzett mintavételnek számos lehetséges előnye van.
Első, elosztjuk a lakosság a különálló, független rétegek lehetővé teszi a kutatók számára, hogy dolgozzon következtetések az egyes alcsoportok lehet, hogy elveszett egy általánosabb véletlen minta.,
másodszor, a rétegzett mintavételi módszer alkalmazása hatékonyabb statisztikai becslésekhez vezethet (feltéve, hogy a rétegeket a kérdéses kritérium relevanciája alapján választják ki, a minták rendelkezésre állása helyett). Még akkor is, ha a rétegzett mintavételi megközelítés nem vezet a statisztikai hatékonyság növeléséhez, egy ilyen taktika nem eredményez kevesebb hatékonyságot, mint az egyszerű véletlenszerű mintavétel, feltéve, hogy minden réteg arányos a csoport méretével a populációban.,
harmadszor, néha előfordul, hogy az adatok könnyebben elérhetők az egyes, már létező rétegek számára egy populáción belül, mint a teljes népesség esetében; ilyen esetekben a rétegzett mintavételi megközelítés alkalmazása sokkal kényelmesebb lehet, mint az adatok csoportokon belüli összesítése (bár ez potenciálisan ellentétes lehet a kritérium szempontjából releváns rétegek felhasználásának korábban megfigyelt fontosságával).,
végül, mivel minden egyes réteget önálló populációként kezelnek, különböző mintavételi megközelítések alkalmazhatók a különböző rétegekre, amelyek potenciálisan lehetővé teszik a kutatók számára, hogy a populáción belül minden egyes azonosított alcsoportra a legmegfelelőbb (vagy leginkább költséghatékony) megközelítést alkalmazzák.
vannak azonban néhány lehetséges hátránya, hogy a rétegzett mintavétel. Először is, a rétegek azonosítása és egy ilyen megközelítés végrehajtása növelheti a mintaválasztás költségeit és összetettségét, valamint a populációs becslések összetettségének növekedését eredményezheti., Másodszor, ha több kritériumot vizsgálunk, a stratifikáló változók egyesekhez kapcsolódhatnak, de nem másokhoz, tovább bonyolítva a tervezést, és potenciálisan csökkenthetik a rétegek hasznosságát. Végül, bizonyos esetekben(például nagyszámú réteggel rendelkező minták vagy csoportonként meghatározott minimális mintamérettel rendelkező minták) a rétegzett mintavétel potenciálisan nagyobb mintát igényelhet, mint más módszerek (bár a legtöbb esetben a szükséges mintaméret nem lenne nagyobb, mint az egyszerű véletlenszerű mintavételhez szükséges)., Egy rétegzett mintavételi módszer a leghatékonyabb, ha a három feltétel teljesül
- Variabilitás belül rétegek minimálisra
- rétegek közötti eltérések maximális
- A változók, amelyek alapján a lakosság rétegzett erősen korrelál a kívánt függő változó.
előnyei más mintavételi módszerekkel szemben
- a fontos alcsoportokra összpontosít, és figyelmen kívül hagyja az irrelevánsokat.
- lehetővé teszi a különböző mintavételi technikák használatát a különböző alcsoportokhoz.
- javítja a becslés pontosságát / hatékonyságát.,
- lehetővé teszi a rétegek közötti különbségek vizsgálatának statisztikai erejének nagyobb kiegyensúlyozását azáltal, hogy egyenlő számú mintát vesz a különböző méretű rétegekből.
hátrányok
- megköveteli a releváns rétegződési változók kiválasztását, amelyek nehézkesek lehetnek.
- nem hasznos, ha nincsenek homogén alcsoportok.
- lehet drága végrehajtani.
Poststratification
a rétegződést néha a mintavételi fázis után vezetik be egy “poststratification”nevű folyamatban., Ezt a megközelítést általában a megfelelő rétegező változó előzetes ismeretének hiánya miatt hajtják végre, vagy amikor a kísérletezőnek nincs elegendő információja a rétegző változó létrehozásához a mintavételi szakaszban. Bár a módszer hajlamos a post hoc megközelítések buktatóira, számos előnnyel járhat a megfelelő helyzetben. A végrehajtás általában egy egyszerű véletlenszerű mintát követ. Amellett, hogy lehetővé teszi a rétegződést egy kiegészítő változón, a posztstratifikáció felhasználható a súlyozás végrehajtására, ami javíthatja a minta becsléseinek pontosságát.,
Oversampling
a választás alapú mintavétel az egyik rétegzett mintavételi stratégia. A választás-alapú mintavétel során az adatokat rétegezzük a célpontra, és minden rétegből mintát veszünk, hogy a ritka célosztály jobban megjelenjen a mintában. A modell ezután erre az elfogult mintára épül. A bemeneti változóknak a célpontra gyakorolt hatását gyakran nagyobb pontossággal becsülik meg a választási alapú mintával, még akkor is, ha kisebb teljes mintaméretet veszünk, összehasonlítva egy véletlenszerű mintával. Az eredményeket általában úgy kell beállítani, hogy korrigálják a túlmintavételezést.,
valószínűség-arányos – méret samplingEdit
egyes esetekben a minta tervezője hozzáférhet egy” kiegészítő változóhoz “vagy” méretméréshez”, amelyről úgy gondolják, hogy korrelál az érdeklődésre számot tartó változóval, a populáció minden eleméhez. Ezek az adatok felhasználhatók a minta tervezésének pontosságának javítására. Az egyik lehetőség a kiegészítő változó használata a rétegződés alapjaként, amint azt fentebb tárgyaltuk.
egy másik lehetőség a méretmérettel arányos valószínűség (“PPS”) mintavétel, amelyben az egyes elemek kiválasztási valószínűsége arányos a méretmérettel, legfeljebb 1-ig., Egy egyszerű PPS tervezés, ezek a kiválasztási valószínűségek ezután lehet használni, mint az alapja Poisson mintavétel. Ennek azonban hátránya a változó mintaméret, és a populáció különböző részei továbbra is túl – vagy alulreprezentáltak lehetnek a választások véletlen változása miatt.
a szisztematikus mintavételi elmélet felhasználható a méretmintával arányos valószínűség létrehozására. Ez úgy történik, hogy minden egyes számot a méretváltozón belül egyetlen mintavételi egységként kezelünk. A mintákat ezután úgy azonosítják, hogy egyenletes időközönként kiválasztják a méretváltozón belüli számításokat., Ezt a módszert néha PPS-szekvenciális vagy monetáris egység mintavételnek nevezik auditok vagy kriminalisztikai mintavétel esetén.
példa: Tegyük fel, hogy hat iskolánk van 150, 180, 200, 220, 260, és 490 diákot (összesen 1500 diákot), és a hallgatói létszámot szeretnénk alapul venni egy hármas méretű PPS mintához. Ehhez az első iskolai számokat 1-150-re, a második iskolát 151-330-ra (= 150 + 180), a harmadik iskolát 331-530-ra, stb., Ezután véletlenszerű indítást generálunk 1 és 500 között (egyenlő 1500/3-mal), és 500-as többszörösével számoljuk az iskolapopulációkat. Ha a véletlen kezdet 137 lenne, kiválasztanánk azokat az iskolákat, amelyek a 137, 637 és 1137 számokat kapták, azaz az első, a negyedik és a hatodik iskolát.
a PPS megközelítés javíthatja egy adott mintaméret pontosságát azáltal, hogy a mintát olyan nagy elemekre koncentrálja, amelyek a legnagyobb hatással vannak a populációs becslésekre., PPS mintavétel általánosan használt felmérések a vállalkozások, ahol elem mérete nagyban változik kiegészítő információk gyakran áll rendelkezésre – például egy felmérés próbál intézkedés száma vendég-éjszakák szálloda lehet használni az egyes hotel szobák száma mint egy kiegészítő változó. Bizonyos esetekben a kamatváltozó régebbi mérése segédváltozóként használható, amikor több aktuális becslést próbál előállítani.,
Cluster samplingEdit
a véletlenszerű minta kiválasztásának vizuális ábrázolása a klaszter mintavételi technikával
néha költséghatékonyabb a válaszadók kiválasztása csoportokban (“klaszterek”). A mintavételt gyakran földrajzi, vagy időszakonként csoportosítják. (Szinte az összes mintát bizonyos értelemben időben “csoportosítják” – bár ezt az elemzés ritkán veszi figyelembe.,) Például, ha egy városon belül felmérjük a háztartásokat, választhatunk 100 városi blokkot, majd interjút készíthetünk minden háztartásról a kiválasztott blokkokon belül.
a klaszterezés csökkentheti az utazási és adminisztratív költségeket. A fenti példában, egy interjúkészítő egyetlen utazást tehet, hogy egy blokkban több háztartást látogasson el, ahelyett, hogy minden háztartáshoz más blokkba kellene vezetnie.
Ez azt is jelenti, hogy nincs szükség mintavételi keretre, amely felsorolja a célpopuláció összes elemét., Ehelyett klaszterek lehet választani egy klaszter szintű keret, egy elem szintű keret létre csak a kiválasztott klaszterek. A fenti példában a minta csak blokk szintű várostérképet igényel a kezdeti kiválasztásokhoz, majd a 100 kiválasztott blokk háztartási szintű térképét, nem pedig az egész város háztartási szintű térképét.
klaszter mintavétel (más néven fürtözött mintavétel) általában növeli a minta becsléseinek változékonyságát az egyszerű véletlenszerű mintavételnél, attól függően, hogy a klaszterek hogyan különböznek egymástól a klasztereken belüli változásokhoz képest., Ezért a klaszter mintavételéhez nagyobb mintára van szükség, mint az SRS, hogy ugyanazt a pontossági szintet érjék el – de a klaszterezés költségmegtakarítása még mindig olcsóbbá teheti ezt a lehetőséget.
A klaszter mintavételt általában többlépcsős mintavételként hajtják végre. Ez a klaszter mintavétel összetett formája, amelyben két vagy több egység szintje van beágyazva a másikba. Az első szakasz a klaszterek felépítéséből áll, amelyeket a mintához használnak., A második szakaszban az elsődleges egységek mintáját véletlenszerűen választják ki az egyes klaszterekből (ahelyett, hogy az összes kiválasztott klaszterben található összes egységet használnák). A következő szakaszokban a kiválasztott klaszterek mindegyikében további egységmintákat választanak ki stb. Ezután felmérjük az eljárás utolsó szakaszában kiválasztott összes végső egységet (például magánszemélyeket). Ez a technika tehát lényegében az előző véletlenszerű minták véletlenszerű alcsoportjainak felvételének folyamata.,
a többlépcsős mintavétel jelentősen csökkentheti a mintavételi költségeket, ahol a teljes populációs listát össze kell állítani (mielőtt más mintavételi módszereket lehetne alkalmazni). A nem kiválasztott klaszterek leírásában részt vevő munka megszüntetésével a többlépcsős mintavétel csökkentheti a hagyományos klaszter mintavételhez kapcsolódó nagy költségeket. Előfordulhat azonban, hogy minden minta nem teljes mértékben képviseli az egész lakosságot.,
Kvóta samplingEdit
A kvóta alapján, a lakosság első szegmentált a kölcsönösen kizárólagos alcsoportok, csakúgy, mint a rétegzett mintavétel. Ezután az ítélet arra szolgál, hogy az egyes szegmensek alanyait vagy egységeit egy meghatározott arány alapján válasszuk ki. Egy interjúalanynak például 200 nőstényt és 300 45 és 60 év közötti férfit kell mintavételeznie.
Ez a második lépés teszi a technikát a nem valószínűségi mintavétel egyikévé. A kvóta-mintavétel során a minta kiválasztása nem véletlenszerű., Például, interjúalanyok lehet a kísértés, hogy interjút azoknak, akik úgy néznek ki, leghasznosabb. A probléma az, hogy ezek a minták elfogultak lehetnek, mert nem mindenki kap esélyt a kiválasztásra. Ez a véletlen elem a legnagyobb gyengesége, a kvóta és a valószínűség pedig évek óta vita tárgya.
Minimax samplingEdit
A kiegyensúlyozatlan adatsorok, ahol a mintavételi arány nem követi a lakosság statisztikák, lehet resample az adatkészlet konzervatív módon, úgynevezett minimax mintavételi., A minimax mintavétel az Anderson minimax arányból származik, amelynek értéke 0,5-nek bizonyult: bináris osztályozásban az osztály-minta méretét egyenlően kell kiválasztani. Ez az arány csak a Gauss-eloszlású Lda-osztályozó feltételezésével bizonyítható minimax aránynak. A Minimax mintavétel fogalmát a közelmúltban fejlesztették ki az osztályozási szabályok általános osztályához, az úgynevezett osztály bölcs intelligens osztályozókhoz., Ebben az esetben, a mintavételi arány osztályok úgy van kiválasztva, hogy a legrosszabb esetben osztályozó hiba az összes lehetséges populációs statisztikák osztály előzetes valószínűségek, lenne a legjobb.
véletlen mintavételszerkesztés
a véletlen mintavétel (más néven megragadás, kényelem vagy lehetőség mintavétel) egy olyan típusú nonprobability mintavétel, amely magában foglalja a mintát a lakosság azon részéből, amely közel van a kézhez. Ez azt jelenti, hogy a lakosságot azért választják ki, mert könnyen elérhető és kényelmes., Lehet, hogy találkozik a személlyel, vagy magában foglal egy személyt a mintában, amikor találkozik velük, vagy úgy választják meg, hogy technológiai eszközökkel, például az interneten vagy telefonon keresztül találják meg őket. Az ilyen mintát használó kutató tudományosan nem tudja általánosítani a teljes populációt ebből a mintából, mert nem lenne elég reprezentatív., Például, ha az interjúkészítő ilyen felmérést végezne egy bevásárlóközpontban kora reggel egy adott napon, az emberek, akiket interjút készíthet, az adott időpontban ott megadott emberekre korlátozódnak, amelyek nem képviselik a társadalom többi tagjának véleményét egy ilyen területen, ha a felmérést a nap különböző időpontjaiban és hetente többször kell elvégezni. Ez a fajta mintavétel a leghasznosabb kísérleti teszteléshez., Néhány fontos szempont a kutatók segítségével kényelem minták a következők:
- Vannak ellenőrzések belül a kutatási design, vagy kísérlet, amely arra szolgálnak, hogy a hatások csökkentése nem véletlen kényelem mintát, biztosítva ezáltal az eredmények több képviselője, a lakosság?
- van-e jó okunk azt hinni, hogy egy adott kényelmi minta reagálna vagy másképp viselkedne, mint egy véletlenszerű minta ugyanabból a populációból?
- a kérdést a kutatás felteszi, amely megfelelő választ adhat egy kényelmi mintával?,
a társadalomtudományi kutatásokban a hógolyó mintavétel hasonló technika, ahol a meglévő vizsgálati alanyokat több tantárgy felvételére használják a mintába. A hógolyó mintavétel egyes változatai, mint például a válaszadó által vezérelt mintavétel, lehetővé teszik a kiválasztási valószínűségek kiszámítását, és bizonyos körülmények között valószínűségi mintavételi módszerek.
önkéntes Mintavételszerkesztés
az önkéntes mintavételi módszer a nem valószínűségi mintavétel egyik típusa. Az önkéntesek úgy döntenek, hogy kitöltenek egy felmérést.,
az önkénteseket a közösségi médiában megjelenő hirdetésekkel lehet meghívni. A hirdetések célpopulációját olyan jellemzők alapján lehet kiválasztani, mint a hely, életkor, nem, jövedelem, foglalkozás, oktatás vagy érdekek a szociális médium által biztosított eszközök segítségével. A reklám tartalmazhat egy üzenetet a kutatásról, valamint egy felméréshez való kapcsolódást. A link követése és a felmérés elvégzése után az önkéntes benyújtja a mintapopulációban feltüntetendő adatokat. Ez a módszer elérheti a globális lakosságot, de a kampány költségvetése korlátozza., A meghívott lakosságon kívüli önkéntesek is szerepelhetnek a mintában.
nehéz általánosításokat készíteni ebből a mintából, mert lehet, hogy nem képviseli a teljes populációt. Az önkéntesek gyakran nagy érdeklődést mutatnak a felmérés fő témája iránt.
Line-intercept samplingEdit
Line-intercept sampling egy olyan mintavételi módszer egy olyan régióban, ahol egy elemet mintavételeznek, ha egy kiválasztott vonalszegmens, úgynevezett” transect”, metszi az elemet.,
Panel samplingEdit
a Panel mintavétel az a módszer, amikor először véletlenszerű mintavételi módszerrel kiválasztják a résztvevők egy csoportját, majd ezt a csoportot többször kérik (potenciálisan azonos) információkra egy idő alatt. Ezért minden résztvevőt két vagy több időpontban kérdeznek meg; az adatgyűjtés minden időszakát “hullámnak”nevezik. A módszert Paul Lazarsfeld szociológus fejlesztette ki 1938-ban a politikai kampányok tanulmányozásának eszközeként., Ez a hosszanti mintavételi módszer lehetővé teszi a népesség változásainak becslését, például a krónikus betegség tekintetében a munkahelyi stresszre a heti élelmiszerkiadásokra. A panelmintavétel felhasználható a kutatók tájékoztatására az életkor miatt bekövetkező személyen belüli egészségügyi változásokról, vagy a folyamatos függő változók, például a házastársi interakció változásainak magyarázatára. Számos javasolt módszer létezik a paneladatok elemzésére, beleértve a MANOVA-t, a növekedési görbéket, valamint a strukturális egyenlet modellezését késleltetett hatásokkal.,
Snowball samplingEdit
a hógolyó mintavétel magában foglalja a kezdeti válaszadók egy kis csoportjának megtalálását, és több válaszadó toborzására használja őket. Különösen hasznos azokban az esetekben, amikor a lakosság rejtett vagy nehéz felsorolni.
elméleti mintavételszerkesztés
elméleti mintavétel akkor történik, amikor a mintákat az eddig gyűjtött adatok eredményei alapján választják ki, azzal a céllal, hogy a terület mélyebb megértését vagy elméleteket fejlesszenek ki., Szélsőséges vagy nagyon specifikus eseteket lehet kiválasztani annak érdekében, hogy maximalizálják annak valószínűségét, hogy egy jelenség valóban megfigyelhető lesz.