Justeret R2 / justeret R-kvadreret: Hvad bruges det til?

Andel på

Statistik Definitioner > Justeret r2


Se video eller læs nedenstående artikel:

hvis muligt skal Du acceptere statistik, marketing cookies til at se denne video.

brug for hjælp til et hjemmearbejde spørgsmål? Tjek vores vejledning side!,

justeret R2: oversigt

justeret R2 er en speciel form for R2, bestemmelseskoefficienten.

den justerede R2 har mange applikationer i det virkelige liv. Billede: USCG

R2 viser, hvor godt termer (datapunkter) passer til en kurve eller linje. Justeret R2 angiver også, hvor godt termer passer til en kurve eller linje, men justerer for antallet af termer i en model. Hvis du tilføjer flere og flere ubrugelige variabler til en model, vil justeret r-s .uared falde. Hvis du tilføjer flere nyttige variabler, vil justeret r-s .uared stige.,
justeret R2 vil altid være mindre end eller lig med R2.

Du behøver kun R2, når du arbejder med prøver. Med andre ord er R2 ikke nødvendig, når du har data fra en hel befolkning.

formlen er:

hvor:

  • N er antallet af punkter i dine data prøve.
  • K er antallet af uafhængige regressorer, dvs. antallet af variabler i din model, undtagen konstanten.

Hvis du allerede kender R2, er det en ret simpel formel at arbejde., Men hvis du ikke allerede har R2, vil du sandsynligvis ikke beregne dette for hånd! (Hvis du skal, se hvordan du beregner bestemmelseskoefficienten). Der er mange statistiske pakker, der kan beregnes justeret R kvadreret for dig. Justeret R kvadreret er givet som en del af E .cel regression output. Se: e .cel regressionsanalyse output forklaret.


Betydning Justeret R2

Både R2 og justeret R2 give dig en idé om, hvor mange datapunkter, som falder inden for den linje af regressionsligningen., Der er dog en væsentlig forskel mellem R2 og den justerede R2: R2 forudsætter, at hver enkelt variabel forklarer variationen i den afhængige variabel. Den justerede R2 fortæller dig procentdelen af variation, der kun forklares med de uafhængige variabler, der faktisk påvirker den afhængige variabel.

hvordan justeret R2 straffer dig

den justerede R2 vil straffe dig for at tilføje uafhængige variabler (K i ligningen), der ikke passer til modellen. Hvorfor? I regressionsanalyse kan det være fristende at tilføje flere variabler til dataene, som du tænker på dem., Nogle af disse variabler vil være betydelige, men du kan ikke være sikker på, at betydningen bare er tilfældigt. Den justerede R2 kompenserer for dette ved at straffe dig for de ekstra variabler.

selvom værdier normalt er positive, kan de også være negative. Dette kan ske, hvis din R2 er nul; efter justeringen kan værdien dyppe under nul. Dette indikerer normalt, at din model er en dårlig pasform til dine data. Andre problemer med din model kan også forårsage under-nul værdier, såsom ikke at sætte et konstant udtryk i din model.,

problemer med R2, der korrigeres med en justeret R2

  1. R2 stiger med hver forudsigelse tilføjet til en model. Da R2 altid stiger og aldrig falder, kan det se ud til at være en bedre pasform med de flere vilkår, du tilføjer til modellen. Dette kan være helt vildledende.
  2. tilsvarende, hvis din model har for mange udtryk og for mange polynomier med høj orden, kan du støde på problemet med at overmontere dataene. Når du over-fit data, kan en vildledende høj R2-værdi føre til vildledende fremskrivninger.,

> ——————————————————————————

har du Brug for hjælp med lektier eller spørgsmål til test? Med Chegg Study kan du få trinvise løsninger på dine spørgsmål fra en ekspert på området. Din første 30 minutter med en Chegg tutor er gratis!

Share

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *