Upravený R2 / upravený R-na druhou: k čemu se používá?

Statistiky Definice > Upravit r2,


podívejte se na video nebo si přečtěte článek níže:

přijměte, Prosím, statistiky, marketing cookies se dívat na toto video.

potřebujete pomoc s domácí otázkou? Podívejte se na naši stránku doučování!,

upravený R2: přehled

upravený R2 je zvláštní forma R2, koeficient stanovení.

upravený R2 má v reálném životě mnoho aplikací. Obrázek: USCG

R2 ukazuje, jak dobře se termíny (datové body) hodí do křivky nebo čáry. Upravený R2 také ukazuje, jak dobře se termíny hodí do křivky nebo čáry, ale přizpůsobuje se počtu termínů v modelu. Pokud do modelu přidáte stále více zbytečných proměnných, upravený r-squared se sníží. Pokud přidáte další užitečné proměnné, upravený r-na druhou se zvýší.,
upravený R2 bude vždy menší nebo roven R2.

potřebujete pouze R2 při práci se vzorky. Jinými slovy, R2 není nutné, pokud máte data z celé populace.

vzorec je:

kde:

  • N je počet bodů v datovém vzorku.
  • k je počet nezávislých regresorů, tj. počet proměnných ve vašem modelu, s výjimkou konstanty.

Pokud již znáte R2, je to poměrně jednoduchý vzorec pro práci., Pokud však již nemáte R2, pravděpodobně to nebudete chtít vypočítat ručně! (Pokud musíte, podívejte se, jak vypočítat koeficient stanovení). Existuje mnoho statistických balíčků, které lze vypočítat upravený r na druhou pro vás. Upravený r na druhou je uveden jako součást Excel regresního výstupu. Viz: Excel regresní analýza výstup vysvětleno.


Smyslu Upravené R2

Oba R2 a upravený R2 vám představu o tom, kolik datových bodů spadají do řady regresní rovnice., Existuje však jeden hlavní rozdíl mezi R2 a upraveným R2: R2 předpokládá, že každá jednotlivá proměnná vysvětluje změnu závislé proměnné. Upravený R2 vám řekne procento variace vysvětlené pouze nezávislými proměnnými, které skutečně ovlivňují závislou proměnnou.

jak vás upravený R2 penalizuje

upravený R2 vás potrestá za přidání nezávislých proměnných (k v rovnici), které neodpovídají modelu. Proč? Při regresní analýze může být lákavé přidat do dat více proměnných, jak si o nich myslíte., Některé z těchto proměnných budou významné, ale nemůžete si být jisti, že význam je jen náhodou. Upravená R2 to kompenzuje tím, že vás penalizuje za tyto další proměnné.

zatímco hodnoty jsou obvykle pozitivní, mohou být také negativní. To by se mohlo stát, pokud je váš R2 nulový; po nastavení může hodnota klesnout pod nulu. To obvykle znamená, že váš model je špatně vhodný pro vaše data. Jiné problémy s vaším modelem mohou také způsobit hodnoty pod nulou, jako například neuvedení konstantního termínu do vašeho modelu.,

Problémy s R2, které jsou opraveny s upravené R2

  1. R2 se zvyšuje s každou prediktor přidán do modelu. Jako R2 vždy roste a nikdy se snižuje, to může být lepší fit s více podmínkami, které přidáte do modelu. To může být zcela zavádějící.
  2. podobně, pokud má váš model příliš mnoho termínů a příliš mnoho polynomů s vysokým řádem, můžete narazit na problém nadměrné montáže dat. Když se nadměrně hodí data, zavádějící vysoká hodnota R2 může vést k zavádějícím projekcím.,

——————————————————————————

Potřebujete pomoci s úkoly nebo zkoušky otázka? S Chegg studie, můžete získat krok za krokem řešení vašich otázek od odborníka v oboru. Vaše první 30 minut s Chegg tutor je zdarma!

Share

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *