Úvod do jadra Hustota Odhad

Kernel Density Odhad je štatistická metóda predstavuje rad údajov . Súvisiace ku histogramy , Kernel Density Odhad ponúka spôsob , ako odhadnúť rozloženie premenné v populácii . Táto metóda je pomerne sofistikované , ale výsledky vizuálnej interpretácie pravdepodobné hustoty danej premennej , inými slovami , frekvencie , s akou premennou sa objaví v populácii . Používa

jadra odhady hustoty odhadu tvar funkcie hustoty . Funkcia hustotou zobrazuje frekvenciu , s akou premennou sa objaví v náhodnom odbere vzoriek populácie . Kernel Density Odhad je považovaný za neparametrickej metódy . V štatistikách , sú parametrické a neparametrickej metódy . Parametrické metódy , aby viac predpokladov ako tie neparametrickej . Nie sú potrebné žiadne predpoklady o rozdelení , prostriedky alebo štandardnej odchýlky v neparametrickej štatistiky . Napríklad , ak ste chceli vedieť , či desiaty testu v triede by mali vyššie skóre ako v prvých deviatich mesiacoch roka , v parametrickom uvažovaní budete musieť poznať priemer a smerodajnú odchýlku odvodiť odpoveď . V non – parametrické uvažovania , jednoducho poznať počet testu je dosť poznať posledný test má 10 percentnú pravdepodobnosť , že sú nad predchádzajúcich skóre .
Kernel

kernel Density Odhad má dve kľúčové komponenty : jadra a šírku pásma . Kernel je funkcia hustoty . K dispozícii je šesť obyčajné druhy funkcií hustoty v neparametrickej štatistiky : normálne , uniformy , trojuholníkové , Epanechnikov , quartic , triweight a kosínusová . Každá z týchto funkcií sa používa na odhad početnosti náhodnej veličiny v populácii .
Pásma

Druhá zložka , šírka pásma , vyhladzuje výsledné dáta z funkcie hustoty jadra . Šírku pásma , preto , má silne dopady vizuálne reprezentácie dát . Zubaté čiary môže byť postupne vyhladiť až do dátumu bola tak parafrázoval , že už nie je vhodné . V Kernel odhadu hustoty vzorca , šírka pásma je reprezentovaný písmenom h To musí byť pozitívny a viesť k distribúcii , ktorá zhŕňa do jedného .
Výhody

Kernel Density Odhad má svoje výhody na ďalšie neparametrickej metódami odhadu, najmä histogramy . Histogramy predstavujú rozloženie premennej vo košov pozdĺž vodorovnej radu . Skladaný nádoby predstavujú väčšiu hustotu premenné v oblasti dát . Vzhľadom k tomu , histogramy symbolizovať dát prostredníctvom zásobníkov , premenná je roztrieštené a rôzne distribúcie sú zubaté a diskrétne , skresľovanie rozloženie tekutiny premenné , ktoré naozaj existuje v populácii . Kernel Density Odhad lepšie reprezentuje tento tekutosť s hladkou líniu , ktorého hladkosť je určená zvoleným v hustote jadra vzorca pásma .

Pridaj komentár