Příklady odhadu maximální pravděpodobnosti

click fraud protection

Předpokládejme, že máme náhodný vzorek od populace zájmu. Můžeme mít teoretický model pro způsob, jakým populace je distribuován. Může však existovat několik obyvatel parametry z nichž neznáme hodnoty. Jedním ze způsobů, jak určit tyto neznámé parametry, je odhad maximální pravděpodobnosti.

Základní myšlenkou odhadu maximální pravděpodobnosti je to, že určujeme hodnoty těchto neznámých parametrů. Děláme to tak, abychom maximalizovali přidruženou funkci hustoty pravděpodobnosti kloubu nebo pravděpodobnostní hmotnostní funkce. Uvidíme to podrobněji v následujícím textu. Poté vypočítáme několik příkladů odhadu maximální pravděpodobnosti.

Kroky pro odhad maximální pravděpodobnosti

Výše uvedenou diskusi lze shrnout do následujících kroků:

  1. Začněte ukázkou nezávislých náhodných proměnných X1, X2,... Xn ze společné distribuce, každá s funkcí hustoty pravděpodobnosti f (x; θ1,.. .θk). Theta jsou neznámé parametry.
  2. Protože náš vzorek je nezávislý, pravděpodobnost získání konkrétního vzorku, který sledujeme, se zjistí vynásobením našich pravděpodobností dohromady. To nám dává funkci pravděpodobnosti L (θ
    instagram viewer
    1,.. .θk) = f (x11,.. .θk) f (x21,.. .θk)... f (xn1,.. .θk) = Π f (xi1,.. .θk).
  3. Dále používáme Počet najít hodnoty theta, které maximalizují naši pravděpodobnostní funkci L.
  4. Konkrétněji rozlišujeme funkci pravděpodobnosti L s ohledem na 9, pokud existuje jediný parametr. Pokud existuje více parametrů, počítáme částečné deriváty L s ohledem na každý z theta parametrů.
  5. Chcete-li pokračovat v procesu maximalizace, nastavte derivát L (nebo částečné deriváty) na nulu a vyřešte pro theta.
  6. Potom můžeme použít jiné techniky (například druhý derivátový test) k ověření, že jsme našli maximum pro naši funkci pravděpodobnosti.

Příklad

Předpokládejme, že máme balíček semen, z nichž každé má stálou pravděpodobnost str úspěchu klíčení. Zasadíme n z nich a spočítat počet těch, které klíčí. Předpokládejme, že každé semeno klíčí nezávisle na ostatních. Jak určíme odhad maximální pravděpodobnosti parametru str?

Začneme tím, že každé semeno je modelováno podle Bernoulliho distribuce s úspěchem str. Nechali jsme to X být buď 0 nebo 1, a pravděpodobnostní hmotnostní funkce pro jedno semeno je F( X; str ) = strX(1 - str)1 - x.

Náš vzorek se skládá z n odlišný Xi, každý z má distribuci Bernoulli. Semena, která klíčit Xi = 1 a semena, která nedokážou klíčit Xi = 0.

Funkce pravděpodobnosti je dána:

L ( str ) = Π strXi(1 - str)1 - Xi

Vidíme, že je možné přepsat funkci pravděpodobnosti pomocí zákonů exponentů.

L ( str ) = strΣ xi(1 - str)n - Σ xi

Dále rozlišujeme tuto funkci s ohledem na str. Předpokládáme, že hodnoty pro všechny Xi jsou známé, a proto jsou konstantní. K rozlišení funkce pravděpodobnosti musíme použít produktové pravidlo spolu s pravidlem napájení:

L '( str ) = Σ xistr-1 + Σ xi (1 - str)n - Σ xi- (n - Σ xi ) strΣ xi(1 - str)n-1 - Σ xi

Přepíšeme některé negativní exponenty a máme:

L '( str ) = (1/str) Σ xistrΣ xi (1 - str)n - Σ xi- 1/(1 - str) (n - Σ xi ) strΣ xi(1 - str)n - Σ xi

= [(1/str) Σ xi - 1/(1 - str) (n - Σ xi)]istrΣ xi (1 - str)n - Σ xi

Nyní, abychom pokračovali v procesu maximalizace, nastavili jsme tento derivát na nulu a vyřešili ho p:

0 = [(1/str) Σ xi - 1/(1 - str) (n - Σ xi)]istrΣ xi (1 - str)n - Σ xi

Od té doby str a (1- str) jsou nenulové, které máme

0 = (1/str) Σ xi - 1/(1 - str) (n - Σ xi).

Vynásobením obou stran rovnice str(1- str) nám dává:

0 = (1 - str) Σ xi - str (n - Σ xi).

Rozbalíme pravou stranu a uvidíme:

0 = Σ xi - str Σ xi - strn + pΣ xi = Σ xi - strn.

Tak Σ xi = strn a (1 / n) xi = p. To znamená, že odhad maximální pravděpodobnosti str je průměr vzorku. Konkrétně se jedná o podíl vzorků semen, která klíčila. To je zcela v souladu s tím, co by nám řekla intuice. Za účelem stanovení podílu semen, která klíčí, zvažte nejprve vzorek z populace, která nás zajímá.

Úpravy kroků

Výše uvedený seznam kroků obsahuje některé úpravy. Například, jak jsme viděli výše, obvykle stojí za to strávit nějaký čas pomocí nějaké algebry ke zjednodušení vyjádření funkce pravděpodobnosti. Důvodem je snazší provedení diferenciace.

Další změnou výše uvedeného seznamu kroků je zvážit přirozené logaritmy. Maximum pro funkci L nastane ve stejném bodě jako pro přirozený logaritmus L. Maximalizace ln L je tedy ekvivalentní maximalizaci funkce L.

Mnohokrát, díky přítomnosti exponenciálních funkcí v L, přijetí přirozeného logaritmu L značně zjednoduší naši práci.

Příklad

Uvidíme, jak používat přirozený logaritmus tím, že se vrátíme k příkladu shora. Začneme funkcí pravděpodobnosti:

L ( str ) = strΣ xi(1 - str)n - Σ xi .

Poté použijeme naše logaritmické zákony a vidíme, že:

R ( str ) = ln L ( str ) = Σ xi ln p + (n - Σ xi) ln (1 - str).

Už vidíme, že derivát je mnohem jednodušší vypočítat:

R '( str ) = (1/str) Σ xi - 1/(1 - str)(n - Σ xi) .

Nyní, jako předtím, jsme tento derivát nastavili na nulu a vynásobili obě strany str (1 - str):

0 = (1- str ) Σ xi - str(n - Σ xi) .

Řešíme to str a najděte stejný výsledek jako dříve.

Použití přirozeného logaritmu L (p) je užitečné jiným způsobem. Je mnohem jednodušší vypočítat druhou derivaci R (p), abychom ověřili, že skutečně máme maximum v bodě (1 / n) Σ xi = p.

Příklad

Předpokládejme například, že máme náhodný vzorek X1, X2,... Xn z populace, kterou modelujeme s exponenciálním rozložením. Funkce hustoty pravděpodobnosti pro jednu náhodnou proměnnou má tvar F( X ) = θ-1E -X

Funkce pravděpodobnosti je dána funkcí hustoty pravděpodobnosti kloubu. Toto je produkt několika z těchto funkcí hustoty:

L (9) = = 9-1E -Xi= θ-nE Xi

Opět je užitečné zvážit přirozený logaritmus funkce pravděpodobnosti. Toto rozlišení bude vyžadovat méně práce než rozlišení funkce pravděpodobnosti:

R (9) = ln L (9) = ln [9-nE Xi]

Používáme naše logaritmické zákony a získáváme:

R (9) = ln L (9) = - n ln θ + -ΣXi

Rozlišujeme s ohledem na θ a máme:

R '(9) = - n / θ + ΣXi2

Nastavte tento derivát na nulu a vidíme, že:

0 = - n / θ + ΣXi2.

Vynásobte obě strany θ2 a výsledkem je:

0 = - n θ + ΣXi.

Nyní použijte algebra k vyřešení pro θ:

9 = (1 / n) ΣXi.

Z toho vidíme, že průměr vzorku je tím, co maximalizuje funkci pravděpodobnosti. Parametr θ, který odpovídá našemu modelu, by měl být jednoduše průměrem všech našich pozorování.

Spojení

Existují i ​​jiné typy odhadců. Jeden alternativní typ odhadu se nazývá nezaujatý odhadce. U tohoto typu musíme vypočítat očekávanou hodnotu naší statistiky a zjistit, zda odpovídá odpovídajícímu parametru.

instagram story viewer