Punktskattning används för att uppskatta ett värde på en okänd parameter. Beroende på vad denna parameter representerar finns det olika metoder för att få det mest optimala värdet. Det finns med andra ord situationer där en viss teknik kan vara av preferens före annan beroende på vad som ska beräknas.
Allmänt fall
Den mest allmänna definitionen av punktskattning är att vi har en parameter som är en funktion av utfall där detta stickprov av värden kommer från de stokastiska variablerna som har en sannolikhetsfördelning som är beroende av parametern . Själva uppskattningen av betecknas . Denna uppskattning är genom det ett utfall från den stokastiska variabeln också kallad stickprovsvariabeln.
För att sammanfatta detta kortfattat:
är en okänd parameter som ska uppskattas.
är en S.V.
är ett tal, den uppskattning av och ett utfall av .
Uppskattning av väntevärde
Vid en skattning av väntevärdet är den mest optimala uppskattningen det aritmetiska medelvärdet . Detta uttrycks som
där är varje utfall i den givna serien av utfall som väntevärdet ska skattas.
Uppskattning av varians och standardavvikning
Anta nu att variansen och standardavvikningen är okänd. Vid skattning av variansen används formeln för stickprovsvariansen
Notera formeln kräver att man vet värdet på som motsvarar skattningen av väntevärdet. Av denna anledning kräver formel att man först har utfört skattningen av väntevärdet innan.
Standardavvikningen beräknas som genom samma uppskattning fast roten ur:
Exercise
Vid en undersökning hur långt människor går per dag ges följande mätdata (km)
skatta väntevärdet och standardavvikelsen hos fördelningen som mätdatan kommer från.
Solution
Vi antar att varje mätdata kommer från oberoende stokastiska variabler och använder det aritmetiska medelvärdet för att skatta väntevärdet.
Vi skattar nu även standardavvikningen:
Uppskattning genom Maximum-likelihood
ML-metoden är en allmän metod för att skatta okända parametrar och fungerar genom att skapa en likelihood-funktion där skattningsvärdet motsvarar det högsta värde som antar. Förutsatt att de stokastiska variablerna vars fördelning beror av är oberoende definieras Likelihood-funktionen som:
Exercise
Efter en observation av oberoende händelseförlopp ges följande mätdata:
Sannolikhetsfunktionen ges av . Skatta genom Maximum-likelihood metoden.
Solution
Vi använder oss av och får:
Vi söker nu maxvärdet av . Vanligtvis när man vill hitta maximipunkten bör funktionen dervieras, sättas lika med noll, få ut nollpunkterna och sedan använda sig av teckenschema för att få fram maxvärdet. Men i detta fall gör vi ett steg innan som vi kan kalla för logaritm-tricket.
Anledningen till att vi använder denna är att en logaritmering inte påverkar var maxvädet befinner sig i x-led samtidigt som funktionen vi vill derivera förenklas betydligt. Vi kallar den nya funktionen där .
Vi fortsätter därefter med att förenkla genom lite logaritmregler
Så! Istället för att derivera är det bara att derivera som är betydligt enklare.
Vi deriverar
samt sätter för at hitta rötterna och undersöker med teckenschema och får fram att maxvädet är .
Detta ger att .
Uppskattning genom Minsta-kvadrat
MK-metoden är ytterligare en allmän metod för att utföra skattningar av okända parametrar. Vi har den okända parameter som vi vill skatta och en funktion där dess lägsta värdet motsvarar skattningen . Vi har åter igen de stokastiska variablerna vars fördelning beror av . Funktionen definieras av formeln:
där motsvarar väntevärdet för den respektive stokastiska variabeln, det vill säga, .
Exercise
Liknande uppgift som ovan, vi har mätdatan
och sannolikhetsfunktionen . Skatta nu genom Minsta-kvadrat metoden.
Solution
För att kunna ovanstående formel för och måste vi först beräkna , det vill säga väntevärdet för sannolikhetsfunktionen. För att underlätta beräkningar tar vi en titt i ev. formelblad och ser att sannolikhetsfunktionen är en -fördelning. Med denna information vet vi dessutom från KTHs formelblad att väntevärdet för funktionen motsvarar .
Väntevärdet kan inte beräknas som vanligt med då och vi nöjer därför oss med att det är givet i formelbladet.
Vi använder nu formeln för och får:
Avslutningsvis deriverar vi, får och använder teckendiagram för att hitta det minsta värdet för som är . Detta ger att .