T-Test (Definition, Typer) - Steg för steg-beräkningsexempel

Innehållsförteckning

Vad är T-Test?

Ett T-test är en metod som används för att härleda en slutsats i statistik, som syftar till att ta reda på om det finns någon större skillnad mellan två medel där de två betraktade grupperna kan vara relaterade till varandra.

Förklaring

  • Det syftar till hypotesprovning, som i princip används för att testa en hypotes som gäller en viss population. Ett T-test tar hänsyn till T-statistik, T-fördelningsvärden och frihetsgrader, som används för att bestämma sannolikheten för skillnad mellan två datamängder.
  • Det grundläggande arbetet bakom T-Test är att det betraktar ett urval från var och en av de två uppsättningarna och bygger ett problemuttag genom att betrakta en nollhypotes där båda medlen anges vara lika.
  • På grundval av likställda formler ritas värden och jämförs med standardvärdena, vilket ytterligare leder till att nollhypotesen accepteras eller avvisas. Avvisandet av nollhypotesen indikerar att datamängden är ganska korrekt och inte av en slump.

Typer av T-test

Det finns främst fyra typer av t-test, som är följande:

# 1 - 1-prov T-test

Den är avsedd för testning om medelvärdet av det värde man har riktat sig mot är lika med medelvärdet för en enskild befolkning, t.ex. testar om medelvikt för klass 5-studenter är mer än 45 kg

# 2 - 2-prov T-test

Det syftar till att testa om medelvärdet av det värde man har riktat sig mot är lika med medelvärdet för två oberoende populationer, t.ex. att testa om medelvikten för klass 5 pojkeelever skiljer sig från klass 5 flickstudenter.

# 3 - Parat T-test

Den är avsedd för testning om medelvärdet av det värde man har riktat sig mot är lika med medelvärdet av skillnader mellan de observationer som är beroende. t.ex. genom att jämföra elevernas betyg före och efter undervisningen för varje ämne kan vi identifiera om det är tillräckligt viktigt att ta undervisning för att förbättra elevernas betyg.

# 4 - T-test i regressionsutgång

Den tar hänsyn till koefficienten i regressionsekvationen och testar i vilken grad den skiljer sig från nollvärdet. t.ex. om inträdesprovets poäng är en viktig faktor för att avgöra om en student får ett bra slutresultat.

Antaganden om T-Test

  • Det första antagandet för ett t-test är relaterat till mätningsskalan. Detta är relaterat till om skalan följer en kontinuerlig eller ordinarie skala
  • Det andra antagandet kan handla om provets slumpmässiga natur. Detta innebär att de insamlade uppgifterna ska vara rena slumpmässiga.
  • Det tredje antagandet kan vara att när vi plottar data relaterade till t-testfördelning, ska det följa en normalfördelning och åstadkomma en klockböjd graf.
  • Det fjärde antagandet kan vara att för t-fördelning och specifikt för att få en form av klockkurvan måste vi ha en större provstorlek.
  • Det slutliga antagandet kan vara det för t-testet. Variansen bör vara homogen. e. standardavvikelserna är nästan lika.

Hur man beräknar?

Det fungerar i två olika scenarier, dvs en för det oberoende exemplet och ett annat för det beroende exemplet.

# 1 - Oberoende provscenario

  • Vi måste beräkna summan, provstorleken, som bestäms av "N", och poängvärdet för medelvärdet för vart och ett av de oberoende proverna. Efter detta måste frihetsgraden beräknas för varje oberoende prov.
  • Detta representeras av att subtrahera provet med ett, vilket vi betecknar som "n-1". Efter detta måste variansen och standardavvikelsen beräknas.
  • Provernas frihetsgrader läggs till och detta kallas "df-total." Därefter måste vi multiplicera frihetsgraden för varje prov med variansen för varje. Vi måste lägga till resultatet och sedan dela summan med "df-total." Det erhållna resultatet kallas den sammanslagna variansen.
  • Den sammanslagna variansen divideras sedan med provets n. Resultatet som erhållits för alla prover tillsätts sedan. Kvadratroten till detta tas och detta kallas som skillnaden i standardfel.
  • Slutligen måste vi subtrahera det lägre genomsnittet av provet från det större medelvärdet av provet. Den erhållna skillnaden divideras sedan med standardfelet för skillnaden, och de erhållna resultaten kallas T-värdet.

# 2 - Beroende provscenario

  • Poängen som erhålls från vart och ett av datamängden noteras och vi måste subtrahera den. De erhållna skillnaderna läggs till och kallas "D." Skillnaderna för varje prov kvadreras och läggs till för att få ett resultat som kallas "D-Squared." Efter detta måste vi multiplicera "N" eller antalet poäng ihop med "D-kvadrat".
  • Det erhållna resultatet subtraheras från kvadraten av totalt "D." Detta resultat delas vidare med "N-1". Kvadratroten av den resulterande erhålls och benämns som en delare. Slutligen måste vi dela det totala ”D” med delaren, vilket ger oss det slutliga t-värdet.

Exempel på T-test

Låt oss överväga att vi har poäng för varje ämne i provet som hålls i två termer.

Steg 1: Subtrahera fas 1 från fas 2

Steg 2: Lägg upp hela skillnaden, dvs -55

Steg 3: Kvadratera upp skillnaderna

Steg 4: Lägg upp alla kvadrater med skillnad, dvs. 983

Steg 5: Användning av formel för att beräkna T-värdet

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • T-värde = -2,29

Det erhållna T-värdet jämförs sedan med T-värdet som erhållits från tabellen med användning av p-värde och frihetsgrad. Om det beräknade t-värdet är större än tabellvärdet på en specifik fördefinierad alfa-nivå kan vi avvisa nollhypotesen och säga att det finns en skillnad mellan medelvärdet.

När den används?

Detta används för att jämföra två medel eller proportioner. Vi använder också ett t-test när populationsparametrarna är okända för användaren. Det finns i stort sett tre fall av användning av t-testscenarier, som är följande:

  • Ett oberoende prov-t-test används när vi vill jämföra medelvärdet för två grupper.
  • Ett parat prov-t-test används när vi vill jämföra medelvärdet för samma grupp men vid olika tidpunkter.
  • Ett t-testprov används när vi behöver kontrollera medelvärdet för en enskild grupp mot ett okänt medelvärde.

T-testanvändning i Excel

  • I Excel är det första och främsta vi behöver installationen av ett tillägg som heter Data Analysis. Efter detta måste vi gå till "Data" på menyfliken och klicka på den. Alternativet "Dataanalys" visas där.
  • För att genomföra ett T-test måste vi ha våra data i ett kolumnformat. När du klickar på "Dataanalys" får vi ett antal statistiska tester som vi kan utföra, och från listan måste vi välja ett t-test och klicka på "Ok."
  • En dialogruta kommer upp där vi behöver ange data för spår 1 i rutan för variabelt område 1 och även prov 2-data i rutorna för variabelt område 2. Som standard förblir värdet på alfa 0,05, men detta kan ändras utifrån vår preferens. När allt är bra, klicka på "OK".
  • Vi kan nu se resultatet av vårt T-test på excelbladet. Det viktigaste värdet här att notera är P-värde. På vad vi har valt vårt alfa-värde, om vårt P-värde i excel är mindre än alfa-värdet, kan vi dra slutsatsen att det finns en statistisk materiell skillnad mellan medelvärdet för våra två värden.

Slutsats

T-testet syftar till hypotesprovning, som i grunden används för att testa en hypotes om en viss population. Den berättar nivån på betydelsen av skillnaden mellan grupperna, som vanligtvis mäts utifrån medelvärdet. Här får vi i princip reda på skillnaden mellan populationsmedel och ett hypotetiskt värde.

Intressanta artiklar...