############################################## # Wiederholung X^2 - Test ########################################################## # 1. Test auf Unabhaengigkeit # Zu den Daten: Siehe pdf-Datei 'Wiederholung zum Chi-Quadrat Test' # ohne den Befehl chisq.test(): 35/48 24*35/48 (17.5-14)^2/17.5+(21-17.5)^2/17.5+(10-6.5)^2/6.5+(3-6.5)^2/6.5 pchisq(5.169231, df=1,lower.tail=FALSE) # nun mit dem Befehl chisq.test(): pers<-matrix(c(14,10,21,3),ncol=2) pers chisq.test(pers,correct=FALSE) # Nun Fishers exakter Test: choose(48,35) ?rhyper dhyper(21,24,24,35) choose(24,21)*choose(24,14)/choose(48,35) choose(35,14)*choose(13,10)/choose(48,24) dhyper(21,24,24,35)+dhyper(22,24,24,35)+dhyper(23,24,24,35)+dhyper(24,24,24,35) fisher.test(pers) ############################################## # 2. Test auf feste Verteilung: Ist der durch R realisierte Wuerfel fair? # Der Wuerfel in R: sample(1:6,size=1) sample(1:6,size=1) sample(1:6,size=1) # Nun wuerfeln wir 12.000 mal und speichern # die Haeufigkeit von i=1...6 in ergebnis[i] ergebnis <- rep(0,6) # Initialisierung mit 0 ergebnis for (i in 1:12000) { wurf<-sample(1:6,size=1) ergebnis[wurf]<-ergebnis[wurf]+1 } ergebnis ergebnis-2000 (ergebnis-2000)^2 (ergebnis-2000)^2/2000 xsq <- sum((ergebnis-2000)^2/2000) xsq # Wert der X^2 - Teststatistik # Wahrscheinlichkeit unter der X^2-Verteilung mit # 6-1=5 Freiheitsgraden, eine Beobachtung wie 'xsq' # oder extremer zu machen pchisq(xsq,df=5,lower.tail=FALSE) # Nun das Ganze mit R: chisq.test(ergebnis,p=rep(1/6,times=6)) # Dasselbe nochmal: ergebnis <- rep(0,6) ergebnis for (i in 1:12000) { wurf<-sample(1:6,size=1) ergebnis[wurf]<-ergebnis[wurf]+1 } ergebnis chisq.test(ergebnis,p=rep(1/6,times=6)) ############################################## # 3. Test auf von Daten abhaengige Verteilung (zB Hardy-Weinberg Gleichgewicht) # Aufgabe 6.5: # obs: fr(SS)=141/332 # fr(SF)=111/332 # fr(FF)= 28/332 # fr(SI)=111/332 # fr(FI)= 15/332 # fr(II)= 5/332 obs <- c(SS=141,SF=111,FF=28,SI=32,FI=15,II=5) obs # Frage: Ist die in den Daten beobachtete Abweichung vom Hardy-Weinberg-Gleichgewicht signifikant? fS <- (2*141+111+32)/664 fF <- (2* 28+111+15)/664 fI <- (2* 5+ 32+15)/664 fS;fF;fI verteilung <- c(SS=fS^2, SF=2*fS*fF, FF=fF^2, SI=2*Fs*fI, FI=2*fF*fI, II=fI^2) verteilung ## (c) # chisq.test(obs,p=verteilung) ist falsch, da 'verteilung' aus Daten geschaetzt wird # und deshalb df nicht gleich 6-1 ist. # ohne chisq.test: E <- 332*verteilung X2 <- sum( (obs-E)*(obs-E)/E ) X2 # mit chisq.test: Xsq <- chisq.test(obs,p=f)$statistic Xsq # Freiheitsgrade = 6-1-2 (2 fuer fS,fI) = 3 pchisq(Xsq,df=3,lower.tail=FALSE) # p-Wert 25.5 % # Antwort: Die in den Daten beobachtete Abweichung vom Hardy-Weinberg # Gleichgewicht ist NICHT signifikant.