prozentsätze miteinander vergleichen

4 Antworten

ich verstehe nicht ganz, was hier verglichen werden soll:

a) zwei prozentwerte - einer vorher, einer nachher z.b. 10% vs. 90%

b) zwei reihen (vorher vs. nachher), die aus vielen einzelnen prozentwerten bestehen

zu a) das kann man statistisch nur testen, wenn man auch die angabe der streuung für beide zeitpunkte hat.

zu b) hier kann man alle notwendigen angaben wie streuung errechnen. je nach dem, ob bestimmte voraussetzungen gegeben sind, kann man entweder einen t-test für abhängige stichproben rechnen oder einen nonparametrischen test = wilcoxon-test.

für den binomial-test würden die daten in nur 2 ausprägungen vorliegen, d.h. dass ein wert entweder 0 oder 1 sein kann.

Ergänzend zu Schokolindas a) ( b) kann ich nur wortwörtlich zustimmen):

Für diesen Fall nehme ich an, dass die Prozentsätze besagen, vorher haben v% zugestimmt, nachher n%, und das in einer binären Skala (ja vs. nein oder besser vs. schlechter). Dann muss man nur noch wissen, wie viele Befragte jeweils teilgenommen haben. (Es können ja unterschiedlich viele sein, z.B. eine Stichprobe vor einer Werbekampagne, eine andere danach). Das wäre dann der Chi-Quadrat-Test, bei kleinen Stichproben (z.B. < 30) sollte man eher Fishers exakten Test nehmen.

Befragt man aber vorher und nachher dieselben Personen, so sollte man besser für jede Person die Differenz bilden und hätte dann gesamt nur einen Prozentsatz (wie viele nachher besser als vorher, oder andere Definition wie viele nachher besser oder gleich gut wie vorher), den man auf einen vorher festgelegten Wert (z.B. 40%) testen kann mit dem Binomialtest. Oder man schließt die ohne Veränderung aus der Stichprobe aus und testet auf mehr besser als schlechter (mehr als 50% besser). Bei z.B. N>30 könnte durch Normalverteilung approximiert werden.

Binomialwahrscheinlichkeit --> Approximation an Normalverteilung

Um entscheiden zu können, ob der Unterschied zwischen zwei Prozentsätzen signifikant ist, muss man eine Information darüber haben, wie hoch die Streubreite für zufällige Abweichungen ist. Sonst kann man ja nichts rechnen.

Ganz nett wäre, wenn man die Standardabweichung oder eine ähnliche statistische Kenngröße hätte. Dann könnte man entscheiden, ob die beiden Werte mit einer vorgegebenen Wahrscheinlichkeit (95 % oder 99 %) nur zufällig oder doch signifikant voneinander abweichen.