As2 Wiederholung

Allgemein

  • Mittelwert (Lageparameter) $\bar{x} = \frac{1}{n} \sum x_i$
  • Varianz (Streuungsparameter) $s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2$
  • Standardabweichung $s = \sqrt{s^2}$

Regression

  • Punktepaare $(x_i, y_i) \rightarrow y = mx + t$
  • Steigung $m = \frac{SP_{xy}}{SQ_x} = \frac{\sum (x_i - \bar{x}) (y_i - \bar{y})}{\sum (x_i - \bar{x})^2}$
  • Pearson'scher Korrelationskoeffizient $r = \frac{S_{xy}}{S_y S_x} = \frac{\frac{1}{n-1} SP_{xy}}{\sqrt{\frac{1}{n-1} SQ_x \frac{1}{n-1} SQ_y}} = \frac{SP_{xy}}{\sqrt{SQ_x SQ_y}}$, wobei dieser ein einem Intervall zwischen -1 und 1 liegen muss.
  • Bestimmtheitsmaß $B = r^2$ beschreibt den Anteil der durch das Modell erklärten Streuung
  • Durch Anwendung der Kleinstquadratmethode wird die Fehlerquardatsumme minimiert, so dass die Abweichung zwischen Modell und tatsächlichen Daten möglichst gering wird. $SQ_e = \sum y_i - (mx_i + t)^2$
Korrelationskoeffizient Aussage
r < 0,5 schwach
0,5 < r < 0,8 mittel
r > 0,8 stark
  • Spannweite $R = x_{max} - x_{min}$

Diagramme

  • Häufigkeitsdiagramm
    • absolute Häufigkeit h: $\bar{x} = \frac{1}{n} \sum h_j x_j = \sum \frac{h_j}{n} x_j$
  • Summenhäufigkeitsdiagramm $H(x_j) = \sum h_i x_i$
  • Quartile
    1. Datenpunkte sortieren
    2. Nummerieren und damit Rang verteilen
    3. Median bilden = Q2
      • n gerade: Mittelwert der mittleren Werte
      • n ungerade: mittlerer Wert
    4. Median der unteren Hälfte = Q1
    5. Median der oberen Hälfte = Q3
    6. Q0 = xmin
    7. Q4 = xmax
  • Boxplot
    • Interquartilsabstand $iqr = Q_3 - Q_1$
    • xi ist Ausreisser, wenn $x_1 \not\subset [Q_1 - a \cdot iqr; Q_3 + a \cdot iqr]$
      • a = 1,5: mild
      • a = 3,0: extrem
Seiten-Tags: mitschrift statistik
Sofern nicht anders angegeben ist der Inhalt dieser Seite unter Lizenz Creative Commons Attribution-ShareAlike 3.0 License