Inhaltsverzeichnis:

Was ist ein multivariater Ausreißer?
Was ist ein multivariater Ausreißer?

Video: Was ist ein multivariater Ausreißer?

Video: Was ist ein multivariater Ausreißer?
Video: Ausreißer in SPSS analytisch identifizieren - Daten analysieren in SPSS (29) 2024, November
Anonim

EIN multivariater Ausreißer ist eine Kombination ungewöhnlicher Werte für mindestens zwei Variablen. Beide Arten von Ausreißer kann das Ergebnis statistischer Analysen beeinflussen. Ausreißer gibt es aus vier Gründen. Eine falsche Dateneingabe kann dazu führen, dass Daten Extremfälle enthalten.

Ebenso wird gefragt, wie man bivariate Ausreißer identifiziert?

Einer Weg zu überprüfen wenn das so ist" bivariate Ausreißer " besteht darin, die Residuen der Fälle in der Analyse zu untersuchen. Dazu erhalten wir die bivariat Regressionsformel, wenden Sie sie auf jeden Fall an, um y' zu erhalten, und berechnen Sie dann das Residuum als y-y'. SPSS wird dies für uns im Rahmen eines Regressionslaufs tun.

Man kann sich auch fragen, was ist der Unterschied zwischen multivariat und univariat? Univariat und multivariat stellen zwei Ansätze zur statistischen Analyse dar. Univariat beinhaltet die Analyse einer einzelnen Variablen, während multivariat Analyse untersucht zwei oder mehr Variablen. Die meisten multivariat Analyse umfasst eine abhängige Variable und mehrere unabhängige Variablen.

Unter Berücksichtigung dieser Tatsache, welche verschiedenen Arten von Ausreißern gibt es?

Die drei verschiedenen Arten von Ausreißern

  • Typ 1: Globale Ausreißer (auch „Punktanomalien“genannt):
  • Globale Anomalie:
  • Typ 2: Kontextuelle (bedingte) Ausreißer:
  • Kontextbedingte Anomalie: Die Werte liegen nicht außerhalb des normalen globalen Bereichs, sind jedoch im Vergleich zum saisonalen Muster abnormal.
  • Typ 3: Kollektive Ausreißer:

Wie erkennt man multivariate Ausreißer?

Multivariate Ausreißer kann unter Verwendung der Mahalanobis-Distanz identifiziert werden, die der Abstand eines Datenpunkts vom berechneten Schwerpunkt der anderen Fälle ist, in denen der Schwerpunkt als Schnittpunkt des Mittelwerts der bewerteten Variablen berechnet wird.

Empfohlen: