Inhaltsverzeichnis:

Was sind Ausreißer in der Datenanalyse?
Was sind Ausreißer in der Datenanalyse?

Video: Was sind Ausreißer in der Datenanalyse?

Video: Was sind Ausreißer in der Datenanalyse?
Video: Wann sind Datenpunkte Ausreißer? 2024, Kann
Anonim

In der Statistik und Ausreißer ist ein Daten Punkt, der sich deutlich von anderen Beobachtungen unterscheidet. Ein Ausreißer kann auf Schwankungen bei der Messung zurückzuführen sein oder auf experimentelle Fehler hinweisen; letztere sind manchmal von der Daten einstellen. Ein Ausreißer kann zu ernsthaften Problemen führen Statistische Analysen.

Wie findet man in Anbetracht dessen Ausreißer in Daten?

Ein Punkt, der außerhalb des Daten Die Innenzäune von Set sind als minderjährig eingestuft Ausreißer , während jemand, der außerhalb der äußeren Zäune fällt, als Major eingestuft wird Ausreißer . Um die inneren Zäune für Ihre zu finden Daten Setzen Sie zunächst den Interquartilabstand mit 1,5. Dann addiere das Ergebnis zu Q3 und subtrahiere es von Q1.

Sollte ich neben den obigen Ausreißern Ausreißer aus meinen Daten entfernen? Zum das meistens, wenn deine Daten von diesen extremen Fällen betroffen ist, kann gebunden das Input zu einem historischen Vertreter von deine Daten das schließt aus Ausreißer . Bestimmen Sie von Fall zu Fall, was das Wirkung von die Ausreißer war. Und dann entscheide, ob du willst Löschen , ändern oder behalten der Ausreißer Werte.

Wie geht die Datenanalyse in diesem Zusammenhang mit Ausreißern um?

Hier sind vier Ansätze:

  1. Löschen Sie die Ausreißerdatensätze. Im Fall von Bill Gates oder einem anderen echten Ausreißer ist es manchmal am besten, diesen Datensatz vollständig aus Ihrem Datensatz zu entfernen, um zu verhindern, dass diese Person oder dieses Ereignis Ihre Analyse verzerrt.
  2. Begrenzen Sie Ihre Ausreißerdaten.
  3. Weisen Sie einen neuen Wert zu.
  4. Versuchen Sie eine Transformation.

Was ist ein Beispiel für einen Ausreißer?

Ausreißer . more Ein Wert, der "außerhalb" (viel kleiner oder größer als) der meisten anderen Werte in einem Datensatz liegt. Zum Beispiel in den Werten 25, 29, 3, 32, 85, 33, 27, 28 sind beide 3 und 85 " Ausreißer ".

Empfohlen: