Inhaltsverzeichnis:

Wie gehen Sie mit NA-Werten in R um?
Wie gehen Sie mit NA-Werten in R um?

Video: Wie gehen Sie mit NA-Werten in R um?

Video: Wie gehen Sie mit NA-Werten in R um?
Video: R-Stutorials II - 08 Fehlende Werte: NA 2024, Kann
Anonim

Beim Importieren von Datensätzen aus anderen Statistikanwendungen wird die fehlende Werte könnte mit einer Zahl codiert sein, zum Beispiel 99. Um zu lassen R weiß das ist ein fehlender Wert du musst es neu codieren. Eine weitere nützliche Funktion in R zu mit fehlenden Werten umgehen ist n / A . omit(), die unvollständige Beobachtungen löscht.

Also, wie gehst du mit NA in R um?

NA-Optionen in R

  1. weglassen und na. Ausschließen: gibt das Objekt mit entfernten Beobachtungen zurück, wenn sie fehlende Werte enthalten; Unterschiede zwischen dem Weglassen und Ausschließen von NAs können in einigen Vorhersage- und Residuenfunktionen gesehen werden.
  2. pass: gibt das Objekt unverändert zurück.
  3. fail: gibt das Objekt nur zurück, wenn es keine fehlenden Werte enthält.

Wie gehen Sie auch mit fehlenden kategorialen Daten in R um? Es gibt verschiedene Möglichkeiten, mit fehlenden Werten kategorialer Wege umzugehen.

  1. Ignorieren Sie Beobachtungen fehlender Werte, wenn wir mit großen Datensätzen arbeiten und weniger Datensätze fehlende Werte aufweisen.
  2. Variable ignorieren, wenn sie nicht signifikant ist.
  3. Entwickeln Sie ein Modell, um fehlende Werte vorherzusagen.
  4. Behandeln Sie fehlende Daten nur als eine weitere Kategorie.

In ähnlicher Weise kann man sich fragen, wie man fehlende Werte in R festlegt.

In R , fehlende Werte werden durch das Symbol dargestellt N / A (Nicht verfügbar). Unmöglich Werte (z. B. durch Null dividieren) werden durch das Symbol NaN (keine Zahl) dargestellt. Im Gegensatz zu SAS, R verwendet das gleiche Symbol für Zeichen und Zahlen Daten . Für mehr Übung in der Arbeit mit fehlende Daten , probiere diesen Reinigungskurs aus Daten in R.

Was bedeutet Na Rm in R?

Bei Verwendung einer Datenrahmenfunktion n / A . rm in R bezieht sich auf den logischen Parameter, der der Funktion mitteilt, ob sie entfernt werden soll oder nicht N / A Werte aus der Berechnung. Es buchstäblich bedeutet NA Löschen. Es ist weder eine Funktion noch eine Operation. Es ist einfach ein Parameter, der von mehreren Datenrahmenfunktionen verwendet wird.

Empfohlen: