Was ist das Dplyr-Paket in R?
Was ist das Dplyr-Paket in R?
Anonim

dplyr ist neu Paket die eine Reihe von Werkzeugen für die effiziente Bearbeitung von Datensätzen in R. dplyr ist die nächste Iteration von plyr, die sich nur auf Datenframes konzentriert. dplyr ist schneller, hat eine konsistentere API und sollte einfacher zu verwenden sein.

Abgesehen davon, was ist die Verwendung des Dplyr-Pakets in R?

dplyr ist ein R-Paket für die Arbeit mit strukturierten Daten innerhalb und außerhalb von R. dplyr macht Datenmanipulation für R Benutzer einfach, konsistent und performant. Mit dplyr Als Schnittstelle zur Manipulation von Spark DataFrames können Sie: Daten auswählen, filtern und aggregieren.

Anschließend stellt sich die Frage, was macht %>% in R? Dort ist viele Tutorials für den Pfeifenbetreiber in R, einfach Google dafür. Der %>%-Operator ist ein 'Pipe'-Operator, der Daten aus der Ausgabe der Funktion nach links übergibt und standardmäßig in den ersten Parameter der Funktion rechts setzt.

Wie bekomme ich Dplyr in R?

Sie können installieren:

  1. die neueste veröffentlichte Version von CRAN mit install.packages("dplyr")
  2. die neueste Entwicklungsversion von github mit if (packageVersion("devtools") < 1.6) { install.packages("devtools") } devtools::install_github("hadley/lazyeval") devtools::install_github("hadley/dplyr")

Was macht Group_by in R?

Gruppiere nach Funktion in Rgruppiere nach wird benutzt um Gruppe der Datenrahmen in R. Dplyr-Paket in R ist versehen mit gruppiere nach() Funktion, die den Datenrahmen nach mehreren Spalten mit Mittelwert, Summe oder anderen Funktionen gruppiert. Mittelwert von Kelch. Die Länge wird nach Artenvariable gruppiert.

Beliebt nach Thema