Was ist mit Schlüssel reduzieren?
Was ist mit Schlüssel reduzieren?

Video: Was ist mit Schlüssel reduzieren?

Video: Was ist mit Schlüssel reduzieren?
Video: Was ist der Schlüssel zum Glück? | SWR Nachtcafé 2024, November
Anonim

Die Funktion Spark RDD ReduceByKey führt die Werte für jeden zusammen Schlüssel mit einem Assoziativ reduzieren Funktion. Das bedeutet intuitiv, dass diese Funktion das gleiche Ergebnis liefert, wenn sie wiederholt auf denselben RDD-Datensatz mit mehreren Partitionen angewendet wird, unabhängig von der Reihenfolge der Elemente.

Was ist dann der Unterschied zwischen groupByKey und ReduceByKey?

groupByKey () dient lediglich dazu, Ihren Datensatz basierend auf einem Schlüssel zu gruppieren. ReduceByKey () ist so etwas wie Gruppierung + Aggregation. ReduceByKey kann verwendet werden, wenn wir mit großen Datensätzen arbeiten. aggregatByKey() ist logisch dasselbe wie ReduceByKey () aber Sie können das Ergebnis in zurückgeben unterschiedlich Typ.

Wissen Sie auch, warum die Aktion im Funken reduziert wird? Funkenreduzierung Betrieb ist ein Handlung Art der Operation und löst eine vollständige DAG-Ausführung für alle aufgereihten faulen Anweisungen aus. Funke RDD reduzieren -Funktion reduziert die Elemente dieses RDD unter Verwendung des angegebenen kommutativen und assoziativen binären Operators. Funkenreduzierung Bedienung ist fast ähnlich wie reduzieren Methode in Scala.

Was ist außerdem Pairrdd?

Spark bietet spezielle Operationen für RDDs, die Schlüssel/Wert-Paare enthalten. Diese RDDs werden Paar-RDDs genannt. Paar-RDDs sind ein nützlicher Baustein in vielen Programmen, da sie Operationen offenlegen, die es Ihnen ermöglichen, parallel auf jeden Schlüssel zu reagieren oder Daten im Netzwerk neu zu gruppieren. PairRDDs sind SCHLÜSSEL/WERT-Paare.

Ist ReduceByKey eine Aktion?

Reduce() gibt eine Sammlung aus, die nicht zum gerichteten azyklischen Graphen (DAG) hinzufügt, also als ein Handlung . Jedoch, ReduceByKey () gibt ein RDD zurück, das nur eine andere Ebene/ein anderer Zustand im DAG ist, also eine Transformation.

Empfohlen: