Was ist Mapper und Reducer in Hadoop?
Was ist Mapper und Reducer in Hadoop?

Video: Was ist Mapper und Reducer in Hadoop?

Video: Was ist Mapper und Reducer in Hadoop?
Video: Map Reduce explained with example | System Design 2024, November
Anonim

Der große Vorteil von Karte verkleinern ist, dass es einfach ist, die Datenverarbeitung über mehrere Rechenknoten zu skalieren. Unter dem Karte verkleinern Modells werden die Datenverarbeitungsprimitiven Mapper genannt und Reduzierstücke . Zerlegen einer Datenverarbeitungsanwendung in Mapper und Reduzierstücke ist manchmal nicht trivial.

Wenn man dies im Blick behält, was ist Mapper und Reducer?

MapReduce besteht aus zwei Schlüsselfunktionen: Mapper und Reducer . Mapper ist eine Funktion, die die Eingabedaten verarbeitet. Die Mapper verarbeitet die Daten und erstellt mehrere kleine Datenblöcke.

Was ist ein Mapper? EIN Mapper kann Daten beschreiben Mapper sowie eine Person, die geografische Karten erstellt. Aufgaben eines geografischen Mapper oder Kartierungstechniker umfassen das Sammeln und Verarbeiten von geografischen Daten, um eine Karte eines Gebiets zu erstellen.

Was ist also der Nutzen von Mapper und Reducer in Hadoop?

Laut der Apache Software Foundation ist das Hauptziel von Karte / Reduzieren besteht darin, den Eingabedatensatz in unabhängige Blöcke aufzuteilen, die vollständig parallel verarbeitet werden. Die Hadoop MapReduce Framework sortiert die Ausgaben der Karten, die dann in die reduzieren Aufgaben.

Wozu dient Mapper in Hadoop?

Im Lauf Hadoop Job, Anwendungen implementieren in der Regel die Mapper und Reduzierer-Schnittstellen zum Bereitstellen der Karte (einzelne Aufgaben, die Eingabedatensätze in Zwischendatensätze umwandeln) und Reduzierverfahren zum Reduzieren eines Satzes von Zwischenwerten, die einen Schlüssel teilen, auf einen kleineren Satz von Werten.

Empfohlen: