Was ist DistCp in Hadoop?
Was ist DistCp in Hadoop?

Video: Was ist DistCp in Hadoop?

Video: Was ist DistCp in Hadoop?
Video: 008 - Was ist Hadoop? 2024, November
Anonim

DistCp (verteilte Kopie) ist ein Werkzeug zum Kopieren großer Inter-/Intra-Cluster-Kopien. Es verwendet Karte verkleinern um deren Verteilung, Fehlerbehandlung und -behebung sowie Berichterstattung zu bewirken. Es erweitert eine Liste von Dateien und Verzeichnissen in Eingabe, um Aufgaben zuzuordnen, von denen jede eine Partition der in der Quellliste angegebenen Dateien kopiert.

Ähnlich kann man fragen, überschreibt Distcp?

Ich sollte auch einiges ausführen und das erklären distcp - überschreiben Wille überschreiben die Datei unabhängig davon, ob die Größe übereinstimmt oder nicht. Dadurch werden alle Dateien in hdfs-nn2 aktualisiert, deren Größe nicht mit hdfs-nn1 übereinstimmt, und alle überflüssigen Dateien werden gelöscht.

Was ist der Hadoop FS-Befehl? Das Dateisystem ( FS ) Shell enthält verschiedene Shell-like Befehle die direkt mit dem interagieren Hadoop Verteiltes Dateisystem ( HDFS ) sowie andere Dateisysteme, die Hadoop unterstützt, wie Local FS , HFTP FS , S3 FS , und andere.

Wie übertrage ich auf diese Weise Daten von einer Hdfs auf eine andere Hdfs?

Hadoop fs cp – am einfachsten Möglichkeit, Daten von einem zu kopieren Quellverzeichnis zu Ein weiterer . Verwenden Sie die hadoop fs -cp [Quelle] [Ziel]. Hadoop fs copyFromLocal – Muss Daten kopieren vom lokalen Dateisystem in HDFS ? Verwenden Sie die hadoop fs -copyFromLocal [Quelle] [Ziel].

Wie kopiere ich einen Cluster von einem Cluster in einen anderen?

Kopieren von Dateien zwischen Cluster . Du kannst Dateien kopieren oder Verzeichnisse zwischen verschiedenen Cluster indem Sie den Befehl hadoop distcp verwenden. Sie müssen Anmeldeinformationen angeben Datei in deiner Kopieren fordern Sie also die Quelle an Cluster kann bestätigen, dass Sie bei der Quelle authentifiziert sind Cluster und das Ziel Cluster.

Empfohlen: