Was ist AWS MapReduce?
Was ist AWS MapReduce?

Video: Was ist AWS MapReduce?

Video: Was ist AWS MapReduce?
Video: Einführung in Amazon Elastic MapReduce 2024, Dezember
Anonim

Amazon Elastic Karte verkleinern (EMR) ist ein Amazon Web Services ( AWS ) Tool für die Verarbeitung und Analyse von Big Data. Amazon EMR verarbeitet Big Data über einen Hadoop-Cluster virtueller Server in Amazon Elastic Compute Cloud (EC2) und Amazon Simple Storage Service (S3).

Wie funktioniert AWS EMR auf diese Weise?

Der Service startet eine vom Kunden festgelegte Anzahl von Amazon EC2-Instances, die aus einem Master und mehreren anderen Knoten bestehen. Amazonas EMR führt Hadoop-Software auf diesen Instanzen aus. Der Master-Knoten teilt Eingabedaten in Blöcke auf und verteilt die Verarbeitung der Blöcke an die anderen Knoten.

Abgesehen von oben, was ist der Unterschied zwischen ec2 und EMR? nicht wie EMR , EC2 kategorisiert Slave-Knoten nicht in Kern- und Aufgabenknoten. Dies erhöht das Risiko, HDFS-Daten zu verlieren, falls ein Knoten entfernt/verloren geht. EC2 verwendet Apache-Bibliotheken (s3a), um auf Daten auf s3 zuzugreifen. Auf der anderen Seite, EMR verwendet AWS-proprietären Code, um schnelleren Zugriff auf s3 zu haben.

Wird AWS EMR außerdem vollständig verwaltet?

Amazonas Elastic MapReduce ( EMR ) ist ein vollständig verwaltet Hadoop- und Spark-Plattform von Amazonas Internetservice ( AWS ). Mit EMR , AWS Kunden können Hadoop-Cluster mit mehreren Knoten schnell einrichten, um Big-Data-Workloads zu verarbeiten.

Verwendet AWS Hadoop?

Amazonas Internetdienste Verwendet der Open-Source-Apache Hadoop Distributed Computing-Technologie, um den Zugriff auf große Mengen an Rechenleistung zu erleichtern, um datenintensive Aufgaben auszuführen. Hadoop , die Open-Source-Version von Googles MapReduce, wird bereits von Unternehmen wie Yahoo und Facebook verwendet.

Empfohlen: