Braucht Presto Bienenstock?
Braucht Presto Bienenstock?

Video: Braucht Presto Bienenstock?

Video: Braucht Presto Bienenstock?
Video: Die Vereinigung oder von 5 Königinnen bleiben 2 übrig.... 2024, November
Anonim

Folgende Dateiformate werden unterstützt: Text, SequenceFile, RCFile, ORC und Parquet. Zusätzlich eine Fernbedienung Bienenstock Metastore ist erforderlich . Der lokale oder eingebettete Modus wird nicht unterstützt. Presto tut es kein MapReduce verwenden und benötigt daher nur HDFS.

Was ist also Presto und Hive?

Apache Bienenstock : Data Warehouse-Software zum Lesen, Schreiben und Verwalten großer Datensätze. Presto ist eine Open-Source-SQL-Abfrage-Engine für die Ausführung interaktiver analytischer Abfragen für Datenquellen aller Größen von Gigabyte bis Petabyte. Apache Bienenstock und Presto können als "Big Data"-Tools kategorisiert werden.

Verwendet Presto in ähnlicher Weise MapReduce? Presto ist eine Open-Source-Engine für die parallele SQL-Ausführung. Im Gegensatz zu Hive, Presto nicht verwenden das Karte verkleinern Rahmen für seine Ausführung. Stattdessen, Presto greift direkt auf die Daten über eine spezialisierte verteilte Abfrage-Engine zu, die denen in kommerziellen parallelen RDBMSs sehr ähnlich ist.

Unter Berücksichtigung dieser Tatsache, basiert Athena auf Presto?

Die Technologie ist basierend auf dem Open-Source-Facebook Presto oder PrestoDB-Software. Angesichts dieser Abstammung, Athena bietet Teams eine serverlose Front-End-SQL-Abfrage-Engine für einen ETL- oder ELT-Prozess zu einem AWS S3-Data Lake.

Ist Presto in Erinnerung?

Presto (oder PrestoDB) ist eine verteilte Open-Source-SQL-Abfrage-Engine, die von Grund auf für schnelle analytische Abfragen für Daten jeder Größe entwickelt wurde. Die Abfrageausführung läuft parallel über eine reine Erinnerung -basierte Architektur, wobei die meisten Ergebnisse innerhalb von Sekunden zurückgegeben werden.

Empfohlen: