Sql no hadoop

Definição - o que significa SQL no Hadoop?

SQL no Hadoop é um tipo de ferramenta de aplicativo analítico - a implementação SQL na plataforma Hadoop, que combina a consulta de dados estruturados no estilo SQL padrão com a estrutura de dados Hadoop. O Hadoop é uma plataforma relativamente nova, assim como o próprio big data, e poucos profissionais são especialistas nisso, mas o SQL no Hadoop simplifica o acesso à estrutura do Hadoop e facilita a implementação nos sistemas corporativos atuais.

Definirtec explica SQL no Hadoop

SQL no Hadoop refere-se a várias implementações de SQL para a plataforma Hadoop. MapReduce, que é o mapeador de tarefas de cluster e organizador de resultados do Hadoop, suporta SQL como um caso de uso principal, bem como outros métodos de processamento. Portanto, faz sentido criar ferramentas poderosas para permitir SQL, que é uma das linguagens mais amplamente utilizadas para consulta e manipulação de banco de dados. À medida que o Hadoop ganha popularidade para a arquitetura de dados corporativos, o SQL é a chave para a adoção adequada tanto de dados estruturados quanto de dados estruturados usados ​​no Hadoop.

Os principais drivers do SQL no Hadoop incluem:

  • Aproveitando as habilidades de SQL existentes, presentes na maioria das organizações
  • Reutilização de carga de transformação de extração (ETL), inteligência de negócios (BI) e investimentos em infraestrutura analítica no Hadoop

Algumas implementações de SQL em Hadoop incluem:

  • Apache Spark SQL
  • Apache Hive
  • Apache Tagus
  • Apache Drill
  • HP Vertica no MapR
  • Drivers ODBC
  • Presto
  • tubarão