Plataforma de ciência de dados

Definição - O que significa Data Science Platform?

Uma plataforma de ciência de dados é um ambiente para conduzir o trabalho de ciência de dados, que normalmente inclui codificação e implantação de modelos de código, bem como agregação e uso de dados de diversas fontes. Os projetos de ciência de dados se beneficiam de uma plataforma central de ciência de dados que geralmente é descrita como um “hub de software” para esse tipo de trabalho de big data.

Definirtec explica a plataforma de ciência de dados

As plataformas de ciência de dados podem ser configuradas de várias maneiras. Muitos deles tiram proveito dos princípios de modernização, como máquinas virtuais e virtualização de contêiner, onde uma plataforma de ciência de dados acomoda fatores de design que permitem aos desenvolvedores trabalhar com aplicativos e bases de código em um ambiente modular. O trabalho de ciência de dados também evoluiu por meio do uso de tecnologias como Apache Hadoop e outros sistemas de clustering e modulares para manipulação de dados e ciclos de vida dos dados.

Parte do desafio de uma plataforma de ciência de dados é determinar como as ferramentas serão suportadas e controlar o que alguns chamam de “expansão de ferramentas”, que pode ser um fator negativo.