Média estatística

Definição - o que significa média estatística?

A média estatística é um certo tipo de média matemática muito útil em ciência da computação e, em particular, no aprendizado de máquina.

Simplesmente falando, a média estatística é um processo de média aritmética, em que soma todos os números em um conjunto de dados e, em seguida, divide o total pelo número de pontos de dados.

Isso é simples e direto e, portanto, a média aritmética ou média estatística foi amplamente usada durante a era moderna e na era da programação de computadores.

Aqui, podemos diferenciar a média estatística de dois outros tipos de médias que compõem um grupo de três métodos estatísticos chamados de médias pitagóricas. Os outros dois meios são chamados meios harmônicos e geométricos.

Todos os três podem ser úteis no aprendizado de máquina e em novos tipos de engenharia de algoritmo de inteligência artificial.

Definirtec explica a média estatística

Em geral, a média estatística é útil em todos os tipos de classificação de aprendizado de máquina e tarefas de suporte à decisão.

Pense desta forma - o programa plota todos os pontos de dados e, em seguida, usa a média estatística para chegar a uma média, que é usada para ajudar o computador a aprender por meio de seus processos de aprendizado de máquina.

A média harmônica e a média geométrica um pouco mais complexas também podem ser usadas no aprendizado de máquina para coisas específicas.

Por exemplo, a média harmônica é freqüentemente usada para derivar uma "pontuação F" que ajuda a avaliar a recuperação de dados em um sistema específico.

Voltando à média estatística, suponha que você tenha cinco pontos de dados e o total seja 25. Sua média estatística seria cinco, mas você não tem certeza de qual é cada um desses cinco números. Você poderia ter três uns, um dois e um vinte - ou você poderia ter cinco cincos perfeitamente simétricos.

Você tem um conjunto de dados como o primeiro exemplo mencionado acima, onde a média estatística se desvia um pouco. Você pode ter um conjunto de dados com os cinco números a seguir - dois, três, seis, sete e 38.

O total é 56, mas apenas um desses números está acima da média estatística, o que é um pouco enganador.

É aqui que os engenheiros de aprendizado de máquina falam sobre viés e como diferentes tipos de meios e médias podem mostrar viés em um programa de aprendizado de máquina.

Sem se tornarem muito complexos, os engenheiros podem fornecer esses tipos de distorção, tornando os algoritmos ainda mais elaborados e adivinhando ou verificando ou reavaliando os dados de classificação.

O modelo de floresta aleatória é uma técnica em que, em vez de apenas um único conjunto de dados, diferentes sistemas conhecidos como “árvores” individuais capturam uma gama de conjuntos de dados e tabulam os resultados coletivamente.

O resultado final é que a média estatística, como um tipo básico de média aritmética, é amplamente útil para fornecer as simplificações nas quais os algoritmos de aprendizado de máquina são executados.

Se você tem um diagrama disperso de dados e deseja filtrá-lo em um insight de fácil digestão, como muitos painéis de negócios fazem, a média estatística é uma ótima maneira de ajudar a facilitar isso.

Muitos dos detalhes adicionais sobre meios estatísticos e outras médias são frequentemente estudados por matemáticos profissionais e engenheiros de algoritmo.

Uma média aritmética é calculada usando a seguinte equação: