Clustering k-means – Definirtec

Definição - O que significa agrupamento K-Means?

O agrupamento K-means é um algoritmo de aprendizagem não supervisionado simples usado para resolver problemas de agrupamento. Ele segue um procedimento simples de classificação de um determinado conjunto de dados em uma série de clusters, definidos pela letra "k", que é fixada de antemão. Os clusters são então posicionados como pontos e todas as observações ou pontos de dados são associados ao cluster mais próximo, computados, ajustados e então o processo é reiniciado usando os novos ajustes até que o resultado desejado seja alcançado.

O agrupamento K-means tem usos em motores de busca, segmentação de mercado, estatísticas e até mesmo astronomia.

Definirtec explica o agrupamento de K-Means

O agrupamento K-means é um método usado para análise de agrupamento, especialmente em mineração de dados e estatísticas. Seu objetivo é particionar um conjunto de observações em uma série de clusters (k), resultando no particionamento dos dados em células de Voronoi. Pode ser considerado um método para descobrir a qual grupo um determinado objeto realmente pertence.

É usado principalmente em estatística e pode ser aplicado a quase todos os ramos de estudo. Por exemplo, em marketing, ele pode ser usado para agrupar diferentes dados demográficos de pessoas em grupos simples que tornam mais fácil para os profissionais de marketing segmentar. Os astrônomos o usam para vasculhar grandes quantidades de dados astronômicos; uma vez que não podem analisar cada objeto um por um, eles precisam encontrar uma maneira de encontrar estatisticamente pontos de interesse para observação e investigação.

O algoritmo:

K pontos são colocados no espaço de dados do objeto, representando o grupo inicial de centróides.
Cada objeto ou ponto de dados é atribuído ao k mais próximo.
Depois que todos os objetos são atribuídos, as posições dos k centróides são recalculadas.
As etapas 2 e 3 são repetidas até que as posições dos centróides não se movam mais.