Mineração de dados de texto

Definição - O que significa Text Data Mining?

A mineração de dados de texto envolve vasculhar um documento de texto ou recurso para obter informações estruturadas valiosas. Isso requer ferramentas analíticas sofisticadas que processam texto para obter palavras-chave específicas ou pontos-chave de dados de formatos considerados relativamente brutos ou não estruturados.

A mineração de dados de texto também é conhecida como mineração de texto ou analítica de texto.

Definirtec explica Text Data Mining

Na mineração de dados de texto, os sistemas projetados usam coisas como taxonomias e análise lexical para determinar quais partes de um documento de texto são valiosas como dados extraídos. Modelos estatísticos são comumente úteis, e os sistemas também podem usar heurísticas, ou suposições algorítmicas, para tentar determinar quais partes de um texto são importantes. Outros sistemas de controle incluem marcação e análise de palavras-chave, onde as ferramentas procuram substantivos próprios específicos ou outras marcas e palavras-chave para descobrir o que está sendo escrito.

Outro componente exclusivo da mineração de texto costuma ser chamado de análise de sentimento. Na análise de sentimento, que geralmente é muito mais difícil do que a análise estatística, as ferramentas analíticas tentam descobrir o clima ou sentimento por trás do texto escrito e outros aspectos do que ele está abordando em um nível muito subjetivo e intuitivo. Com o surgimento de ferramentas de inteligência artificial, muitos avanços foram feitos na análise de sentimento, de modo que a mineração de dados de texto moderna é mais do que apenas coletar referências quantitativas e envolve trazer modelos conceituais de alto nível para a mineração de texto para descobrir maneiras novas e exclusivas para agregar dados valiosos.