Sistema simples de indexação da web para humanos (swish)

Definição - O que significa Simple Web Indexing System For Humans (SWISH)?

O Sistema de Indexação Simples da Web para Humanos (SWISH) é uma ferramenta de código aberto para indexar páginas da Web, bem como outros documentos, incluindo texto, HTML e XML.

SWISH é usado onde há um grande número de documentos, incluindo páginas da Web e outros documentos, que precisam ser indexados. A ferramenta tem capacidade de indexar emails, PDF, HTML, XML, Microsoft Word / Powerpoint / Excel, texto simples e qualquer outro tipo de arquivo que possa ser convertido para XML ou texto HTML.

Definirtec explica Simple Web Indexing System For Humans (SWISH)

O Sistema de Indexação Simples da Web para Humanos - Aprimorado (SWISH-e) é descendente do SWISH. SWISH foi desenvolvido por Kevin Hughes em 1994 e foi finalmente relançado sob licença pública geral como SWISH-E em 1996.

Os recursos do SWISH incluem:

  • Ele pode ser usado com bancos de dados relacionais, como MySQL, para pesquisa rápida de texto completo.
  • Ele vem com um web spider para indexar documentos remotos sobre HTTP
  • Suporta pesquisa difusa, pesquisa de frase e pesquisa curinga
  • Ele pode retornar resumos de documentos a cada pesquisa
  • Tem a capacidade de limitar as pesquisas a uma determinada parte do documento ou a elementos específicos de HTML e XML
  • Ele pode alertá-lo sobre quaisquer erros estruturais em seus documentos XML e HTML
  • O arquivo de índice pode ser transferido de uma plataforma para outra - é independente da plataforma.