NoSQL Pesquisa características a considerar

Muitos bancos de dados NoSQL recursos de consulta de apoio e certas capacidades de pesquisa. Escolhendo o caminho certo, muitas vezes se resume a compreender as características que você precisa para suportar.

Embora eles estão relacionados, consulta e pesquisa são bastante diferentes. A consulta retorna apenas os resultados que correspondem a todos os termos na mesma. Pesquisa, por outro lado, pode incluir termos opcionais e normalmente fornece resultados ordenados por um cálculo relevância.

cálculos de relevância permitir que muitas interações de pesquisa mais flexíveis. Os usuários que fazem as buscas fazer a chamada final sobre qual resultado é um jogo para eles - o motor de busca dicas apenas fornece encomendados.

Ambos pesquisa e consulta permitir partidas valor exato e consulta de intervalo - por exemplo, onde um valor campo de data em um registro encontra-se entre dois valores. consulta de intervalo não são suportados por muitos bancos de dados NoSQL ou motores de busca, por isso, se você precisar deles, certifique-se de verificar isso no início de seu processo de seleção.

A maioria dos motores de busca são projetados para procurar registros inteiros e limitar os seus termos de consulta para áreas específicas (como um # 147 publicada em # 148- data). Normalmente, vários métodos de consulta de texto livre estão disponíveis, incluindo estes:

  • consulta Word, onde cada palavra é OR'ed juntos: assim # 147 Adam Fowler blogue # 148- é avaliada como Adão ou Fowler ou blog, com um jogo de todas as palavras, resultando em uma pontuação maior relevância do que usando apenas uma das palavras.

  • A pesquisa por frase, em que a frase inteira é tratada como um: assim # 147 Of Mice and Men # 148- é avaliada de modo que o resultado deve ter todas as palavras, na mesma ordem, para ser um jogo.

  • Wildcard: Procurando por # 147-run * # 148- retorna resultados para # 147-run, # 148- Número 147-corre, # 148- # 147-running, # 148- e # 147-runner # 148.;

  • decorrentes: Uma busca por # 147 prazo # 148- também retorna resultados para # 147-ran # 148- e Número 147-corre, # 148- mas não # 147-running # 148- ou # 147-runner # 148-- procurando # 147-cat # 148- também retorna resultados para # 147-gatos # 148;.

  • lematização: Este é o método mais avançado do que decorrentes. Por exemplo, o termo de lematização Número 147-better # 148- resultados no seu lema (A forma de base ou de um dicionário de palavras), que neste caso é # 147 boa # 148.;

A maioria das pessoas preferem termos de pesquisa de digitação em uma caixa de busca em estilo Google porque é muito fácil de usar.

Os motores de busca apoiar um formato de texto chamado Pesquisa gramática. No Google, por exemplo, digitando # 147 local: Reino Unido e Adam Fowler e Londres # 148- partidas todos os documentos de sites Reino Unido que mencionam a palavra de Londres ea frase Adam Fowler.

Você também pode usar parênteses para termos ninho dentro dos prazos, o que é particularmente útil com os operadores booleanos como AND, OR e NOT.

Por vezes, um mecanismo de consulta mais estruturado é necessária. Normalmente, este é um formato adaptado e muito refinado em um formato JSON ou XML. Um bom exemplo é encontrado em consultas geoespaciais. Especificando uma caixa delimitadora de uma área que você quer uma pesquisa para corresponder normalmente é o melhor feito em um mapa, desenhando uma caixa ao invés de digitar as coordenadas em uma barra de pesquisa de texto livre.

Cada vez mais, as pessoas usam consultas geoespaciais para limitar as suas pesquisas, incluindo o seguinte:

  • Ponto: Corresponde a um ponto exato.

  • raio Point: Jogos a uma distância de um ponto (uma área circular).

  • caixa delimitadora: Corresponde a um espaço quadrado (como na área visualizada de um mapa).

  • Polígono: Corresponde a um à mão livre ou forma irregular. Um bom exemplo é a forma de um município ou estado. Estes são basicamente grandes conjuntos de coordenadas dentro de uma área.

  • intersecção Polygon-polígono: Jogos polígonos dentro de registos (por oposição aos pontos dentro de registos como nos tipos de consulta anterior) com um polígono consulta. Será que o polígono consulta tocar a um em um registro, ou contê-lo completamente, ou perdê-lo completamente? Esse tipo de consulta requer um monte de processamento e não é amplamente suportado, mas ela é necessária na indústria de defesa.

t de importante notar que as consultas geoespaciais dependem fortemente de matemática complexa sobre como um sistema de referência de coordenadas particular (chamada de CRS) representa o mundo. Por exemplo, os dispositivos GPS usam um sistema chamado WGS84 (também chamado EPSG: 4326), enquanto que mapas on-line usar o EPSG: 900.916 SIR. Estar ciente de como um banco de dados armazena seus dados geoespaciais e as conversões necessárias é muito importante- caso contrário, você não pode obter uma correspondência em tudo, ou estar a centenas de jardas de distância de seu resultado pretendido.

Alguns motores de busca também suportam métodos que ajudam os usuários a digitar suas consultas. Isso é mais evidente em termos de funcionalidade de preenchimento automático do Google. Você começa a digitar uma consulta e Google sugere que as consultas mais provável para você escolher. Muitos motores de busca apoiar uma funcionalidade semelhante.

Muitas mais funções de pesquisa estão disponíveis, por isso não deixe para fazer sua pesquisa antes de escolher um motor de busca.

menu