Classificação Imagem com Hadoop

classificação de imagens requer uma quantidade significativa de recursos de processamento de dados, no entanto, o que tem limitado a escala de implantações. classificação de imagens é um tema quente no mundo Hadoop porque nenhuma tecnologia convencional era capaz - até Hadoop veio junto - de abrir as portas para este tipo de tratamento caro em uma escala tão maciça e eficiente.

classificação de imagens começa com a noção de que você construir um conjunto de treinamento e que computadores aprendem a identificar e classificar o que eles estão olhando. Da mesma forma que ter mais dados ajuda a construir melhores modelos de detecção e de risco de fraude, ele também ajuda sistemas para melhor classificar imagens.

Neste caso o uso, os dados são referidos como o conjunto de treino, bem como os modelos são classificadores. classificadores reconhecer características ou padrões dentro de som, imagem ou vídeo e classificá-los de forma adequada. Classificadores são construídos e iterativamente refinado a partir de conjuntos de treinamento para que sua pontuação de precisão (uma medida de exatidão) e recordar pontos (uma medida de cobertura) são elevados.

Hadoop é bem adequado para a classificação de imagem, porque ele fornece um ambiente de processamento massivamente paralelo, não só para criar modelos de classificador (iteração sobre conjuntos de treinamento), mas também proporcionar escalabilidade quase ilimitadas para processar e executar esses classificadores em todo conjuntos enormes de volumes de dados não estruturados.

Considere fontes multimédia, tais como YouTube, Facebook, Instagram, Flickr e - todos são fontes de dados binários não estruturados. A figura mostra uma maneira que você pode usar o Hadoop para escalar o processamento de grandes volumes de imagens e vídeos armazenados para a classificação semântica multimédia.

image0.jpg

Você pode ver como todos os conceitos relativos à estrutura de processamento de Hadoop são aplicadas a esses dados. Observe como as imagens são carregadas no HDFS. Os modelos de classificador, construídas ao longo do tempo, são agora aplicados aos componentes em recursos extras imagem na fase Mapa desta solução. Como você pode ver no canto inferior direito, a saída deste tratamento consiste de classificações de imagens que vão desde desenhos animados para esportes e locais, entre outros.

Hadoop pode ser usado para análise de áudio ou de voz também. Um cliente da indústria de segurança, trabalhamos com cria um sistema de classificação de áudio para classificar os sons que são ouvidos através de cabos de fibra óptica enriquecida-acústicos previstos em torno do perímetro de reactores nucleares.

Por exemplo, este sistema sabe como classificar quase instantaneamente o sussurro do vento, em comparação com o sussurro de uma voz humana ou para distinguir o som de passos humanos que funcionam nos parques perímetro da de vida selvagem.

Essa descrição pode ter uma espécie de Jornada nas Estrelas para ele se sentir, mas agora você pode ver exemplos vivos. Na verdade, a IBM faz uma pública dos maiores sistemas de imagem de classificação do mundo, através da IBM Análise Multimedia and Retrieval System (IMARS).

Aqui são o resultado de uma pesquisa IMARS para o mandato esqui alpino. Na parte superior da figura, você pode ver os resultados dos classificadores mapeadas para o conjunto de imagens que foi processado pelo Hadoop, juntamente com uma nuvem de tags associado.

image1.jpg

Nota o classificador pai mais grosseiramente definida, em oposição ao mais granular. Na verdade, observe os vários níveis de classificação: Rolos em, que rola em - tudo gerado automaticamente pelo modelo de classificador, construído e registados com Hadoop.

Nenhuma dessas imagens tem quaisquer metadados acrescentou. Ninguém abriu iPhoto e marcou uma imagem como um esporte de inverno para torná-lo aparecer nessa classificação. É o classificador esporte de inverno que foi construído para reconhecer atributos de imagem e características de esportes que são jogados em um cenário de inverno.

classificação de imagens tem muitas aplicações, e ser capaz de realizar esta classificação em uma escala maciça usando Hadoop abre mais possibilidades de análise como outros aplicativos podem usar as informações de classificação gerado para as imagens.

Veja este exemplo da indústria da saúde. Uma grande agência de saúde na Ásia foi focada no fornecimento de cuidados de saúde através de clínicas móveis para uma população rural distribuídos por uma grande massa de terra. Um problema significativo que a agência enfrentou foi o desafio logístico de analisar os dados de imagens médicas que foi gerada em suas clínicas móveis.

Um radiologista é um recurso escasso nesta parte do mundo, por isso fazia sentido para transmitir eletronicamente as imagens médicas a um ponto central e ter um exército de médicos examinar. Os médicos que examinaram as imagens foram rapidamente sobrecarregado, no entanto.

A agência está trabalhando agora em um sistema de classificação para ajudar a identificar possíveis condições de fornecer de forma eficaz sugestões para os médicos para verificar. Os primeiros testes mostraram esta estratégia para ajudar a reduzir o número de diagnósticos perdidas ou imprecisas, economizando tempo, dinheiro e - acima de tudo - vidas.

menu