O Portal de Dados Federal: Data.gov

Se você está à procura de dados que o governo federal pode ter, mas você não tem certeza de qual agência está envolvida, iniciar sua pesquisa na portal de dados federais. Lá você vai encontrar um catálogo pesquisável de dados de todas as agências federais. Você pode procurar por conjuntos de dados por palavras-chave e obter informações sobre o que está disponível, a fonte para cada conjunto de dados, os formatos disponíveis, e onde encontrar os dados.

O portal de dados não é uma fonte de dados, informações apenas sobre os dados que está disponível e onde obtê-lo. E o portal não cobre todos os bits de dados do governo disponíveis. Então, se você encontrar algo que seja útil para você em Data.gov, acompanhar investigando o site da agência que realmente fornece esses dados para procurar informações e dados adicionais.

Se você precisa de algo que você não pode encontrar, entre em contato com a agência diretamente. Você pode ser capaz de falar com alguém que pode ajudar a localizar o que você precisa, ou pelo menos descobrir por que os dados que você quer não está disponível.

Enquanto nada é novo sobre dados públicos, o portal facilita a certas novas iniciativas. Todos os dados governo federal recém-gerado é necessário para ser disponibilizada publicamente em formatos abertos, legíveis por máquina, mantendo a privacidade e segurança. O conceito chave aqui é a legibilidade da máquina, fornecendo dados em formatos que são apropriados para uso de computação, especialmente usar no desenvolvimento de aplicações.

As agências também são obrigados a

  • Criar um inventário de agência única de dados: Eles devem documentar e rastrear ativos de dados como fazem equipamentos, mobiliário e outros bens.

  • Publicar uma lista de dados público: A listagem deve ser publicado em páginas da web da agência, incluindo todos os ativos de dados que são públicos ou que possam ser tornados públicos.

  • Desenvolver novos mecanismos de feedback público: Eles devem fornecer meios para o público a fornecer feedback relacionado com as prioridades de compartilhamento de dados.

O portal de dados federal também permite que os governos locais para adicionar seus conjuntos de dados para o catálogo do portal. Isso não é obrigatório e não muitas cidades estão prontos a participar, mas você pode se deparar com alguns dados locais no catálogo, e você pode esperar para ver mais no futuro.

Embora este portal pode levar você a uma gama grande e diversificada de dados, nada disso foi criado especificamente para o uso de mineração de dados. Todos foram inicialmente recolhidos para a partilha governo uso- com o público é secundário.

Privacidade e segurança requisitos impedir que alguns dados sejam tornados públicos, e alguns dados só podem ser compartilhados de forma agregada. (Por exemplo, a renda de um indivíduo pode ser privado, enquanto a renda média de um grupo de pessoas é público.) E iniciativas de dados abertos são movidos por programadores, e não mineiros de dados, de modo que os dados não podem ser organizados ou formatados como você preferir.

O portal de dados é um ponto de partida, não um destino final, na sua busca de dados. Nem todos os conjuntos de dados do governo estão incluídos no catálogo, e alguns que não são podem ser marcadas com as palavras-chave que você escolher para a sua pesquisa. Mas Data.gov pode orientá-lo a muitos conjuntos de dados úteis e fornecer pistas para as agências que podem ter mais a oferecer. Você pode até descobrir algumas jóias inesperadas para aprimorar seu trabalho de mineração de dados.

menu