10 recursos livres para Ciência de Dados

Uma coisa excelente sobre a ciência de dados é que você não precisa gastar muito dinheiro em aplicações de software e dados de origem, a fim de começar a colher os seus benefícios. Você pode simplesmente começar com seus próprios dados e começar a usar aplicações open source ou linguagens de programação, a fim de começar a derivar informações valiosas.

Mesmo dados contextuais podem ser obtidas gratuitamente a partir de fontes de dados abertos. É provável que você obterá melhores resultados exatos, mais (com menos esforço) se você tiver dinheiro para gastar em ferramentas caras e fontes de dados exato-alvo, mas isso não é uma exigência absoluta por qualquer meio.

Muitos dos recursos apresentados aqui são disponibilizados como parte da contribuição da organização doando à movimento aberto - um movimento que defende a livre troca de propriedade intelectual nas áreas de arte, educação, software, dados e tecnologia, entre outros. Três componentes principais do movimento aberto são dados abertos, open source, e conhecimento aberto.

dados abertos iniciativas baseiam-se na premissa de que os dados devem ser feitas livremente e abertamente disponível para o público em geral para utilização, reutilização e republicação. Dados abertos pode ser emitido sob algum tipo de exigência de licenciamento aberto, mas é geralmente livre de restrições de direitos autorais e patentes.

o Código aberto movimento do software começou no final dos anos 1970 e é baseado na premissa de que os usuários do software deve ser capaz de compartilhar livremente software. O movimento de código aberto também defende que os desenvolvedores devem ser autorizados a construir open-source derivado ou obras de propriedade sobre ela.

Por último, o conhecimento aberto movimento tem se posicionado no topo de outros movimentos abertos e dá a ideia de que o conhecimento em todas as formas devem ser feitas livre e abertamente disponível para o público em geral. O movimento conhecimento aberto também defende que as pessoas devem ser livres para usar, reutilizar, compartilhar e publicar esse conhecimento.

de dados aberto acesso através Conhecimento Aberto

O maior defensor do movimento de conhecimento aberto é a organização sem fins lucrativos, Conhecimento aberto. Esta organização define o conhecimento aberto como os insights úteis, significativos e valiosos derivados de fontes de dados abertos. O site Conhecimento Aberto é uma fonte excelente para reuniões e colaborar com dados abertos e entusiastas da ciência de dados.

Encontrar dados livres no Banco Mundial Open Data

Banco Mundial Open Data é uma fonte extremamente robusto de dados e dados demográficos sobre as nações em desenvolvimento. Os tópicos incluem a saúde, infra-estrutura, a pobreza, o comércio, o desenvolvimento urbano, agricultura e desenvolvimento rural, e do ambiente, entre muitos outros. Os dados sobre as métricas de indicadores do Banco Mundial também são disponibilizados ao público. Aqueles são uma ótima base para fazer uma análise comparativa entre as nações em desenvolvimento.

Fonte livre dados espaciais de OpenStreetMap

OpenStreetMap (OSM) é uma excelente fonte de dados geográficos, abertos gratuitos que você pode usar para analisar dados em Sistemas de Informação Geográfica (GIS) ou para o desenvolvimento de aplicações web location-aware. No A página OSM Export você pode baixar todo o banco de dados (enorme) de dados espaciais OSM. (Para baixar extrai dados de apenas os continentes, países e cidades que deseja, certifique-se de usar os Geofabrik downloads Option você também pode usar Extratos Metro do OSM recurso para fazer download de dados metropolitana sobre as maiores cidades do mundo.)

Coletar dados do governo livre de Data.gov

Data.gov é uma tremenda fonte, se você está à procura de dados gratuitos em negócios, meio ambiente, saúde pública, e pesquisa e desenvolvimento (RD) nos EUA. Data.gov é incrível, porque, além de conjuntos de dados tabulares padrão, também oferece fontes de dados espaciais que você pode baixar e usar para análise em GIS.

Calcule com as línguas nascidas do movimento open source

ciência dados linguagens de programação amigáveis, como R e pitão são de código aberto e livre para usar para análise ou desenvolvimento de aplicações. Ambas as línguas são ideais para análise de dados e visualização. R tem a vantagem de oferecer capacidades mais sofisticadas de visualização de estatísticas e dados, enquanto a vantagem do Python é que ele é muito mais fácil de aprender do que R.

Analisar dados de graça com a aplicação Dados Aplicada

Se você não quiser usar o código para escrever rotinas personalizadas para sua análise, então você pode optar por usar um aplicativo baseado na web livre em vez. dados Aplicada oferece funcionalidade robusta para a criação de tabelas dinâmicas, mapas de árvores, e as previsões de previsão. Ele também tem recursos que você pode usar para correlação, outlier, e análise de associação.

Fazer mapas com Geocommons

Geocommons é um aplicativo de mapeamento gratuito baseado na web. Sua característica mais marcante é a sua integração de gráficos relacionados e funcionalidade Google Earth. Com Geocommons, você pode fazer o upload de dados e automaticamente geocodificar os seus identificadores. Você tem a opção de visualização de dados usando um chloropleth (para o qual você pode inventar uma série de esquemas automatizados ou manuais para colorir) ou visualização de dados usando bolhas e marcadores (como bandeiras e gotículas que transmitem dados por tamanho ou por cor).

Geocommons também permite que você inserir um gráfico simples linha, gráfico de barras gráfico de colunas ou gráfico de dispersão (geralmente não algo que é fácil de fazer em um mapa) para mostrar a relação entre duas variáveis ​​quantitativas. Finalmente, Geocommons integra marcador ou área categórica visualizações com o Google Earth para que você possa ver seus dados espaciais em uma rotativo representação esférica, zoom-capazes do planeta. (Note-se que, a fim de usar este recurso, você precisa instalar o plug-in do Google Earth.)

Fazer mapas com Datawrapper

Datawrapper é uma ferramenta gratuita, de código aberto que você pode usar para criar visualizações simples. Ele tem duas características não encontradas em outros lugares - um gráfico de dados Eleição Donut que se assemelha a disposição de várias casas do parlamento ou congressos, e uma funcionalidade de realce fácil que você pode usar para enfatizar núcleo significado de uma visualização de dados, destacando apenas um ponto de dados em um gráfico . Datawrapper oferece as seguintes opções de tipo de dados gráfico: Os gráficos de colunas, gráficos de pizza, gráficos de rosca, gráficos de rosca eleição, mapas e gráficos de barras.

Faça infográficos interativos frescos com Infoactive.co

Infoactive.co é um baixo custo, aplicativo de design baseado na web de visualização de dados. Ele oferece um modelo atraente com destaque para aqueles minimalista # 147-design plano # 148- texto e visualizações que são toda a raiva estes dias. A aplicação tem capacidade para adicionar eventos de mouse-over, filtragem de dados, e até mesmo conexões de dados a Live-atualização, fontes online, como planilhas do Google.

Ligar o seu Infoactive.co infográfico com os dados que está armazenado em uma planilha do Google podem produzir resultados dinâmicos. Toda vez que a planilha é atualizado, a visualização Infoactive é atualizado ao mesmo tempo.

Infoactive.co oferece muitas opções em Tipo de gráfico de dados - incluindo gráficos de colunas, gráficos de pizza, gráficos de filhós, ícones percentuais, gráficos de linha, gráficos de área, mapas e gráficos de barras. Além disso, assim como um pequeno detalhe sobre Infoactive.co - o arranque nasceu como resultado de uma campanha Kickstarter sucesso !! Isso só serve para mostrar que você nunca pode realmente prever de onde o sucesso vai nascer.

Gráfico com ChartBuilder

ChartBuilder é incrível, porque é ainda mais fácil para construir gráficos na aplicação ChartBuilder do que no Microsoft Excel. Além do mais, gráficos ChartBuilder pode ser mais atraente e com aparência profissional do que aqueles projetados na aplicação padrão do Excel. Você pode usar ChartBuilder para livre para fazer gráficos de linha, gráficos de colunas, gráficos de barras e gráficos de dispersão.

Além do mais, o aplicativo permite que você faça operações de copiar e colar fácil importar seus dados e, em seguida, gerar resultados utilizáveis ​​em meros segundos. Embora o site não oferece capacidades de armazenamento de dados, suas visualizações podem ser baixados com um único clique, tanto como imagens bitmap ou gráficos SVG vetor.

menu