User Tools

Site Tools


Sidebar

Olá! Esta é a wiki onde vamos anotando e organizando as nossas ideias, projectos e planos.

O registo está fechado por causa do spam. Para criar conta escreve-nos para bomdia [AT] transparenciahackday.org

Wiki

recursos

Ainda estamos a arrumar esta página e a decidir a melhor estrutura. Não demoramos.

Fontes de dados em Portugal

Outras fontes de dados com interesse

Ferramentas

PDF: análise e manipulação

  • PDFMiner (Python), para extrair sem erros o texto dos PDF, a fim de o converter para estruturas JSON. Preserva a maior parte dos atributos do PDF (fontes, imagens), mas perde outros (links)
  • PDFQuery (Python), permite procurar elementos na página com selectores tipo JQuery
  • iText (Java/C#)
  • PDF.js (Javascript), para extrair tabelas
  • PDFBox (Java/C#)
  • Tabula (web-app), para extrair tabelas de PDFs para CSV ou folha de cálculo do Excel

Scraping

Análise de dados/Data mining

Visualização de dados

Livros sobre visualização

Web e ferramentas no browser

Ferramentas gerais para trabalhar com dados

Processamento natural de linguagem (NLP)

Mapas e GIS

Crowdsourcing

  • CrowdCrafting e PyBossa, para trabalhar com contributos externos de forma a resolver tarefas complexas
  • Ushahidi, plataforma para mapeamento de ocorrências reportadas

Software para portais de dados

  • CKAN, plataforma para organização, gestão e publicação de datasets, feito pela Open Knowledge Foundation
  • Panda Project, uma ferramenta para organizar coleções de datasets e documentos

Guias e recursos online

CouchDB

recursos.txt · Last modified: 2017/03/07 14:37 by rlafuente