Open Data Day: está quase! Anda daí

Nós é mais dados! Dia 4 de março juntamo-nos à celebração mundial dos Dados Abertos para mais um sábado em cheio. O Open Data Day é uma iniciativa da Open Knowledge International, um dia por ano para mostrar, ensinar e levar mais além a agenda dos dados abertos.

A Open Knowledge Portugal, em colaboração com o Date With Data e o Transparência Hackday, organiza o Open Data Day 2017 no Porto. Um dia de actividades, apresentações e convívio sobre o tema dos dados, aberto a toda a gente.

O Open Data Day Porto 2017 está organizado em duas partes. A manhã é dedicada às mãos na massa: o Jorge Gustavo Rocha, membro do Open Street Map (OSM), vai-nos orientar numa mapping party pela cidade!

O Open Street Map é um mapa mundial colaborativo e aberto, tem como missão ser um repositório aberto de dados geográficos a nível mundial. Vamos juntos perceber melhor como funciona e como podemos contribuir para o projeto. Os dados que reunirmos durante a manhã serão o nosso contributo para tornar o Open Street Map um recurso ainda mais precioso. Para participar, basta inscrever-se e trazer um telemóvel com GPS ;)

A tarde do Open Data Day é voltada para a discussão de projetos na área dos Dados Abertos. A equipa da OKI Portugal terá as honras de abrir a tarde com uma introdução aos Dados Abertos: o que são, qual a sua importância e como contribuir para este ecossistema. Seguem-se as apresentações de Jorge Gustavo Rocha sobre o Open Street Map, de João Tremoceiro sobre os dados abertos na Câmara Municipal de Lisboa; e da Wikimedia Portugal sobre o papel dos dados abertos na Wikipedia e outros projetos da organização.

Queres festejar connosco? Inscreve-te aqui.

Podes ler sobre o ODD 2016 e o 2015, e saber como foi.

Sábado, 4 de março de 2017 no UPTEC PINC, Porto:

Manhã — Mãos na massa
09:45—10:00: Receção & café
10:00—12:30: Mapping Party: vamos mapear a cidade com o Open Street Map Portugal
Para esta atividade será necessário trazer portátil e smartphone (vamos usar o GPS, sem necessidade de ligação à internet ;)

Tarde — Talks
14:00—14:25: Receção & café
14:30—14:40: Sobre o Open Data Day – Open Knowledge Portugal
14:45—15:20: Open Street Map – Jorge Gustavo Rocha (OSM PT)
15:25—16:00: Dados abertos em Lisboa – João Tremoceiro (Câmara Municipal de Lisboa)
16:05—16:40: Wikimedia Portugal
16:45—17:20: Conversa aberta
17:30—18:00: Café & networking

O Open Data Day 2017 é organizado voluntariamente pela equipa da OKFN Portugal e pelos membros do Transparência Hackday Portugal. Um obrigada a todos os oradores que gentilmente aceitaram o nosso convite para participar. Agradecemos também o apoio incansável da UPTEC PINC por generosamente ceder o seu espaço e infraestrutura para o evento.

O cartaz do Open Data Day 2017 foi desenhado por Joana Ventura Lopes.

Open Data Day Portugal 2016

CIMG2871 No dia 5 de março juntámo-nos pela quinta vez às comemorações do Dia Mundial dos Dados Abertos. Foi um Date With Data especial, estruturado em duas partes: uma sessão prática durante a manhã, e uma sessão de apresentações e conversa durante a tarde. Entre atividades, aproveitámos para fazer pausas de café e partilhar um almoço com todos os participantes. Para fazer isto acontecer, tivemos o apoio precioso da Open Knowledge e do seu generoso programa de micro-bolsas, bem como da UPTEC que mais uma vez aceitou albergar as nossas aventuras.

ODD 2016 IMG_0189 ODD 2016 CIMG2889 ODD 2016 CIMG2868

Maratona de transcrição:
English as she is spoke

ODD 2016 CIMG2881

Como sempre procurámos interessar-nos por tudo o que é livre e aberto, não nos ficamos pelas bases de dados; os livros e o conhecimento aberto são áreas que sempre gostámos e já algumas vezes trabalhámos. Assim, a proposta da manhã era arregaçar as mangas e trabalhar numa transcrição de uma obra no domínio público para, no final, re-publicá-la num formato aberto e estruturado.

A obra proposta foi o English As She Is Spoke, um guia de conversação português-inglês, escrito no séc. XIX por alguém que não tinha noção de inglês — o que o torna um artefacto divertidíssimo! Juntámo-nos e organizámo-nos para dividir tarefas e assumir a missão de transcrever cada página, sob a batuta do Jan Berkel, que tratou de montar toda a estrutura necessária para facilitar o nosso trabalho colaborativo. Ao longo da manhã, partilhámos dicas e frustrações num Piratepad coletivo, enquanto exercitámos furiosamente os teclados a transcrever traduções ridículas a partir das imagens do livro original, passando-as para o Wikisource.

ODD 2016 IMG_0195 ODD 2016 IMG_0197 ODD 2016 IMG_0201 ODD 2016 CIMG2882 ODD 2016 CIMG2884 ODD 2016 IMG_0203

No final da maratona, ainda há algumas páginas para libertar, mas a boa disposição estava manifesta pelas notas colocadas no Piratepad, e pelos risinhos intermitentes de cada vez que alguém encontrava uma tradução particularmente brilhante. Ainda assim, conseguimos transcrever por completo o capítulo sobre Idiotismos e Provérbios, mais de metade das páginas de vocabulário (as mais morosas) e fizemos revisão das páginas terminadas. Ficou no ar a vontade de repetir a dose para continuar o esforço de transcrever completamente este delicioso compêndio.

Os dados e o conhecimento aberto:
Dados.gov.pt e Creative Commons

ODD 2016 CIMG2896

A tarde guardava-nos um momento de partilha e conversa, tornada especialmente esclarecedora pela generosa presença de dois convidados que vieram de Lisboa para se juntarem ao Open Data Day: André Lapa e Teresa Nobre.

ODD 2016 IMG_0219 ODD 2016 IMG_0215 ODD 2016 CIMG2901

A seguir a uma breve explicação do que significa isso do aberto, recorrendo à Open Definition, tomou a palavra o primeiro convidado da tarde — André Lapa, representante da Agência de Modernização Administrativa (AMA), a entidade responsável pelo precioso portal de dados públicos Dados.gov.pt.

A missão da AMA, no que toca aos dados públicos, é conseguir navegar os silos da administração pública para obter, limpar e publicar inúmeros datasets sob licenças abertas. São dados de todo o género sobre as várias facetas do país, desde informação estatística até resultados eleitorais. Foram-nos mostrados os vários obstáculos encontrados neste esforço de tornar a informação pública legível e reutilizável.

André Lapa trouxe-nos também um vislumbre dos planos para um Dados.gov.pt 2.0: feito em código 100% aberto, será um portal orientado para a interoperabilidade com as plataformas de instituições europeias; há também a vontade de integrar um dos desenvolvimentos mais promissores dos últimos anos no meio dos dados abertos: linked data! É um tema que já tínhamos aflorado no Open Data Day 2015 e que procura alcançar uma organização semântica das várias bases de dados, permitindo a construção de ferramentas poderosas que permitam determinar relações entre várias fontes de informação.

A intervenção ainda nos guardou novidades como o lançamento do novo Portal de dados de Saúde e a preparação de mais portais sectoriais de Dados Abertos.

ODD 2016 IMG_0217

Nesse momento a palavra passou para Teresa Nobre, representante da Creative Commons Portugal, que nos veio iluminar sobre os complicadíssimos pormenores do direito de autor que rodeiam o tema dos dados abertos.

Foi articulada a forma como o direito de autor protege ou não os dados e as bases de dados. Fez-se a distinção entre um facto — que não é, em si, protegido pelo direito de autor — e uma apresentação, selecção ou organização de factos. O direito de autor protege expressões criativas, pelo que uma determinada apresentação de dados (e.g. um diagrama, um mapa, uma tabela) ou uma determinada compilação de dados podem estar protegidas por direito de autor. Nesse caso, os meros factos e informações que estão contidos nessa apresentação ou compilação permanecem livres, ie. qualquer pessoa pode utilizá-los desde que os apresente sob uma forma diferente. Só assim não será se os dados estiverem contidos numa base de dados protegida pelo direito sui generis do produtor da base de dados. Este — previsto numa diretiva europeia criada para defender o investimento substancial (quantitativo ou qualitativo) dos produtores de datasets na obtenção, verificação ou apresentação dos dados — confere ao seu titular o poder de impedir que pessoas não autorizadas extraiam ou reutilizem a totalidade ou uma parte substancial dos conteúdos das bases de dados.

Existem critérios específicos que determinam quais bases de dados podem estar protegidas por este direito sui generis, e muitas vezes só em tribunal se consegue esclarecer se uma certa base de dados é abrangida ou não.

Este direito não impede a extracção ou reutilização de partes não substanciais; apenas impede a extracção/reutilização de partes substanciais. Por outro lado, existem também excepções a este direito, por via das quais é possível extrair ou reutilizar uma parte substancial do conteúdo da base de dados para determinados fins (didáticos, científicos, e privados — mas neste último caso apenas quanto a bases de dados não electrónicas). Nesta altura, algumas pessoas do público mostraram curiosidade sobre os pormenores — e se fôssemos juntando partes não substanciais para re-construir o dataset? E se fossem pessoas diferentes a obter cada parte? Foi esclarecido que o direito impede a extracção/reutilização sistemáticas de partes não substanciais.

Ficou também claro que se encontrarmos online um dataset contendo informação pública, não significa que possamos presumir que seja aberto — só se a sua licença de uso o deixar evidente. E não existem formas simples de interpretar à cláusula do uso não substancial: a noção de substancial não está claramente definida!

ODD 2016 CIMG2894 ODD 2016 IMG_0212 ODD 2016 CIMG2900 ODD 2016 IMG_0208

Um exemplo positivo de licenças explicitamente abertas é precisamente o Dados.gov.pt, que publica os seus datasets segundo licenças Creative Commons Atribuição (BY).

Ainda houve tempo para aflorar assuntos como os direitos morais, a partilha de ficheiros, as licenças Creative Commons Zero, e a existência de licenças Creative Commons que não são abertas, como é o caso das que incluem a cláusula NonCommercial.

As intervenções foram curtas para amplificarmos o espaço de conversa, e do público vieram imediatamente questões. Apareceu o tema do uso justo (Fair Use) e das diferenças entre o modelo norte-americano e o europeu; os direitos morais e a sua interação com as licenças Creative Commons; ou qual a melhor forma de contribuir para os esforços da AMA.

Aproximámo-nos do final com uma última pergunta: que tácticas e métodos podemos usar para conseguir explicar de uma forma simples a importância da partilha de dados públicos?

Teresa Nobre articulou a estratégia utilizada para convencer entidades de arquivo como os museus ou bibliotecas a abrirem as suas colecções (a discussão, nesses casos, em que as obras contidas nas colecções foram criadas por outros, que não as próprias entidades, passa por sensibilizar as entidades para o facto de não lhes caber a elas controlar os usos que possam ser feitas das obras, uma vez caídas no domínio público); no entanto, este argumento não pode ser utilizado quando estamos a falar de obras ainda não caídas no domínio público. Há grandes obstáculos em conseguir convencer outras entidades a abrir as suas bases de dados, bem como sensibilizá-las para as implicações do direito de autor. E no caso dos dados é um desafio maior, já que não é suficiente uma publicação parcial.

André Lapa defendeu o recurso ao argumento cívico e de transparência: os dados públicos precisam de estar disponíveis porque é um direito dos cidadãos. Muitas vezes as instituições não sabem os dados que têm, ou a importância e potencial que a partilha desses dados pode ter. E enfatizou o fator humano: importa contactar as instituições e explicar para que se pretende usar os dados; com exemplos concretos é bem mais fácil. Foi ainda mencionada uma lista de argumentos a favor e contra os dados abertos presente na Wikipédia.

ODD 2016 CIMG2908

Depois de uma pausa focámos dois projectos da Open Knowledge: a School of Data, apresentada pela Marta Pinto, e o Global Open Data Index, apresentado pela Ana Isabel Carvalho e Ricardo Lafuente. Ambos os projetos são direccionados para a o envolvimento e participação da sociedade civil no movimento pelos dados abertos. A School of Data assume um papel educativo, fornecendo tutoriais e materiais sobre ferramentas para trabalhar com dados e suas aplicações. O Global Open Data Index é um indicador anual do estado dos dados abertos em cada país, a nível mundial. Este esforço visa promover a revisão dos datasets públicos que deveriam estar disponíveis e publicados, segundo os crítérios rigorosos da definição de dados abertos.

ODD 2016 IMG_0222

Terminado o plano de atividades, fechámos o Open Data Day com mais um longo momento de conversa, bolachas, networking e boa disposição. Já a pensar no ODD2017, voltaremos a encontrar-nos no próximo Date With Data, no dia 9 de abril!

Fotografias de Luís Oliveira, Ana Carvalho e Ricardo Lafuente.


Open Data Day Portugal 2016

On March 5th, we got together for the fifth time to join the global commemorations of the Open Data Day. We hosted a special Date With Data event, divided into two moments: a practical session in the morning, and a talks and debates session in the afternoon. Between activities, we made the most of coffee breaks and shared a lunch among all participants. In order to make this happen, we benefitted from the precious support of Open Knowledge and their generous micro-grant program, as well as UPTEC who, once again, had their doors open to host the Open Data Day activities.

Transcriptathon:
English As She Is Spoke

Since we were always interested in anything that’s free and open, we’re not always tinkering with databases: books and open knowledge are fields which we love and have explored previously. Our proposal for the morning was thus a hands-on moment to work on transcribing a public domain work in order to re-publish it in an open and structured format.

The proposed work was English As She Is Spoke, a Portuguese-English conversation guide written in the 19th century by someone who had no knowledge of English — which could only make it an hilarious artifact. We got together and organised ourselves to assign tasks and take on the mission to transcribe each page, headed by Jan Berkel who had already taken up the effort to set up all the necessary structure to facilitate collaborative endeavours. During the morning, we shared tips and frustrations inside a collective Piratepad, while our keyboards took a beating as we transcribed ridiculous translations from the original book scans, placing them on Wikisource.

At the end of the transcriptathon, we’re still some pages to go, but the good mood was demonstrated in the silly notes peppered in the Piratepad, and intermittent giggles were regularly heard when someone had found a particularly brilliant translation. Still, we managed to completely transcribe the chapter on Idiotisms and Proverbs, along with more than half of the vocabulary pages (the hardest) and we revised completed pages. There was a clear collective intent to go for it again and finish the effort of transcribing this wonderful tome.

Open data and open knowledge:
Dados.gov.pt and Creative Commons

For the afternoon, we had set up a moment for sharing and talking, made especially enlightening by the generous presence of two guests who came all the way from Lisbon to join us: André Lapa and Teresa Nobre.

After a brief explanation about the meaning of open and the Open Definition, the mic was passed to our first guest: André Lapa, representing the Agency for Administrative Modernisation (AMA), the entity responsible for the official Portuguese public data portal, Dados.gov.pt.

AMA’s mission when it comes to public data is to navigate the silos of public administration in order to obtain, clean and publish several datasets under open licenses. At Dados.gov.pt, we can find data related to many facets of the country, from statistical information to electoral results. Many of the obstacles found in this effort of liberating public information were explained, as well as the importance of providing information in a way that makes it readily legible and reusable.

André Lapa also gave us a peek at the future plans for Dados.gov.pt 2.0: completely based on free and open source code, it will be a portal guided towards interoperability with European data platforms; there is also the intent to integrate one of the most promising developments in data technology in recent years: linked data! It’s a subject that we had already approached in Open Data Day 2015 and which aims to reach a semantic organisation of many distinct datasets, allowing for the development of powerful tools that can establish relationships between many different data sources.

It wouldn’t be over before a few interesting bits of news, such as the launch of the new Health Data Portal and the preparation of more domain-specific Open Data portals.

The mic then switched over to Teresa Nobre, representative of Creative Commons Portugal, who came to enlighten us about the complicated details of copyright in open data.

We got started with the ways that copyright can or cannot protect data and databases. There is a clear distinction between a fact — which isn’t by itself protectable by copyright — and a presentation, selection or compilation of facts. Copyright protects creative expression, so a specific organisation of data (e.g. diagrams, maps, tables) can be subject to copyright protection. In that case, simple facts and information inside that presentation remain free and reusable, as long as the reuse is materialised in a different form or shape. However, it’s an altogether different situation if the data are contained in a database protected by the sui generis database right. This right gives the rightholder the power to stop unauthorised people from extracting or reusing the full or partial contents of the database in question.

There exist specific criteria to determine which databases can be protected by this database right; since they’re not clearly defined, in many cases one would require the opinion of a court to be sure of whether a specific database is covered by this right or not.

The database right does not prevent the extraction or reuse of non-substantial parts of the database. On the other hand, there also exist exceptions to this right in which reuse is permitted (e.g. education or science). At this point, there was interest from the audience in the details — what if we put together non-substantial parts in order to rebuild the dataset? What if different people would acquire different parts?

It was clear that the database right does not allow for this kind of loophole. It was also clarified that if we find a dataset containing public information, it doesn’t mean we can safely presume it is open — only if its usage license makes that evident. And there aren’t simple ways to interpret the non-substantial use clause: the notion of “substantial” is not strictly defined!

A great example of explicitly open licensing is indeed Dados.gov.pt, who publish their datasets under Creative Commons Attribution licenses (CC-BY).

There was still time to approach issues like moral rights, file sharing, CC Zero licenses and the existence of non-open Creative Commons licenses, such as the ones with the NonCommercial clause.

The talks were kept short in order to maximise the space for debate, and questions started flowing from the audience. We touched the subjects of fair use and the differences between the USA and European models; moral rights and how they interact with CC licenses; and the best ways to contribute to AMA’s efforts.

We got closer to the end with a last question: which tactics and methods can we use in order to effectively and concisely explain the importance of public data sharing?

Teresa Nobre articulated the strategy used to convince archiving entities such as museums or libraries to open their collections, the main argument being that they don’t control the works in public domain. However, it’s harder when addressing works not yet in the public domain. There are many obstacles involved in persuading other entities to open their databases, as well as getting them to understand the intricacies of copyright. And in the case of data it’s an even bigger challenge, since publishing only parts of the data is not enough.

André Lapa put forward a defense of the civic and transparency arguments: public data needs to be available because it’s a citizen right. Often, institutions do not even know the data that they own, or the importante and potential that sharing this data can have. He also emphasised the human factor: one should endeavour to contact institutions and explain the purpose for reusing their data; with specific use cases, it’s much easier to convince them.

After a break, we looked into two projects by Open Knowledge: Marta Pinto showcased School of Data, while Ana Isabel Carvalho and Ricardo Lafuente presented the Global Open Data Index. Both projects are geared towards involvement and participation from civil society in the open data movement. School of Data has an educational role, providing tutorials and resources for working with data and building effective projects. The Global Open Data Index is an annual indicator of the state of open public data in each country worldwide. This effort aims to promote awareness of missing key datasets in each country, according to the strict guidelines of the Open Definition.

With the day programme wrapped up, we closed the Open Data Day festivities with another long moment of conversation, cookies, networking and positive mood. Already thinking of ODD2017, we’ll see each other again in the next Date With Data event, on April 9th!

Photos by Luís Oliveira, Ana Carvalho e Ricardo Lafuente.

Vem aí o Open Data Day!

Sábado, 5 de março, comemoramos o quinto Open Data Day organizado na cidade do Porto. Será uma edição especial do Date With Data.

opendataday-2016_updated

O Open Data Day é um evento internacional dedicado ao ativismo pelos Dados Abertos. No mesmo dia, em vários locais do mundo, coletivos e organizações dedicados ao trabalho nesta área juntam-se para assinalar a data com iniciativas locais. O ano de 2016 conta com mais de 190 eventos.

No Porto, o Date With Data celebra o Open Data Day no Pavilhão Jardim do UPTEC PINC (Praça Coronel Pacheco). O programa do dia está organizado assim:

Sessão de trabalho de manhã

10:00 – 10:25: Receção e café
10:30 – 10:40: Sobre o Open Data Day e o Date with Data
10:45 – 12:30: Maratona de transcrição: English As She Is Spoke (Traz o teu computador!)
12:30 – 14:00: Almoço


Sessão com oradores à tarde

14:00 – 14:25: Receção e café
14:30 – 14:35: Sobre o Open Data Day
14:35 – 14:55: Dados abertos em Portugal: André Lapa (Dados.Gov)
15:00 – 15:20: Licenças abertas: Teresa Nobre (Creative Commons Portugal)
15:25 – 15:45: Momento de mesas redondas entre público e oradores
15:50 – 16:10: pausa para café
16:15 – 16:30: Ana Isabel Carvalho e Ricardo Lafuente – Global Open Data Index
16:35 – 16:50: Marta Pinto – O que é a School of Data?
16:50 – 16:55: Pausa para café e conversa
17:00 – Fim

Para participar inscreve-te aqui.

A organização deste evento tem o apoio da Open Knowledge e UPTEC PINC.

Contamos contigo para mais um Open Data Day! Queres saber como foi no ano passado? Vê aqui.

Open Data Day 2015: o rescaldo!

[English version below!]

No dia 21 de fevereiro de 2015, assinalaram-se por todo o mundo eventos dedicados ao Open Data Day, um dia para se falar de dados abertos. Em Portugal tratámos de marcar este dia com um hackday especial, e partilhamos agora o relato do que se passou.

Workshop de Linked Data

Para abrir o dia, começámos com o workshop dedicado ao tema linked data (dados interligados), orientado pelo João Pequenão. Os dados interligados foram apresentados como o próximo nível da agenda open data, dando direção e contexto aos dados isolados. O tiro de partida foi dado na forma de um brainstorm coletivo para encontrar respostas para duas questões:

  • Qual é o panorama nos Dados Abertos desde 2000 até hoje? E nos Dados em geral?
  • O que gostávamos que acontecesse nos próximos 15 anos?

Em grupos, os post-its saíram a voar para os flipboards com ideias, sugestões e palpites sobre o que existe e sobre o que aí vem. As implicações do tema “dados” ramificaram-se para assuntos como a privacidade online, o envolvimento cidadão na governação, o estonteante ritmo da evolução tecnológica e, sobretudo, uma incerteza entusiasmada quanto a um futuro que se sabe promissor mas, também, repleto de dilemas.

Daí, partiu-se para uma concretização sobre a natureza, valor e potencial dos dados interligados. Exploraram-se as tecnologias específicas que vão dar que falar nos próximos tempos, com uma introdução teórica ao RDF e exercícios práticos na forma de um registo pessoal em formato FOAF e algumas experiências com SPARQL.

Finalmente, com os conhecimentos obtidos, voltou-se ao domínio da especulação produtiva com o desafio de responder, novamente em grupos, a quatro cenários onde os dados interligados poderão ser um elemento potenciador: a gestão e compreensão da afluência às unidades de urgência médica, o poder de fiscalização cidadã dos dados públicos, a idealização de novos planos de negócio para PME, e a forma possível para um portal europeu de dados abertos em 2020.

Deste brainstorm surgiram pistas sobre o potencial de recolha e extração de significado de dados que possa amplificar a eficiência de serviços públicos, a importância de formatos standard, ou as possibilidades dadas pelo contexto fornecido pela estrutura intrínseca dos dados interligados.

Os slides do workshop estão disponíveis! (PDF)

Totonome

O Tiago Vieira, coder residente do Transparência Hackday, abriu a tarde para mostrar a mais recente aventura do nosso coletivo com bases de dados onomásticas, materializada no projeto Totonome — um jogo para testar os palpites de cada pessoa sobre que nomes foram ou não aceites pelo IRN como aceitáveis para dar a um recém-nascido em Portugal. Os slides desta apresentação foram postos à disposição pelo Tiago.

Foi explicada a maior dificuldade no arranque de projetos de apps ou sites que usam informação pública: encontrar e processar os datasets de forma a estarem aptos a serem integrados em aplicações. Neste caso, o dataset dos nomes aprovados apenas está disponível para o ano de 2014, em formato PDF. Este formato não é prático para bases de dados, pelo que se usou o Tabula, o CSVkit e outras ferramentas para processar, filtrar e organizar os dados para que se pudesse concretizar o jogo que tínhamos em mente.

A partir daí, foi criado um protótipo em 3 horas com recurso ao AngularJS para testar a ideia que parecia mais adequada para uma primeira experiência: um jogo que nos mostra dois nomes, um que foi aceite no IRN e outro que não foi. O objetivo é encontrar o nome que foi aceite.

2015-03-01-180857_1440x900_scrot

Tal como demonstrado pelo Tiago, o jogo é surpreendentemente envolvente; bastou uma pequena demo para nos vermos todos a mandar os nossos palpites num jogo coletivo de adivinhação sobre quais eram os nomes mais plausíveis.

Foram também enumerados os próximos passos para o Totonome: assentar num interface simples, bonito e funcional; melhorar o feedback visual dos resultados, que não é ainda ideal; e facilitar a partilha dos resultados em redes sociais.

Eduardo Nunes

O Eduardo Nunes é um designer baseado em Coimbra, dividindo a sua atenção pela docência na Universidade de Coimbra e pela atividade como designer cross-media.

Foi-nos dada uma visão geral do percurso do Eduardo pelos ofícios gráficos. No seu percurso, encontrámos experiências de visualização do tempo e dos hábitos, numa manifestação premonitória do quantified self.

88days

A seguir, vimos alguns exemplos da vertente de animação 3D. Foi mostrada uma fantástica visualização do Orçamento de Estado, num estilo idiossincrático e revelador.

E de seguida, o projeto responsável pelo convite que fizemos ao Eduardo para nos mostrar o seu trabalho no Open Data Day: a sua animação dedicada ao tema Saúde Mental em Portugal.

Finalmente, debruçámo-nos sobre o Dizer Design, um esforço de recolha e compreensão antropológica da demografia profissional dos designers em Portugal. Este site constituiu uma experiência de crowdsourcing da informação que não tardou em proporcionar resultados, com centenas de contributos por todo o país.

No entanto, evidenciaram-se os desafios de sustentar projetos independentes como o Dizer Design, com vários custos que são frequentemente invisíveis para o olhar convencional, como os custos de aluguer dos servidores ou o esforço de manutenção e atualização das plataformas ao longo do tempo. Este assunto proporcionou uma interessada discussão, tornando-se claro que os dilemas à volta da construção de plataformas independentes são comuns a várias áreas de trabalho.

Central de Dados

Na última apresentação do dia, a Ana Isabel Carvalho e o Ricardo Lafuente mostraram o estado atual do seu trabalho na Central de Dados, uma plataforma de distribuição de datasets em formatos standard.

A Central de Dados constitui uma resposta ao problema da dispersão que vivemos nos Hackdays: temos vários datasets, mas alguns são publicados em repositórios Github, outros em dropboxes, outros ainda passados à mão com pen drives, etc. Fazia-nos falta um local central e uma forma comum de formatar e publicar os datasets. Aplicações web como o CKAN seriam a resposta a este problema, mas elas também vêm com alguma bagagem: é necessário mantê-las debaixo de olho e fazer manutenção regular, o que exige tempo e recursos que não temos.

2015-03-01-181519_1440x900_scrot

A Central de Dados é a solução proposta para o caso específico do Transparência Hackday. Recorrendo ao formato data package (em desenvolvimento pela Open Knowledge), os datasets criados no Transparência Hackday são publicados de forma documentada e organizada, servindo a Central de Dados como portal web para facilitar o acesso. Assim, temos uma plataforma que nos permite aceder facilmente aos datasets que tratámos para com eles poder construir aplicações e plataformas que demonstrem o seu valor. Ao mesmo tempo, qualquer pessoa pode igualmente beneficiar da conveniência de ter os datasets atualizados e em formatos documentados, bem como criar as suas apps e outras experiências usando diretamente os datasets fornecidos na Central.

Conclusão

O dia foi pontuado com momentos de entusiasmado networking por entre coffee breaks e almoço — apercebemo-nos da importância destes momentos na condução de um evento aberto ao público, uma vez que um dos objetivos principais era aproximar e pôr em contato várias pessoas interessadas pelo tema dos dados abertos.

Podemos afirmar que foi um sucesso: com a maior participação de um hackday até ao momento: 23 pessoas, com mais de 1/3 de mulheres. Este sucesso só foi alcançável graças ao fundamental e generoso apoio da Open Knowledge, da ADDICT e da UPTEC. Faz assim sentido pontuar este relato com um profundo agradecimento a estas entidades, bem como a todas as pessoas que participaram no Open Data Day, para juntos integrarmos a nossa vontade comum de trocar impressões e opiniões sobre o que foi e pode ser feito para avançar as agendas dos dados abertos, tecnologia livre e cidadania envolvida.

Todas as fotos do dia (incluindo as deste post) foram feitas pela Mariana Santos e estão disponíveis no Flickr do Transparência Hackday.

E o próximo hackday, em que vamos prosseguir com as pontas soltas deixadas neste dia, será já a 14 de março — marca na agenda!


English version

On 21 February 2015, several open data initiatives were held around the world to celebrate Open Data Day, a day dedicated to all uses and potential of open data. In Portugal, we made the most of this day in a special hackday; here are our notes of all the activities.

Linked Data Workshop

We started the day with a workshop around the subject of linked data, led by João Pequenão. Linked data were introduced as the next level of the open data agenda, providing context and direction to isolated data. The starting point was a collective brainstorm to find answers for two questions:

  • What does the open data landscape look like since 2000 until today?
  • What will we see happen in the next 15 years?

Divided in groups, people got the post-its flying towards the flipboards with ideas, hunches and insights about what’s there and what’s coming. The implications of the broad theme of “data” branched to issues such as online privacy, citizen engagement in governance, the dizzying pace of technological progress and, overall, an excited uncertainty about a future that looks both promising and packed with dilemmas.

From there, we went on to a more specific account of the nature, value and potential of linked data. This was followed by an exposé of existing technologies with an introduction to RDF and practical exercises: a personal FOAF record and a set of SPARQL experiments.

Finally, with the knowledge obtained, we went back to productive speculation with the challenge of providing answers, again in groups, to 4 scenarios where linked data might help:

  • understanding and managing the turnout in emergency health services
  • the ability of citizens to oversee public data policy
  • possible new business models for SMEs
  • what a next-generation (2020) EU data portal would look like

From this brainstorm, we got interesting insights, discussions and clues around the potential of gathering meaning from data that can widen the efficiency of public services, the importance of standard formats, or the possible uses of the extended context that linked data intrinsically provide.

The workshop slides are available! (PDF, Portuguese)

Totonome

Tiago Vieira, one of Transparência Hackday’s (THD) resident coders, opened the afternoon to showcase the most recent endeavour of the THD collective, Totonome — a game using official name registries to test players’ hunches as to which names were or not accepted by the official registry (IRN) as acceptable for naming newborn citizens. Portuguese law restricts the given names to an existing set, with new proposals being considered each year. The presentation slides were made available.

Tiago described the largest hurdle in bootstraping this kind of public data app or site: finding and refining the available datasets into proper formats to be fed into other applications. In this case, the name approval record is only available for the year 2014, in PDF format. This format is not practical for publishing databases; specialised tools (Tabula and CSVkit) were used to organise the data in order to make our game idea real.

From there, an AngularJS-based prototype was created in 3 hours to test the game idea that sounded the most interesting: a game that shows two names, one which was accepted by the registry and one that was not. The goal is to find the approved name.

2015-03-01-180857_1440x900_scrot

As demonstrated by Tiago, the game is surprisingly engaging; a quick demo was enough to get the crowd excited throwing guesses in a fun, collective quiz about which names sounded the most plausible.

Finally, the next steps for Totonome were outlined: come up with a simple, pretty and functional interface, improve on the results’ visual feedback, and facilitate sharing of the scores in social networks.

Eduardo Nunes

Eduardo Nunes is a designer based in Coimbra, working both as a teacher at University of Coimbra and as an independent cross-media designer.

We got an overview of Eduardo’s path through visual craft. In it, we found early experiments around visualizing time and habits, in an early reference to the quantified self meme.

88days

We then were treated to his 3D animation experiments, including a fantastic visualization of the Government Budget de Estado, in an unusually pleasant graphic style.

This was followed by the project that got THD in love with Eduardo’s work and contacted him to present in Open Data Day: an animation dedicated to the issue of Mental Health statistics in Portugal.

Finally, Eduardo presented Dizer Design, an effort to gather and carry out an anthropological understanding of the designer demographics in Portugal. This site was an experiment in crowdsourcing information that produced quick results, with hundreds of contributions from all around the country.

However, the challenges of maintaining independent platforms and their sustainability became clear, with several costs that are frequently invisible to the end user, such as the server rental costs or the labour involved in maintaining and updating these platforms over time. This subject created a lively discussion, making it evident that the problems involved in building independent online platforms are felt by many.

Central de Dados

In the last talk of the day, Ana Isabel Carvalho and Ricardo Lafuente showed the current state of their ongoing work in Central de Dados, a platform for distributing datasets in a standard format.

Central de Dados is an attempt to answer THD’s problem of dataset dispersion: we have gathered several datasets, but had no central location to place them for the public. Some lived in fileservers, others in dropboxes, others yet in Github repositories, saved in many different formats. We sorely missed this kind of central location, as well as a standard format to publish datasets. Applications like CKAN were built to address this need, but they also come with their baggage. It is necessary to keep them under frequent attention and perform regular maintenance, which requires time and resources that we found we do not have at THD.

2015-03-01-181519_1440x900_scrot

Central de Dados is our effort to address our specific use case. Using the excellent data package standard format (under development by Open Knowledge), the datasets created and scraped at THD can be published in a documented and organised way, with Central de Dados as a web portal to facilitate public access. With this, we have a platform that we can use ourselves to quickly bootstrap our public data project ideas, highlighting the value and potential uses of public data. Being an online platform, the general public fully benefits from this possibility as well.

Wrapping up

The day was flicked with moments of enthusiastic networking during coffee breaks and lunch — we became aware of the importance of these intermissions when hosting a public events, since they ended up largely being responsible for fulfilling our goals to bring together a nascent local community interested in open data through sharing of experiences and thoughts, beyond the “work” moments.

We can call this a successful event, with the largest crowd in a hackday so far: 23 people, with more than a third of them women. This success was only made possible thanks to the crucial and generous support of Open Knowledge, ADDICT and UPTEC.

It therefore makes sense to close this report with a grateful word of thanks to these entities, as well as our speakers and everyone who attended the Open Data Day, making it possible for everyone to share our common goal to further the agendas of open data, libre technologies and engaged citizenship.

All the photos from this day (including the ones in this post) were done by Mariana Santos and can be found at Transparência Hackday’s Flickr account.

The next hackday, where we’ll tie up the loose ends left today, will be on the 14th of March — save the date!

Junta-te à Open Food Hunt!

Open Food Hunt 2015

Ainda vais a tempo!

No último sábado – Dia Internacional dos Dados Abertos – o Open Food Facts lançou um desafio para libertar os dados alimentares em todo o mundo.

No papel de Explorador de dados ou Embaixador, tens até domingo (1 de Março) para obter o máximo de pontos que conseguires!

Fica a saber tudo na página http://pt.openfoodfacts.org/open-food-hunt-2015


Ilustração por François Lecomte

Open Data Day 2015, está ao virar da esquina

Open Data Day 2015

Sábado, 21 de fevereiro, comemoramos mais um Open Data Day com uma edição especial do Transparência Hackday. Para participar só tens de te inscrever aqui.

O Open Data Day é um evento internacional dedicado ao ativismo pelos Dados Abertos. Em vários locais do mundo, colectivos e organizações dedicados ao trabalho nesta área juntam-se para assinalar a data com iniciativas locais.

mapa-opendataday2015

No Porto, o Transparência Hackday celebra o Open Data Day com um programa em cheio. Abrimos o dia com as mãos na massa, com o workshop de linked open data orientado pelo João Pequenão.
À tarde, juntamo-nos para uma ronda de apresentações de projetos do Hackday, o TotoNome, pelo Tiago Vieira, e a Central de Dados, pela Ana Isabel Carvalho e Ricardo Lafuente. A estas juntamos uma apresentação do designer Eduardo Nunes, sobre design e visualização de informação.

Entre café e docinhos, guardamos um espaço no final do dia para falar sobre os próximos hackdays, perguntas e repostas acerca de Dados Abertos.

⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄

Aqui fica o plano completo para o Open Data Day 2015:

10:15 – 10:45: Receção e café
10:45 – 11:00: Sobre o Open Data Day
11:00 – 13:00: Workshop Linked Data, com João Pequenão


14:30 – 15:00: TotoNome, Tiago Vieira
15:00 – 15:45: Eduardo Nunes
15:45 – 16:15: pausa para café
16:15 – 16:45: Central de Dados, Ana Isabel Carvalho & Ricardo Lafuente
16:45 – 17:30: Transparência Hackday Portugal

⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄ / \ ⚄

Vamos estar no Pavilhão-Jardim do Pólo de Indústrias Criativas (UPTEC – PINC), na Praça Coronel Pacheco, n.º 2, 4050-453 Porto.

Aparece! Este evento é para tod@s, desde simples curios@s que querem saber mais sobre dados e informação pública, a designers, programador@s, matemátic@s,…

Para participar só tens de te inscrever aqui.


Na organização deste Open Data Day, o Hackday conta com o apoio da Open Knowledge, Addict e UPTEC PINC.