Dados abertos caseiros 1 de abril: o Date With Data da tolice

Hoje é dia de levar os dados abertos menos a sério!

Para marcar esta data especial vamos desperdiçar um sábado inteiro com dados inoportunos, correlações absurdas, visualizações ilegíveis e tecnologias irrelevantes. Inspirados pelas Stupid Hackathons, damos um pouco de cor aos dados abertos e propomos um dia para explorar alegremente o que não levamos a sério.

Tens boas ideias? Deixa-as guardadas! Hoje é o dia das ideias tolas, e queremos sites irresponsivos, apps que compliquem a vida às pessoas, unlinked data, propostas absurdas ou redes anti-sociais.

(Para quem achar tudo isto um pouco parvo, propomos uma vista de olhos nas stupid hackathons em Nova Iorque ou São Francisco para perceber o espírito. Brincar e trocar as voltas às coisas é uma boa forma de encontrar novas abordagens e outros pontos de vista sobre o que fazemos. E nós gostamos de brincar.)

1 de abril, das 10:00 às 17:00, no UPTEC PINC (Praça Coronel Pacheco). Traz uma tripla, portátil e um caderno. Nós lavamos os dados ;)

Date With Data #14: Ano novo, dados novos

Sábado temos mais um Date With Data.
Vamos ter muitos afazeres em cima da mesa: começar os preparativos para o Open Data Day 2017; rever e juntar informação sobre Portugal no Global Open Data Index; ao voltar à Central de Dados; preparar os textos que temos para publicação; entre outras.

Anda ter connosco!

14 de janeiro, das 10:00 às 17:00, no UPTEC PINC (Praça Coronel Pacheco). Traz uma tripla, portátil e um caderno. Nós levamos os dados ;)

Podes ler sobre o que fizemos em 2016 aqui, e guardar a data do próximo encontro, que vai ser dia 11 de feveiro.

Como foi 2016 e o que aí vem em 2017!

dwd-balanco2016

O ano está mesmo, mesmo a terminar, e sentámo-nos para olhar para o que fomos fazendo ao longo do ano. 2016 pode ter sido muita coisa para muita gente; para nós, foi sobretudo produtivo!

O destaque do ano, como de costume, foi a organização do Open Data Day, uma iniciativa global materializada em eventos por todo o mundo onde se aborda o que de bom se faz na cena dos dados abertos. Este ano pudemos contar com a generosa ajuda logística da Open Knowledge International e da UPTEC, bem como o fantástico contributo da AMA (que trata de manter no ar o dados.gov.pt) e da Creative Commons Portugal em proporcionar-nos um excelente debate de ideias sobre o que é isso da “abertura” e que desafios nos esperam.

Expandindo a ideia do que pode ser uma fonte de dados, experimentámos aventurar-nos pelas frentes da literatura e do texto em geral, um tema que já nos é familiar de anos anteriores:

  1. iniciámos um Guia Anti-anglicismos para proporcionar alternativas a expressões comuns que vamos usando e uniformizar as traduções que fomos fazendo.
  2. conseguimos traduzir coletivamente uma boa parte do English As She Is Spoke
  3. procurámos formas de mapear os locais em obras literárias
  4. articulámos as relações entre termos mencionados nas sessões do Parlamento
  5. continuámos a traduzir artigos relevantes para a agenda dos dados abertos
  6. engendrámos uma ferramenta para conseguir ouvir a prosódia de um discurso e testámos com um discurso de Cavaco Silva:

    Phonation

    Hum

  7. fizemos um rastejador para obter um dicionário de divisão silábica
  8. escrevemos sobre o que fazemos nos encontros, sobre o que nos motiva e tentamos explicar as variadas frentes em que nos movemos aqui

Quem nos tem seguido sabe que não andamos nisto dos dados por um encanto pela técnica; o nosso objetivo é empregá-los para conseguir visualizar e perceber melhor o mundo que nos rodeia e a sociedade que integramos. Assim, idealizámos e concretizámos dois projetos de visualização:

Continuámos a afinar a nossa querida Central de Dados:

Terminámos o ano a integrar a representação portuguesa no Open Government Partnership Summit em Paris, onde participámos em hackathons, talks e tratámos de conspirar conjuntamente com os nossos cúmplices franceses dos Regards Citoyens para ajudar a atualizar o interface do seu portal de dados sobre a Assembleia Nacional francesa.

Nos Députés

Para 2017, pretendemos continuar com o ritmo atual de encontros e concretizações. Estamos também desejosos de entrar de modo mais ativo na defesa pública da agenda dos dados abertos, através da representação portuguesa da Open Knowledge International.

Antes do ano terminar, dois apelos:

  • Marca já na agenda: o Date With Data volta em janeiro no dia 14! Na antevéspera voltamos a mandar um lembrete.
  • Está ainda aberto o período de contributos para o Global Open Data Index, o índice mundial que a Open Knowledge desenvolve. Este ano, são novamente necessários os contributos da comunidade para classificar os datasets que existem, podes ajudar?

Queremos aproveitar para agradecer a todos os que tornam o Date With Data possível e incrível: a UPTEC PINC por acolher sempre os encontros que organizamos; e todos que participaram, alguns viajando quilómetros para se juntarem a nós.

Bom ano novo, e junta-te a nós nas próximas Dates ;)

Date With Data — 12 novembro:
F___ it! Ship it!

datewithdata-nov2016

No Date With Data deste mês vamos dedicar esforços e atenção aos projetos em curso. Cada edição traz para a mesa um tema — em setembro olhámos para os dados parlamentares, em outubro para os dados do turismo — que serve de ponto de partida para experiências visuais, análises estatísticas, recolha de dados para novos datasets… e um sem fim de ideias. Apesar da nossa metodologia intensiva — “Fuck it! Ship it!” é um dos nossos lemas — nem sempre conseguimos chegar ao final do encontro com tudo terminado. Assim, chega a altura de olhar para o que temos, fazer um plano e meter as mãos na massa para acabar e lançar.

Queres saber mais acerca de Dados Abertos? Aprender que informação está disponível e como pode ser usada? Precisas de um bom plano para ocupar um sábado de inverno? Anda ter connosco!

Temos muitos afazares e todas a mãos são bem vindas: podes dar uma ajuda na análise de temas/termos dos debates do parlamento, ajudar a terminar o dataset das hamburguerias do Porto, rever as traduções de alguns textos sobre dados abertos, empacotar datasets para a Central de Dados… As possibilidades são variadas e para todos os gostos, tanto para quem gosta do lado técnico como para quem não gosta!

Além disto estamos a cozinhar duas páginas web novas: uma com a definição de Dados Abertos (pois é, ainda há muito por explicar); e outra dedicada ao Hackday & Date With Data, onde escrevemos sobre o nosso interesse pelos dados, quem somos e porque continuamos ativos e sem vontade de parar.

Esta sábado, 12 de novembro, das 10:00 às 17:00 no UPTEC PINC (Praça Coronel Pacheco). Traz uma tripla, portátil e um caderno. Nós levamos os dados ;)

1 de outubro: Date With Data #12

Vamos falar de turismo? Na nossa demanda por informação pública acessível a todas as pessoas, o tema do turismo veio ao de cima como algo que devíamos debruçar-nos. E é exatamente isso que vamos fazer no próximo Date With Data!

dwd-outubro2016

O aparecimento de novas formas de abordar e servir o turismo em Portugal, como as plataformas de aluguer a curto prazo, trouxeram um grande interesse ao tema do turismo e das cidades. É também incontornável a explosão que temos vivido no Porto no que toca a novas ofertas turísticas e os efeitos do turismo na cidade.

Que recursos existem para conseguirmos enquadrar histórica e socialmente o fenómeno do turismo atual? Existem fontes de informação pública que possamos aproveitar? E que esforços podemos levar a cabo para ajudar a compreender o que se passou e o que se está a passar?

Vem saciar a curiosidade connosco, com a certeza que será um dia bem passado na companhia dos novos e velhos projetos que vamos construindo e afinando. É já no dia 1 de outubro — apareces?

Sábado, dia 1, das 10:00 às 17:00 no UPTEC PINC (Praça Coronel Pacheco), temos encontro marcado. Traz o teu portátil!

Date With Data #10: sábado, 9 de julho!

datewithdata-julho2016

Sábado dia 9 há mais Date With Data!

Antes de partirmos para o verão, vamos arrumar a casa e olhar para o que fizemos este ano! Junta-te a nós para pormos as mãos na massa, arrumarmos projectos quase terminados e marinarmos ideias antes de voltar à carga, em setembro.

Como de costume, andaremos à volta de datasets para fazer crescer a nossa Central de Dados, mas há mais!

A transcrição do English as She is Spoke ainda tem pano para mangas (o livro foi esta semana destacado no Atlas Obscura); temos traduções de textos prontas para revisão antes de as publicarmos; datasets à espera de ideias e de atenção; e mais alguns projetos, a cozinhar em lume lento. É o pretexto ideal para aparecer pela primeira vez e ver de perto o que se faz nos Date With Data — e um bom momento para sujar as mãos com dados, sites, hacks e apps!

Voltamos a encontrar-nos no Pavilhão Jardim do UPTEC PINC, no mesmo horário — das 10:00 às 17:00!. Mais pormenores aqui. Traz o teu portátil!

Marca na agenda: voltamos logo em setembro, dia 10, com mais Date With Data.

Date With Data #9: 11 de junho

datewithdata-junho2016

Este mês voltamos a arregaçar as mangas e meter as mãos na Central de Dados. Estamos bem perto de chegar a uma versão 1.0 deste portal para publicar conjuntos de dados abertos! Mas ainda nos faltam fechar umas quantas entradas da nossa lista de tarefas.

A Central de Dados é o repositório público onde partilhamos os dados abertos que recolhemos e tratamos, ao longo dos anos. Fazendo uso da nossa experiência, apontamos forças para criar uma plataforma leve, simples de instalar, simples de usar, seguindo os standards propostos pela Open Knowledge International para a distribuição de dados com licenças livres. Quando apresentámos a Central em Paris e em Berlim, a resposta da comunidade de dados abertos foi entusiasmante. Tanto que começamos a trabalhar na Central como um sistema independente do nosso site, com o objetivo de ser usado para criar outros portais de distribuição de dados abertos.

Queres ajudar e trabalhar na Central de Dados?

Aparece no Date With Data, este sábado! A lista de tarefas é longa. Há muito que fazer, em várias áreas diferentes: escrita, edição e formatação de textos — para documentar a Central, para documentar datasets… —, testes ao sistema, programação, design (anda fazer temas para outras centrais!), empacotar e atualizar datasets, rever licenças…. Tudo coisas entusiasmantes e importantes para fazermos chegar a bom porto uma versão 1.0 deste sistema maravilhoso que começámos a cozinhar em 2014.

No Date With Data também temos espaço para discutir tecnologias, linguagens de programação, back-ends estrambólicos e back-ends tão simples que o nosso primo de três anos podia usar. Somos entusiastas pelo software livre e licenças abertas. Gostamos de pensar em usos para informação pública, de experimentar e partilhar experiências. Anda cá ter no sábado e contamos mais!

Quase sempre ao segundo sábado de cada mês, o Date With Data é já no dia 11 de junho, das 10:00 às 17:00, no Pavilhão Jardim do UPTEC PINC. Mais pormenores aqui. Traz o teu portátil!

Marca na agenda: o Date With Data do mês que vem será no dia 9 de julho.

Date With Data #7: 9 de abril

dwd-abril2016

Depois de um excelente Open Data Day, está a chegar o segundo sábado do mês — o que significa que é hora de mais um encontro Date With Data, com energia reforçada para retomar os projetos e ideias que temos congeminado nos últimos tempos.

Desde ideias que tivemos e iniciativas que começámos, vamos ter muito por onde escolher:

É o pretexto ideal para aparecer pela primeira vez e ver de perto o que se faz no Date With Data — e um bom momento para sujar as mãos com dados e apps! Garantimos a boa disposição do costume, e fazemos figas para que as águas mil nos deixem em paz!

Open Data Day Portugal 2016

CIMG2871 No dia 5 de março juntámo-nos pela quinta vez às comemorações do Dia Mundial dos Dados Abertos. Foi um Date With Data especial, estruturado em duas partes: uma sessão prática durante a manhã, e uma sessão de apresentações e conversa durante a tarde. Entre atividades, aproveitámos para fazer pausas de café e partilhar um almoço com todos os participantes. Para fazer isto acontecer, tivemos o apoio precioso da Open Knowledge e do seu generoso programa de micro-bolsas, bem como da UPTEC que mais uma vez aceitou albergar as nossas aventuras.

ODD 2016 IMG_0189 ODD 2016 CIMG2889 ODD 2016 CIMG2868

Maratona de transcrição:
English as she is spoke

ODD 2016 CIMG2881

Como sempre procurámos interessar-nos por tudo o que é livre e aberto, não nos ficamos pelas bases de dados; os livros e o conhecimento aberto são áreas que sempre gostámos e já algumas vezes trabalhámos. Assim, a proposta da manhã era arregaçar as mangas e trabalhar numa transcrição de uma obra no domínio público para, no final, re-publicá-la num formato aberto e estruturado.

A obra proposta foi o English As She Is Spoke, um guia de conversação português-inglês, escrito no séc. XIX por alguém que não tinha noção de inglês — o que o torna um artefacto divertidíssimo! Juntámo-nos e organizámo-nos para dividir tarefas e assumir a missão de transcrever cada página, sob a batuta do Jan Berkel, que tratou de montar toda a estrutura necessária para facilitar o nosso trabalho colaborativo. Ao longo da manhã, partilhámos dicas e frustrações num Piratepad coletivo, enquanto exercitámos furiosamente os teclados a transcrever traduções ridículas a partir das imagens do livro original, passando-as para o Wikisource.

ODD 2016 IMG_0195 ODD 2016 IMG_0197 ODD 2016 IMG_0201 ODD 2016 CIMG2882 ODD 2016 CIMG2884 ODD 2016 IMG_0203

No final da maratona, ainda há algumas páginas para libertar, mas a boa disposição estava manifesta pelas notas colocadas no Piratepad, e pelos risinhos intermitentes de cada vez que alguém encontrava uma tradução particularmente brilhante. Ainda assim, conseguimos transcrever por completo o capítulo sobre Idiotismos e Provérbios, mais de metade das páginas de vocabulário (as mais morosas) e fizemos revisão das páginas terminadas. Ficou no ar a vontade de repetir a dose para continuar o esforço de transcrever completamente este delicioso compêndio.

Os dados e o conhecimento aberto:
Dados.gov.pt e Creative Commons

ODD 2016 CIMG2896

A tarde guardava-nos um momento de partilha e conversa, tornada especialmente esclarecedora pela generosa presença de dois convidados que vieram de Lisboa para se juntarem ao Open Data Day: André Lapa e Teresa Nobre.

ODD 2016 IMG_0219 ODD 2016 IMG_0215 ODD 2016 CIMG2901

A seguir a uma breve explicação do que significa isso do aberto, recorrendo à Open Definition, tomou a palavra o primeiro convidado da tarde — André Lapa, representante da Agência de Modernização Administrativa (AMA), a entidade responsável pelo precioso portal de dados públicos Dados.gov.pt.

A missão da AMA, no que toca aos dados públicos, é conseguir navegar os silos da administração pública para obter, limpar e publicar inúmeros datasets sob licenças abertas. São dados de todo o género sobre as várias facetas do país, desde informação estatística até resultados eleitorais. Foram-nos mostrados os vários obstáculos encontrados neste esforço de tornar a informação pública legível e reutilizável.

André Lapa trouxe-nos também um vislumbre dos planos para um Dados.gov.pt 2.0: feito em código 100% aberto, será um portal orientado para a interoperabilidade com as plataformas de instituições europeias; há também a vontade de integrar um dos desenvolvimentos mais promissores dos últimos anos no meio dos dados abertos: linked data! É um tema que já tínhamos aflorado no Open Data Day 2015 e que procura alcançar uma organização semântica das várias bases de dados, permitindo a construção de ferramentas poderosas que permitam determinar relações entre várias fontes de informação.

A intervenção ainda nos guardou novidades como o lançamento do novo Portal de dados de Saúde e a preparação de mais portais sectoriais de Dados Abertos.

ODD 2016 IMG_0217

Nesse momento a palavra passou para Teresa Nobre, representante da Creative Commons Portugal, que nos veio iluminar sobre os complicadíssimos pormenores do direito de autor que rodeiam o tema dos dados abertos.

Foi articulada a forma como o direito de autor protege ou não os dados e as bases de dados. Fez-se a distinção entre um facto — que não é, em si, protegido pelo direito de autor — e uma apresentação, selecção ou organização de factos. O direito de autor protege expressões criativas, pelo que uma determinada apresentação de dados (e.g. um diagrama, um mapa, uma tabela) ou uma determinada compilação de dados podem estar protegidas por direito de autor. Nesse caso, os meros factos e informações que estão contidos nessa apresentação ou compilação permanecem livres, ie. qualquer pessoa pode utilizá-los desde que os apresente sob uma forma diferente. Só assim não será se os dados estiverem contidos numa base de dados protegida pelo direito sui generis do produtor da base de dados. Este — previsto numa diretiva europeia criada para defender o investimento substancial (quantitativo ou qualitativo) dos produtores de datasets na obtenção, verificação ou apresentação dos dados — confere ao seu titular o poder de impedir que pessoas não autorizadas extraiam ou reutilizem a totalidade ou uma parte substancial dos conteúdos das bases de dados.

Existem critérios específicos que determinam quais bases de dados podem estar protegidas por este direito sui generis, e muitas vezes só em tribunal se consegue esclarecer se uma certa base de dados é abrangida ou não.

Este direito não impede a extracção ou reutilização de partes não substanciais; apenas impede a extracção/reutilização de partes substanciais. Por outro lado, existem também excepções a este direito, por via das quais é possível extrair ou reutilizar uma parte substancial do conteúdo da base de dados para determinados fins (didáticos, científicos, e privados — mas neste último caso apenas quanto a bases de dados não electrónicas). Nesta altura, algumas pessoas do público mostraram curiosidade sobre os pormenores — e se fôssemos juntando partes não substanciais para re-construir o dataset? E se fossem pessoas diferentes a obter cada parte? Foi esclarecido que o direito impede a extracção/reutilização sistemáticas de partes não substanciais.

Ficou também claro que se encontrarmos online um dataset contendo informação pública, não significa que possamos presumir que seja aberto — só se a sua licença de uso o deixar evidente. E não existem formas simples de interpretar à cláusula do uso não substancial: a noção de substancial não está claramente definida!

ODD 2016 CIMG2894 ODD 2016 IMG_0212 ODD 2016 CIMG2900 ODD 2016 IMG_0208

Um exemplo positivo de licenças explicitamente abertas é precisamente o Dados.gov.pt, que publica os seus datasets segundo licenças Creative Commons Atribuição (BY).

Ainda houve tempo para aflorar assuntos como os direitos morais, a partilha de ficheiros, as licenças Creative Commons Zero, e a existência de licenças Creative Commons que não são abertas, como é o caso das que incluem a cláusula NonCommercial.

As intervenções foram curtas para amplificarmos o espaço de conversa, e do público vieram imediatamente questões. Apareceu o tema do uso justo (Fair Use) e das diferenças entre o modelo norte-americano e o europeu; os direitos morais e a sua interação com as licenças Creative Commons; ou qual a melhor forma de contribuir para os esforços da AMA.

Aproximámo-nos do final com uma última pergunta: que tácticas e métodos podemos usar para conseguir explicar de uma forma simples a importância da partilha de dados públicos?

Teresa Nobre articulou a estratégia utilizada para convencer entidades de arquivo como os museus ou bibliotecas a abrirem as suas colecções (a discussão, nesses casos, em que as obras contidas nas colecções foram criadas por outros, que não as próprias entidades, passa por sensibilizar as entidades para o facto de não lhes caber a elas controlar os usos que possam ser feitas das obras, uma vez caídas no domínio público); no entanto, este argumento não pode ser utilizado quando estamos a falar de obras ainda não caídas no domínio público. Há grandes obstáculos em conseguir convencer outras entidades a abrir as suas bases de dados, bem como sensibilizá-las para as implicações do direito de autor. E no caso dos dados é um desafio maior, já que não é suficiente uma publicação parcial.

André Lapa defendeu o recurso ao argumento cívico e de transparência: os dados públicos precisam de estar disponíveis porque é um direito dos cidadãos. Muitas vezes as instituições não sabem os dados que têm, ou a importância e potencial que a partilha desses dados pode ter. E enfatizou o fator humano: importa contactar as instituições e explicar para que se pretende usar os dados; com exemplos concretos é bem mais fácil. Foi ainda mencionada uma lista de argumentos a favor e contra os dados abertos presente na Wikipédia.

ODD 2016 CIMG2908

Depois de uma pausa focámos dois projectos da Open Knowledge: a School of Data, apresentada pela Marta Pinto, e o Global Open Data Index, apresentado pela Ana Isabel Carvalho e Ricardo Lafuente. Ambos os projetos são direccionados para a o envolvimento e participação da sociedade civil no movimento pelos dados abertos. A School of Data assume um papel educativo, fornecendo tutoriais e materiais sobre ferramentas para trabalhar com dados e suas aplicações. O Global Open Data Index é um indicador anual do estado dos dados abertos em cada país, a nível mundial. Este esforço visa promover a revisão dos datasets públicos que deveriam estar disponíveis e publicados, segundo os crítérios rigorosos da definição de dados abertos.

ODD 2016 IMG_0222

Terminado o plano de atividades, fechámos o Open Data Day com mais um longo momento de conversa, bolachas, networking e boa disposição. Já a pensar no ODD2017, voltaremos a encontrar-nos no próximo Date With Data, no dia 9 de abril!

Fotografias de Luís Oliveira, Ana Carvalho e Ricardo Lafuente.


Open Data Day Portugal 2016

On March 5th, we got together for the fifth time to join the global commemorations of the Open Data Day. We hosted a special Date With Data event, divided into two moments: a practical session in the morning, and a talks and debates session in the afternoon. Between activities, we made the most of coffee breaks and shared a lunch among all participants. In order to make this happen, we benefitted from the precious support of Open Knowledge and their generous micro-grant program, as well as UPTEC who, once again, had their doors open to host the Open Data Day activities.

Transcriptathon:
English As She Is Spoke

Since we were always interested in anything that’s free and open, we’re not always tinkering with databases: books and open knowledge are fields which we love and have explored previously. Our proposal for the morning was thus a hands-on moment to work on transcribing a public domain work in order to re-publish it in an open and structured format.

The proposed work was English As She Is Spoke, a Portuguese-English conversation guide written in the 19th century by someone who had no knowledge of English — which could only make it an hilarious artifact. We got together and organised ourselves to assign tasks and take on the mission to transcribe each page, headed by Jan Berkel who had already taken up the effort to set up all the necessary structure to facilitate collaborative endeavours. During the morning, we shared tips and frustrations inside a collective Piratepad, while our keyboards took a beating as we transcribed ridiculous translations from the original book scans, placing them on Wikisource.

At the end of the transcriptathon, we’re still some pages to go, but the good mood was demonstrated in the silly notes peppered in the Piratepad, and intermittent giggles were regularly heard when someone had found a particularly brilliant translation. Still, we managed to completely transcribe the chapter on Idiotisms and Proverbs, along with more than half of the vocabulary pages (the hardest) and we revised completed pages. There was a clear collective intent to go for it again and finish the effort of transcribing this wonderful tome.

Open data and open knowledge:
Dados.gov.pt and Creative Commons

For the afternoon, we had set up a moment for sharing and talking, made especially enlightening by the generous presence of two guests who came all the way from Lisbon to join us: André Lapa and Teresa Nobre.

After a brief explanation about the meaning of open and the Open Definition, the mic was passed to our first guest: André Lapa, representing the Agency for Administrative Modernisation (AMA), the entity responsible for the official Portuguese public data portal, Dados.gov.pt.

AMA’s mission when it comes to public data is to navigate the silos of public administration in order to obtain, clean and publish several datasets under open licenses. At Dados.gov.pt, we can find data related to many facets of the country, from statistical information to electoral results. Many of the obstacles found in this effort of liberating public information were explained, as well as the importance of providing information in a way that makes it readily legible and reusable.

André Lapa also gave us a peek at the future plans for Dados.gov.pt 2.0: completely based on free and open source code, it will be a portal guided towards interoperability with European data platforms; there is also the intent to integrate one of the most promising developments in data technology in recent years: linked data! It’s a subject that we had already approached in Open Data Day 2015 and which aims to reach a semantic organisation of many distinct datasets, allowing for the development of powerful tools that can establish relationships between many different data sources.

It wouldn’t be over before a few interesting bits of news, such as the launch of the new Health Data Portal and the preparation of more domain-specific Open Data portals.

The mic then switched over to Teresa Nobre, representative of Creative Commons Portugal, who came to enlighten us about the complicated details of copyright in open data.

We got started with the ways that copyright can or cannot protect data and databases. There is a clear distinction between a fact — which isn’t by itself protectable by copyright — and a presentation, selection or compilation of facts. Copyright protects creative expression, so a specific organisation of data (e.g. diagrams, maps, tables) can be subject to copyright protection. In that case, simple facts and information inside that presentation remain free and reusable, as long as the reuse is materialised in a different form or shape. However, it’s an altogether different situation if the data are contained in a database protected by the sui generis database right. This right gives the rightholder the power to stop unauthorised people from extracting or reusing the full or partial contents of the database in question.

There exist specific criteria to determine which databases can be protected by this database right; since they’re not clearly defined, in many cases one would require the opinion of a court to be sure of whether a specific database is covered by this right or not.

The database right does not prevent the extraction or reuse of non-substantial parts of the database. On the other hand, there also exist exceptions to this right in which reuse is permitted (e.g. education or science). At this point, there was interest from the audience in the details — what if we put together non-substantial parts in order to rebuild the dataset? What if different people would acquire different parts?

It was clear that the database right does not allow for this kind of loophole. It was also clarified that if we find a dataset containing public information, it doesn’t mean we can safely presume it is open — only if its usage license makes that evident. And there aren’t simple ways to interpret the non-substantial use clause: the notion of “substantial” is not strictly defined!

A great example of explicitly open licensing is indeed Dados.gov.pt, who publish their datasets under Creative Commons Attribution licenses (CC-BY).

There was still time to approach issues like moral rights, file sharing, CC Zero licenses and the existence of non-open Creative Commons licenses, such as the ones with the NonCommercial clause.

The talks were kept short in order to maximise the space for debate, and questions started flowing from the audience. We touched the subjects of fair use and the differences between the USA and European models; moral rights and how they interact with CC licenses; and the best ways to contribute to AMA’s efforts.

We got closer to the end with a last question: which tactics and methods can we use in order to effectively and concisely explain the importance of public data sharing?

Teresa Nobre articulated the strategy used to convince archiving entities such as museums or libraries to open their collections, the main argument being that they don’t control the works in public domain. However, it’s harder when addressing works not yet in the public domain. There are many obstacles involved in persuading other entities to open their databases, as well as getting them to understand the intricacies of copyright. And in the case of data it’s an even bigger challenge, since publishing only parts of the data is not enough.

André Lapa put forward a defense of the civic and transparency arguments: public data needs to be available because it’s a citizen right. Often, institutions do not even know the data that they own, or the importante and potential that sharing this data can have. He also emphasised the human factor: one should endeavour to contact institutions and explain the purpose for reusing their data; with specific use cases, it’s much easier to convince them.

After a break, we looked into two projects by Open Knowledge: Marta Pinto showcased School of Data, while Ana Isabel Carvalho and Ricardo Lafuente presented the Global Open Data Index. Both projects are geared towards involvement and participation from civil society in the open data movement. School of Data has an educational role, providing tutorials and resources for working with data and building effective projects. The Global Open Data Index is an annual indicator of the state of open public data in each country worldwide. This effort aims to promote awareness of missing key datasets in each country, according to the strict guidelines of the Open Definition.

With the day programme wrapped up, we closed the Open Data Day festivities with another long moment of conversation, cookies, networking and positive mood. Already thinking of ODD2017, we’ll see each other again in the next Date With Data event, on April 9th!

Photos by Luís Oliveira, Ana Carvalho e Ricardo Lafuente.

Vem aí o Open Data Day!

Sábado, 5 de março, comemoramos o quinto Open Data Day organizado na cidade do Porto. Será uma edição especial do Date With Data.

opendataday-2016_updated

O Open Data Day é um evento internacional dedicado ao ativismo pelos Dados Abertos. No mesmo dia, em vários locais do mundo, coletivos e organizações dedicados ao trabalho nesta área juntam-se para assinalar a data com iniciativas locais. O ano de 2016 conta com mais de 190 eventos.

No Porto, o Date With Data celebra o Open Data Day no Pavilhão Jardim do UPTEC PINC (Praça Coronel Pacheco). O programa do dia está organizado assim:

Sessão de trabalho de manhã

10:00 – 10:25: Receção e café
10:30 – 10:40: Sobre o Open Data Day e o Date with Data
10:45 – 12:30: Maratona de transcrição: English As She Is Spoke (Traz o teu computador!)
12:30 – 14:00: Almoço


Sessão com oradores à tarde

14:00 – 14:25: Receção e café
14:30 – 14:35: Sobre o Open Data Day
14:35 – 14:55: Dados abertos em Portugal: André Lapa (Dados.Gov)
15:00 – 15:20: Licenças abertas: Teresa Nobre (Creative Commons Portugal)
15:25 – 15:45: Momento de mesas redondas entre público e oradores
15:50 – 16:10: pausa para café
16:15 – 16:30: Ana Isabel Carvalho e Ricardo Lafuente – Global Open Data Index
16:35 – 16:50: Marta Pinto – O que é a School of Data?
16:50 – 16:55: Pausa para café e conversa
17:00 – Fim

Para participar inscreve-te aqui.

A organização deste evento tem o apoio da Open Knowledge e UPTEC PINC.

Contamos contigo para mais um Open Data Day! Queres saber como foi no ano passado? Vê aqui.