This shows you the differences between two versions of the page.
— |
2015-05 [2017/03/07 17:05] (current) rlafuente created |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | **TRANSPARÊNCIA HACKDAY - Maio 2015** | ||
+ | |||
+ | Texto, texto texto! | ||
+ | |||
+ | Recursos: | ||
+ | * Análise de sentimento em PT: [[http://reaction.fe.up.pt/socialbus]] | ||
+ | * Corpus de língua portuguesa: www.linguateca.pt | ||
+ | * API de notícias: [[http://api.destakes.com]] | ||
+ | * Script para ir buscar antónimos e sinónimos: [[https://github.com/aiscarvalho/sinonimos-antonimos]] | ||
+ | * Figlet: [[http://www.figlet.org/examples.html]] | ||
+ | * Toilet: [[http://caca.zoy.org/wiki/toilet]] | ||
+ | * Dicionário de divisão silábica: [[http://www.portaldalinguaportuguesa.org/about.html?action=syllables]] | ||
+ | |||
+ | Mais recursos linguísticos: | ||
+ | * Corpora: [[http://natura.di.uminho.pt/wiki/doku.php?id=corpora:main]] | ||
+ | * Dicionários: [[http://natura.di.uminho.pt/wiki/doku.php?id=dicionarios:main]] | ||
+ | * Vocábulos: [[http://voc.cplp.org]] | ||
+ | |||
+ | O que se pode fazer: | ||
+ | * bots de twitter :D | ||
+ | |||
+ | Textos: | ||
+ | * Os Lusíadas: [[https://www.gutenberg.org/ebooks/3333]] | ||
+ | |||
+ | Tratamento de texto na linha de comando: | ||
+ | |||
+ | * $ cat lusiadas.txt | grep "Só" > so-lusiadas.txt | ||
+ | |||
+ | cat vai buscar o documento de texto com que queremos trabalhar; | ||
+ | o símbolo | (pipe) serve para juntar vários comandos diferentes: | ||
+ | grep procura partes de texto (além de palavras podemos usar regular expressions); | ||
+ | símbolo > indica que vamos guardar o resultado do cat/grep num documento novo | ||
+ | |||
+ | * $ cat lusiadas.txt | sed 's/v/b/g' | ||
+ | |||
+ | Nesta linha usamos o sed (string editor) para substituir 's' por 'v', e 'b' por 'g' | ||
+ | * | ||
+ | * só o inicio do output | ||
+ | * $ cat lusiadas.txt | head | ||
+ | * só a primeira linha | ||
+ | * $ cat lusiadas.txt | head -n 1 | ||
+ | * só o fim do output | ||
+ | * $ cat lusiadas.txt | tail | ||
+ | * meter as linhas à sorte | ||
+ | * $ cat lusiadas.txt | shuf | ||
+ | * $ echo 'Texto!' | ||
+ | * Texto! | ||
+ | * $ echo 'Texto!' | figlet | ||
+ | * $ cat lusiadas.txt | shuf | head -n 1 | toilet --metal | ||
+ | * pega no texto dos lusiadas, baralha e vai buscar a última linha; toilet transforma a linha em ascii colorido | ||
+ | * | ||
+ | |||
+ | Puré de Notícias! | ||
+ | * Apreendidas 31 toneladas de carne imprópria para estudantes desenvolverem projetos | ||
+ | * Rússia marca vitória na II Guerra Mundial com o Estoril | ||
+ | * Queda de avião militar na cidade espanhola de Sevilha com bilhetes a 2,5 euros, começa segunda-feira | ||
+ | * Morreu presidente honorário do ébola na Libéria | ||
+ | * Moreirense: Elízio de regresso para consumo | ||
+ | * Morreu o autor de uma das maiores gaffes da história dos bilhetes que detinha | ||
+ | * Sporting suspende acordo com exibição de poderio militar | ||
+ | * Jovem talento da epidemia de ébola na Libéria | ||
+ | * Estado é o maior responsável pelo agravamento da seleção olímpica | ||
+ | * Moreirense: Elízio de regresso para construção do pavilhão | ||
+ | * Fórmula 1: Diretor de Hockenheim garante GP Alemanha em acidente na A2 | ||
+ | * Organização Mundial de Saúde declara fim da artista | ||
+ | * Sporting suspende acordo com dois carros completamente novos no Rali de Portugal | ||
+ | * Fórmula 1: Diretor de Hockenheim garante GP Alemanha em Sevilha. "Oito a 10" tripulantes terão morrido | ||
+ | * Nani, Jefferson e um recital pleno de boas memórias | ||
+ | * Queda de avião militar em Sevilha com bilhetes a 2,5 euros, espera pelo menos 200 mil espetadores | ||
+ | * Politécnico do Porto cria espaço para consumo | ||
+ | * TAP prevê realizar hoje 70% dos Mundiais | ||
+ | * Estoril quer manter onda negativa do Sporting na II Guerra Mundial com exibição de poderio militar | ||
+ | * Seis guardas e Miguel Lopes fora do embate com o Estoril | ||
+ | * Clássicos (Estoril): Porsche de dois anos morre em acidente na A2 | ||
+ | |||
+ | mais uma imagem: [[http://transparenciahackday.org/files/purenoticias.png]] | ||
+ | |||
+ | exemplos de análise de sentimento, em inglês, via CoreNLP ([[http://nlp.stanford.edu/sentiment/index.html)]]: | ||
+ | [[https://github.com/brnrds/CoreNLP-Sentiment-Analysis-Examples]] | ||
+ | |||
+ | |||
+ | **>>>>>>>>>> Temos de ver a data do próximo hackday** | ||
+ | |||
+ | O que fazer -- uma TODO para qualquer hackday: | ||
+ | * traduzir textos sobre open data para português: [[http://www.transparenciahackday.org/wiki/doku.php?id=traducoes]] | ||
+ | * contribuir para o Open Food Facts: [[http://pt.openfoodfacts.org]] | ||
+ | * reunir ou limpar datasets para a Central de Dados: [[https://github.com/centraldedados]] | ||
+ | |||
+ | Etherpad de abril: [[http://www.piratepad.be/p/hackday-abril2015]] | ||
+ | |||
+ | Participantes: | ||
+ | * Gato Dado! | ||
+ | * Ana | ||
+ | * João | ||
+ | * Margarida | ||
+ | * Ricardo | ||
+ | * Tiago | ||
+ | * Bernardo | ||