MUDAMOS!

Para http://www.icaromedeiros.com.br

;)

Master thesis

Estou aqui enlouquecendo trabalhando na minha dissertação (aqui em PT, tese) de mestrado e resolvi compartilhar um pouco dessa experiência. É um trabalho violento e árduo, mas espero que valha a pena.

Espero que depois que pronta eu consiga publicar (em conferências INTERNACIONAIS) e participar de concursos de dissertações de mestrado da SBC. Poderia ter feito isso já com o TCC da graduação aqui mas do ponto de vista de Recuperação de Informação o que eu fiz como estudo de caso foi muito pequeno (só prova de conceito, praticamente um toy example) e eu não dei prosseguimento ao sistema. Isso tudo feito às pressas pra conseguir o grau antes de ir pra Recife pro mestrado, apesar do 10 unânime de uma banca cabulosa lá da UFAL (modéstia à Marte).

Além disso, tive que aprender Recuperação de Informação (RI) e Aprendizagem de Máquina (AM) sozinho! Só por isso já mereço um prêmiozinho…

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Bom, o assunto da dissertação: Folksonomias e Sugestão de tags. Construí (?) um sistema que extraiu dados do Delicious e depois usei técnicas de RI, AM e outras coisas. Usei como base da sugestão de tags pra páginas Web o conteúdo textual (implementado, preciso e lindo!), páginas vizinhas (inbound pages) (80% implementado) e informação do WordNet e ontologias (Aqui há dragões no código! Trabalhando nisso!). No final faço uma comparação entre as tags que sugeri e as tags do Delicious pra dar uma medida quantitativa do quanto o sistema é bom e uma análise do comportamento do usuário (p. ex. que tipo de tags o sistema NUNCA vai sugerir: “semweb” e “webdev” fica difícil).

Já passei do nível de loucura com esse sistema, o que pode ser melhor visto na quantidade de linhas de código da bagaça (inclui somente .java, código e testes). Mas vamo nessa, não desisto NUNCA!

Ia colocar o abstract aqui, mas como é um trabalho não-publicado (malditos revisores animais, alguns nem entenderam o sistema) vou deixar pra depois pra falar dos louros que consegui com o trabalho.

Boa noite, boa sorte (pra mim)!

O uso do martelo (sobre ensino de Computação)

A gente aprende com o pai que chama pra ajudar a montar uma mesa a usar martelos, parafusos e peças de encaixe. Mas pra construir uma mesa do zero precisamos conhecer CONCEITOS como pressão, gravidade, massa… ou seja, FÍSICA. Do mesmo jeito é a Computação.

O problema é que a maioria dos cursos só ensinam a usar o martelo, ou seja, ferramentas. Só mudar uma versão, uma sintaxe, um método… Ouvimos que é preciso “reciclagem”. As empresas gastam milhões pra “atualizar os funcionários” pra ensinar… FERRAMENTAS.

633845000864697900-hammer

Muitas vezes o que falta é B-A-BÁ. É claro que ferramentas de produtividade, como diz o nome, nos fazem perder menos tempo em tarefas diárias quase automáticas. Mas, cuidado… Teoria e saber o que está fazendo é ESSENCIAL, condição necessária e suficiente. Notem aqui eu não nunca questionei o uso de ferramentas, apenas digo que é preciso responder duas perguntas para dominar BEM os programas e acessórios que usamos na nossa profissão. POR QUE e O QUE FEZ esse software ser assim?

Que não se iludam os que fazem curso e certificações pra atestar proficiência em ferramentas. Além do custo (a preço de diamante), o conhecimento (especialmente em Computação) é (muito) perecível. Você vai ter que aprender tudo de novo daqui a meses ou poucos anos, com a certeza que perdeu tempo/dinheiro. Pode valer a pena mas sempre há alguns poréns.

Ouço há anos a ladainha de que cursos em universidades federais são muito teóricos e “você não vai aprender nada do que se usa no mercado”. Ok. Nunca tive aula (oficial) de Java básico. Mas a única coisa que se deve esperar passivamente é a morte, o resto nós corremos atrás! Claro que nem todo mundo é auto-didata, mas um pouco de esforço nunca faz mal, até para os usuários cegos do martelo.

Quem aqui aprendeu programação funcional na faculdade e agora, como TODO ESSE KNOW-HOW, tá bombando novas linguagens multi-paradigma? Alguém? E o que faz quem não teve aula de programação funcional e quer usar tudo que Ruby e Scala oferecem? O jeito é voltar pra escolinha (eu incluso)…

Os usuários de martelo sempre reclamam: “Que aula chata, muito teórica”. Ah vai te catar meu filho! Você quer fazer aplicação em 5 minutos “abstraindo” as “complicações” e passar o resto do expediente lendo email?

Microformatos

Microformatos são conjuntos de formatos abertos usados para aumentar a capacidade semântica do (X)HTML, adicionado metadados sobre contatos, feeds, eventos, etc.

Basicamente são usados em atributos (X)HTML como class e rel, sim, funciona com uma gambiarra do jeito que deu pra fazer. Por exemplo, pode-se dizer que (Exemplo Wikipédico):

O avião Air France 447 caiu nas coordenadas
<span class="geo">
 <span class="latitude">48.15</span>,
 <span class="longitude">-16.2342</span>
</span>

Essa informação é lida por browsers, ferramentas de busca e outros sistemas que conseguem “entender” que aqueles dados são referentes a coordenadas geográficas. Isso permite tarefas como:

– Indexar e recuperar consultas baseadas em coordenadas geográficas (num sistema de busca)
– Encontrar no mapa essas coordenadas oferecendo uma informação contextual que o site original pode não oferecer
– Exportar a informação para um dispositivo GPS

Uma grande aplicação recentemente (? Março) anunciada que usa Microformatos é o Google Rich Snippets. Primeiramente, snippets são aqueles resumos da página (geralmente contextualizados com a consulta) que aparecem nos resultados do Google abaixo dos links. Rich Snippets é uma tentativa do Google de mostrar algo a mais que apenas o conTEXTO da sua consulta, e se valer de dados estruturados da página para mostrar por exemplo reviews e notas para produtos e serviços pesquisados.

Exemplo do Google Rich Snippets

Páginas com snippets ricos tem maiores possibilidades de serem acesssadas, segundo experimentos deles. Mas, para que as páginas apareçam com esses resumos melhorados, os webmasters devem incluir anotações em microformatos (ou RDFa, tema do próximo post SÉRIO daqui) em suas páginas. Acho a iniciativa válida, mas ninguém tá com esse tempo de fazer isso na mão, ferramentas de edição que extraiam informação e detectem candidatos pra esses formatos são bem-vindas (quer ficar rico? fica a dica). Além disso a propaganda do tema ainda tá fraca, o culto é muito segregado e só tem uns bravos defensores, e não a W3C por trás.

Alguns exemplos de microformatos

hAtom – para marcação de feeds Atom
hCalendar – para eventos
hCard – para informação de contatos, incluindo endereço, localização geográfica, etc.
hProduct – para informações sobre produtos
hReview – para reviews de livros, filmes, restaurantes, etc.

Saiba mais: http://microformats.org/

// Post meio jogado, sem muita profundidade técnica e uma análise maior, mas tava encalhado aqui há muito tempo. Prometo melhorar quando falar do RDFa.

4 anos de Debian Festival

Viajei pela Europa agora e vou fazer uma série de posts sobre o assunto, mas primeiro vou falar do evento que ajudei a criar e organizar em Maceió cuja quarta edição aconteceu essa semana: O  Debian Festival 4.0.

Tudo começou quando a PRIMEIRA caravana de Alagoas foi pro Encontro Nacional de Estudantes de Computação (ENECOMP 2006) e voltando do evento eu, Vicente e Marco (recém eleitos como PRIMEIROS representantes da Executiva Nacional pra Alagoas) conversávamos (enquanto bebíamos) sobre a falta de eventos em Maceió sobre Informática e TI no estado. Tinhamos que fazer algo! Com o aniversário do Debian próximo (16 de agosto), resolvemos criar o PRIMEIRO evento pra comemorar isso e falar sobre Software Livre no estado.

Debian Festival 2 e o bolo com confeitos (o mais original)

Debian Festival 2 e o bolo com confeitos (o mais original)

Continue lendo ‘4 anos de Debian Festival’

Mais piadinhas sobre programadores

Continuando a seção posts enchedores de linguiça enquanto eu não tenho tempo pra parar pra escrever sobre algo sério. Mais piadas sobre programadores…

programmers

fox

Continue lendo ‘Mais piadinhas sobre programadores’

Por que kirUX?

Uma história sobre nerdice adolescente, apelidos de IRC e script kiddies

Nunca criaram apelidos interessantes com o nome Ícaro. Minha irmã conseguiu a façanha de inventar um tal de “Cáqui” (nunca confundir com Caqui) quando tinha uns 2 anos, até hoje umas primas me chamam assim, e soa RIDÍCULO.

Meu primeiro nick (apelido) na Internet (lê-se IRC) foi Apocalypse_now. Coisa de pivete! Depois disso veio a Apocalypse HP (jogos, mp3, links, downloads)… Isso em 98 era O ÁPICE. EU TINHA UMA WEB PAGE. Meus amigos todos tinham também, O Mestre HP, Geografic Page, A Ossada… Até participamos de CONCURSO DE SITES no colégio!!

Depois usei os nicks Kripto, Shaman e Icaro. Esses dois últimos num acesso de nerdice profunda foram conseguidos esperando o nick “dropar” no BrasIRC, ou seja, o dono do nick na rede passava alguns meses sem entrar e o nick ficava disponível. E ter seu nome PURO ou de banda de roque como nick era sinônimo de eusoufodao.com.br!

Saia da fossa, caia no #esgoto.

Saia da fossa, caia no #esgoto.

No auge do nosso querido e eterno canal #esgoto, uma menina do colégio resolveu me chamar de kiru. Pela primeira vez na vida algum apelido baseado em Ícaro que deu certo!

Num outro canal cheio de “malandrinhos” do IRC, o povo tinha uma mania de nick terminado em UX (cinhUX, setUX, …), afinal o linUX é o sistema operacional dos hackers-rákis-h4x0rs (do mal!).

Eu era apenas um aprendiz quando recebi os ensinamentos dos cowboys. Lembro de um belíssimo exploit do IRC que derrubava qualquer cidadão que não trocasse o executável pra versão mais nova do IRC (85% da população da rede). Ou então eram uns ping of death “experimentais” ou DoS. Canais inimigos sofreram… Sim, eu tenho um passado script kiddie. Como era engraçado! :D

Interface do IRC. MSN suxxxx.

Interface do IRC. MSN suxxxx.

Pois é da união de Kiru com o poder do GNU/LinUX que surje kirUX.

PS: Eu devia ter escrito isso no começo do blog, pra que lembrassem mais do endereço do blog. Talvez depois eu mude pra icaromedeiros.wordpress.com (já registrado!), mas eu acho que soa muito “corporativo” e padrão, e eu sempre quero ser diferente… Talvez. Talvez fique melhor quando valer a pena o investimento num domínio .com ou .net.

PS2: Obviamente todos os nomes foram preservados, só falei dos nicks.

Vídeo promocional do insituto que trabalho (INESC-ID Lisboa)

Muita modernidade. O Insituto que trabalho aqui em Portugal (INESC-ID Lisboa) fez um vídeo promocional e tem um canal do Youtube com vídeos sobre os projetos. Meu deus, é mais que moderno, é pós-moderno-contemporâneo-renascentista-pós-apocalíptico (do mal!). Por algum motivo injustificável desativaram embutir o vídeo. Ele está aqui.

PS: Google Earth é default agora pra fazer esses vídeos que começam do espaço pra acabarem numa foto área das ruas, né?

RSS e Twitter no mesmo (ciber)espaço

Eu tava pensando nisso depois de uma semana usando o Twitter, vendo a quantidade (e a velocidade!) de links sugeridos pra lá e pra cá: Será que o RSS vai morrer desse jeito? Semana passada, no Twitter do “wanna-be-rich-with-semantic-web-boy” Nova Spivack, vi que ele discordava desse artigo do TechCrunch, que diz simplesmente que o RSS morreu com ferramentas como o Twitter, que fazem “gerenciamento de conteúdo em tempo real”.

O RSS morreu (falso!). Viva o RSS.

O RSS morreu (falso!). Viva o RSS.

Continue lendo ‘RSS e Twitter no mesmo (ciber)espaço’

Esquecer do trabalho na hora do almoço é para os fracos

Lá vou eu almoçar e encontro isso na toalha de papel cobrindo a mesa: um diagrama de sequência e rabiscos. Tsc. Restaurante perto de universidade é foda. Falar bobagem no almoço é para os fracos!

Imagem000


posts por mês

assine esse blog

favoritos@del.icio.us

eu uso





Powered by FeedBurner

estatística

  • 17.041 acessos
maio 2024
S T Q Q S S D
 12345
6789101112
13141516171819
20212223242526
2728293031