Arquivo para a categoria 'ciência'

Master thesis

Estou aqui enlouquecendo trabalhando na minha dissertação (aqui em PT, tese) de mestrado e resolvi compartilhar um pouco dessa experiência. É um trabalho violento e árduo, mas espero que valha a pena.

Espero que depois que pronta eu consiga publicar (em conferências INTERNACIONAIS) e participar de concursos de dissertações de mestrado da SBC. Poderia ter feito isso já com o TCC da graduação aqui mas do ponto de vista de Recuperação de Informação o que eu fiz como estudo de caso foi muito pequeno (só prova de conceito, praticamente um toy example) e eu não dei prosseguimento ao sistema. Isso tudo feito às pressas pra conseguir o grau antes de ir pra Recife pro mestrado, apesar do 10 unânime de uma banca cabulosa lá da UFAL (modéstia à Marte).

Além disso, tive que aprender Recuperação de Informação (RI) e Aprendizagem de Máquina (AM) sozinho! Só por isso já mereço um prêmiozinho…

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Bom, o assunto da dissertação: Folksonomias e Sugestão de tags. Construí (?) um sistema que extraiu dados do Delicious e depois usei técnicas de RI, AM e outras coisas. Usei como base da sugestão de tags pra páginas Web o conteúdo textual (implementado, preciso e lindo!), páginas vizinhas (inbound pages) (80% implementado) e informação do WordNet e ontologias (Aqui há dragões no código! Trabalhando nisso!). No final faço uma comparação entre as tags que sugeri e as tags do Delicious pra dar uma medida quantitativa do quanto o sistema é bom e uma análise do comportamento do usuário (p. ex. que tipo de tags o sistema NUNCA vai sugerir: “semweb” e “webdev” fica difícil).

Já passei do nível de loucura com esse sistema, o que pode ser melhor visto na quantidade de linhas de código da bagaça (inclui somente .java, código e testes). Mas vamo nessa, não desisto NUNCA!

Ia colocar o abstract aqui, mas como é um trabalho não-publicado (malditos revisores animais, alguns nem entenderam o sistema) vou deixar pra depois pra falar dos louros que consegui com o trabalho.

Boa noite, boa sorte (pra mim)!

4 anos de Debian Festival

Viajei pela Europa agora e vou fazer uma série de posts sobre o assunto, mas primeiro vou falar do evento que ajudei a criar e organizar em Maceió cuja quarta edição aconteceu essa semana: O  Debian Festival 4.0.

Tudo começou quando a PRIMEIRA caravana de Alagoas foi pro Encontro Nacional de Estudantes de Computação (ENECOMP 2006) e voltando do evento eu, Vicente e Marco (recém eleitos como PRIMEIROS representantes da Executiva Nacional pra Alagoas) conversávamos (enquanto bebíamos) sobre a falta de eventos em Maceió sobre Informática e TI no estado. Tinhamos que fazer algo! Com o aniversário do Debian próximo (16 de agosto), resolvemos criar o PRIMEIRO evento pra comemorar isso e falar sobre Software Livre no estado.

Debian Festival 2 e o bolo com confeitos (o mais original)

Debian Festival 2 e o bolo com confeitos (o mais original)

Continuar lendo ’4 anos de Debian Festival’

Mais piadinhas sobre programadores

Continuando a seção posts enchedores de linguiça enquanto eu não tenho tempo pra parar pra escrever sobre algo sério. Mais piadas sobre programadores…

programmers

fox

Continuar lendo ‘Mais piadinhas sobre programadores’

Por que kirUX?

Uma história sobre nerdice adolescente, apelidos de IRC e script kiddies

Nunca criaram apelidos interessantes com o nome Ícaro. Minha irmã conseguiu a façanha de inventar um tal de “Cáqui” (nunca confundir com Caqui) quando tinha uns 2 anos, até hoje umas primas me chamam assim, e soa RIDÍCULO.

Meu primeiro nick (apelido) na Internet (lê-se IRC) foi Apocalypse_now. Coisa de pivete! Depois disso veio a Apocalypse HP (jogos, mp3, links, downloads)… Isso em 98 era O ÁPICE. EU TINHA UMA WEB PAGE. Meus amigos todos tinham também, O Mestre HP, Geografic Page, A Ossada… Até participamos de CONCURSO DE SITES no colégio!!

Depois usei os nicks Kripto, Shaman e Icaro. Esses dois últimos num acesso de nerdice profunda foram conseguidos esperando o nick “dropar” no BrasIRC, ou seja, o dono do nick na rede passava alguns meses sem entrar e o nick ficava disponível. E ter seu nome PURO ou de banda de roque como nick era sinônimo de eusoufodao.com.br!

Saia da fossa, caia no #esgoto.

Saia da fossa, caia no #esgoto.

No auge do nosso querido e eterno canal #esgoto, uma menina do colégio resolveu me chamar de kiru. Pela primeira vez na vida algum apelido baseado em Ícaro que deu certo!

Num outro canal cheio de “malandrinhos” do IRC, o povo tinha uma mania de nick terminado em UX (cinhUX, setUX, …), afinal o linUX é o sistema operacional dos hackers-rákis-h4x0rs (do mal!).

Eu era apenas um aprendiz quando recebi os ensinamentos dos cowboys. Lembro de um belíssimo exploit do IRC que derrubava qualquer cidadão que não trocasse o executável pra versão mais nova do IRC (85% da população da rede). Ou então eram uns ping of death “experimentais” ou DoS. Canais inimigos sofreram… Sim, eu tenho um passado script kiddie. Como era engraçado! :D

Interface do IRC. MSN suxxxx.

Interface do IRC. MSN suxxxx.

Pois é da união de Kiru com o poder do GNU/LinUX que surje kirUX.

PS: Eu devia ter escrito isso no começo do blog, pra que lembrassem mais do endereço do blog. Talvez depois eu mude pra icaromedeiros.wordpress.com (já registrado!), mas eu acho que soa muito “corporativo” e padrão, e eu sempre quero ser diferente… Talvez. Talvez fique melhor quando valer a pena o investimento num domínio .com ou .net.

PS2: Obviamente todos os nomes foram preservados, só falei dos nicks.

Vídeo promocional do insituto que trabalho (INESC-ID Lisboa)

Muita modernidade. O Insituto que trabalho aqui em Portugal (INESC-ID Lisboa) fez um vídeo promocional e tem um canal do Youtube com vídeos sobre os projetos. Meu deus, é mais que moderno, é pós-moderno-contemporâneo-renascentista-pós-apocalíptico (do mal!). Por algum motivo injustificável desativaram embutir o vídeo. Ele está aqui.

PS: Google Earth é default agora pra fazer esses vídeos que começam do espaço pra acabarem numa foto área das ruas, né?

RSS e Twitter no mesmo (ciber)espaço

Eu tava pensando nisso depois de uma semana usando o Twitter, vendo a quantidade (e a velocidade!) de links sugeridos pra lá e pra cá: Será que o RSS vai morrer desse jeito? Semana passada, no Twitter do “wanna-be-rich-with-semantic-web-boy” Nova Spivack, vi que ele discordava desse artigo do TechCrunch, que diz simplesmente que o RSS morreu com ferramentas como o Twitter, que fazem “gerenciamento de conteúdo em tempo real”.

O RSS morreu (falso!). Viva o RSS.

O RSS morreu (falso!). Viva o RSS.

Continuar lendo ‘RSS e Twitter no mesmo (ciber)espaço’

Wolfram Alpha – Você pergunta, a Web responde!?

Depois dos fracassos de Cuil e Wikia, mais um Google Killer wannabe? Acho que dessa vez não. O hype sobre a ferramenta vem crescendo muito, até porque ela vem com o respaldo de um cientista conhecido, Stephen Wolfram, físico, matemático e empresário conhecido por ser autor da ferramenta Mathematica e por trabalhos em áreas como autômatos celulares. Caros amigos, apresento-lhes o Wolfram Alpha.wolfram_alphaO jornal The Independent diz que a ferramenta mudará a Internet pra sempre. (Ohhhh). O sistema deve ser lançado ainda esse mês. OMFG, agora vai, Google R.I.P. O que é que esse negócio faz? Diz aí!

Segundo o autor, a ferramenta é uma “máquina de conhecimento computacional”. (…) . Hein?

Bom, diferente do Google, que retorna um bocado de links para possíveis respostas às perguntas dos usuários, o Wolfram Alpha tenta entender a pergunta e retornar uma resposta através de uma base de conhecimento criada para as mais diversas áreas, contendo terabytes de informação avaliada por especialistas e algoritmos para modelar e raciocinar sobre esse conhecimento.

O sistema computa as respostas! Calcula! Não é um amontado de pares pergunta-resposta nem busca respostas numa base de fatos. Ao invés disso o sistema é capaz de entender e retornar respostas para alguns tipos de pergunta. Além das respostas há maneiras de explorar conhecimento/dados relacionados e efetuar comparações já que a resposta pode incluir diagramas, gráficos e links para questões relacionadas.

Por exemplo, uma consulta sobre a temperatura em Tóquio no ano de 2008 mostrará médias de temperatura, umidade e velocidade do vento, além de um gráfico com as temperaturas médias, mínimos e máximos ao longo do ano. Diferente do Google, que ia mandar você ver o site da agência de meteorologia do Japão. No Wolfram Alpha é como perguntar a um expert na área como naquela frase: “pergunte a quem realmente entende do assunto”.

Consulta sobre temperatura em Tóquio no ano de 2008

Consulta sobre temperatura em Tóquio no ano de 2008

Continuar lendo ‘Wolfram Alpha – Você pergunta, a Web responde!?’

As melhores tirinhas do Nerdson

Nerdson é um site com tirinhas nerds, ou como coloca seu autor:  ” é um blog de quadrinhos sobre programação, arte e cultura digital. Quadrinhos feitos de nerd para nerds.”.

Relatando fatos engraçados do nosso mundo como chefes absurdos, novas modas na Internet e piadas técnicas e sobre o estereótipo nerd, as tirinhas do Nerdson são destinadas principalmente aos Computeiros. Diferente do PhD Comics que eu só peguei algumas tiras, no Nerdson eu pesquisei o site inteiro!!

Aí vão alguns exemplos (não entendeu as piadas?  noob!):

nerdson1361 Continuar lendo ‘As melhores tirinhas do Nerdson’

Um pouco sobre onde eu trabalho

O INESC-ID (Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa) é um instituto de pesquisa e desenvolvimento ligado a algumas universidades, principalmente a Universidade Técnica de Lisboa (UTL) e seu Instituto Superior Técnico (IST).

Há aqui uma vasta gama de unidades de pesquisa, tratando de assuntos como Redes de Comunicação, Algoritmos para Otimização e Simulação, Processamento de Sinais, Automação, Bioinformática, Engenharia de Software e, no meu caso, Gerenciamento de Dados e Recuperação de Informação (Data Management and Information Retrieval – DMIR) .

A unidade que eu trabalho na rua Alves Redol, Alameda, Lisboa. Escritórios com varanda ;)

A unidade que eu trabalho na rua Alves Redol, Alameda, Lisboa. Escritórios com varanda ;)

O DMIR está envolvido na pesquisa e no desenvolvimente de soluções no estado-da-arte para grandes volumes de dados. Foca-se nos problemas de gerenciamento de dados, por exemplo: Extração de dados, armazenamento, classificação e recuperação de documentos textuais, mineração de dados, engenharia de ontologias e Web semântica.

Google Profiles

Se você coloca seu nome no google, o que aparece? Parece uma besteira, uma curiosidade apenas, mas na verdade é muito importante. Gestores de recursos humanos usam cada vez mais esse tipo de pesquisa para conhecer o perfil dos candidatos a emprego. No meu caso…

google_me-1

Sem acento aparece:

  1. Meu Twitter
  2. A tag de ontologia no meu blog (por ser a mais usada). Isso é ótimo porque me relaciona a área de pesquisa ;)
  3. Sobre mim do blog, com uma mini biografia e principais publicações. Também muito útil pra Marketing Pessoal.
  4. Lixo (outro Ícaro Medeiros)
  5. Post em uma mailing list do Debian. Também importante pois denota que você é um membro participativo de comunidades técnicas :P

Com acento temos:

  1. Meu currículo Lattes (PERFEITO!)
  2. Página inicial do Blog (já que o título do blog é meu nome)
  3. Tag ontologia no Blog
  4. Meu Twitter
  5. Meu LinkedIn (rede social profissional). Muito útil também, contém minha formação, empregos e contatos profissionais.

Mas o assunto não é esse. A grande questão é que o Google acaba de lançar uma ferramenta que permite buscas mais interessantes quando são consultados nomes de pessoas no sistema, o Google Profiles. Com ele você cria um perfil, uma espécie de “orkut mais sério” e põe  coisas como atividade profissional, onde nasceu, cidades que morou, contato e link para sites com perfis seus como no Orkut, Facebook, etc. Aqui está o meu Google Profile.

E qual a grande vantagem disso? Se procurar pelo seu nome no Google no final da página de resultados aparecerá um link para o seu perfil Google com as suas informações, e você pode ficar a uma busca de ser encontrado. Muito fácil!

landing2updated

Por enquanto a novidade só aparece acessando pelo google.com e com resultados em inglês. Via Marketing de Busca.

Próxima Página »


posts por mês

assine esse blog

minhas tuitadas

favoritos@del.icio.us

eu uso





Powered by FeedBurner

estatística

  • 12,743 acessos

 

maio 2012
S T Q Q S S D
« dez    
 123456
78910111213
14151617181920
21222324252627
28293031  

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.