Archive for the 'web' Category

Master thesis

Estou aqui enlouquecendo trabalhando na minha dissertação (aqui em PT, tese) de mestrado e resolvi compartilhar um pouco dessa experiência. É um trabalho violento e árduo, mas espero que valha a pena.

Espero que depois que pronta eu consiga publicar (em conferências INTERNACIONAIS) e participar de concursos de dissertações de mestrado da SBC. Poderia ter feito isso já com o TCC da graduação aqui mas do ponto de vista de Recuperação de Informação o que eu fiz como estudo de caso foi muito pequeno (só prova de conceito, praticamente um toy example) e eu não dei prosseguimento ao sistema. Isso tudo feito às pressas pra conseguir o grau antes de ir pra Recife pro mestrado, apesar do 10 unânime de uma banca cabulosa lá da UFAL (modéstia à Marte).

Além disso, tive que aprender Recuperação de Informação (RI) e Aprendizagem de Máquina (AM) sozinho! Só por isso já mereço um prêmiozinho…

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Nuvem de tags - ORGANIZE A WEB, MOTHAFUCKA

Bom, o assunto da dissertação: Folksonomias e Sugestão de tags. Construí (?) um sistema que extraiu dados do Delicious e depois usei técnicas de RI, AM e outras coisas. Usei como base da sugestão de tags pra páginas Web o conteúdo textual (implementado, preciso e lindo!), páginas vizinhas (inbound pages) (80% implementado) e informação do WordNet e ontologias (Aqui há dragões no código! Trabalhando nisso!). No final faço uma comparação entre as tags que sugeri e as tags do Delicious pra dar uma medida quantitativa do quanto o sistema é bom e uma análise do comportamento do usuário (p. ex. que tipo de tags o sistema NUNCA vai sugerir: “semweb” e “webdev” fica difícil).

Já passei do nível de loucura com esse sistema, o que pode ser melhor visto na quantidade de linhas de código da bagaça (inclui somente .java, código e testes). Mas vamo nessa, não desisto NUNCA!

Ia colocar o abstract aqui, mas como é um trabalho não-publicado (malditos revisores animais, alguns nem entenderam o sistema) vou deixar pra depois pra falar dos louros que consegui com o trabalho.

Boa noite, boa sorte (pra mim)!

RSS e Twitter no mesmo (ciber)espaço

Eu tava pensando nisso depois de uma semana usando o Twitter, vendo a quantidade (e a velocidade!) de links sugeridos pra lá e pra cá: Será que o RSS vai morrer desse jeito? Semana passada, no Twitter do “wanna-be-rich-with-semantic-web-boy” Nova Spivack, vi que ele discordava desse artigo do TechCrunch, que diz simplesmente que o RSS morreu com ferramentas como o Twitter, que fazem “gerenciamento de conteúdo em tempo real”.

O RSS morreu (falso!). Viva o RSS.

O RSS morreu (falso!). Viva o RSS.

Continue lendo ‘RSS e Twitter no mesmo (ciber)espaço’

Wolfram Alpha – Você pergunta, a Web responde!?

Depois dos fracassos de Cuil e Wikia, mais um Google Killer wannabe? Acho que dessa vez não. O hype sobre a ferramenta vem crescendo muito, até porque ela vem com o respaldo de um cientista conhecido, Stephen Wolfram, físico, matemático e empresário conhecido por ser autor da ferramenta Mathematica e por trabalhos em áreas como autômatos celulares. Caros amigos, apresento-lhes o Wolfram Alpha.wolfram_alphaO jornal The Independent diz que a ferramenta mudará a Internet pra sempre. (Ohhhh). O sistema deve ser lançado ainda esse mês. OMFG, agora vai, Google R.I.P. O que é que esse negócio faz? Diz aí!

Segundo o autor, a ferramenta é uma “máquina de conhecimento computacional”. (…) . Hein?

Bom, diferente do Google, que retorna um bocado de links para possíveis respostas às perguntas dos usuários, o Wolfram Alpha tenta entender a pergunta e retornar uma resposta através de uma base de conhecimento criada para as mais diversas áreas, contendo terabytes de informação avaliada por especialistas e algoritmos para modelar e raciocinar sobre esse conhecimento.

O sistema computa as respostas! Calcula! Não é um amontado de pares pergunta-resposta nem busca respostas numa base de fatos. Ao invés disso o sistema é capaz de entender e retornar respostas para alguns tipos de pergunta. Além das respostas há maneiras de explorar conhecimento/dados relacionados e efetuar comparações já que a resposta pode incluir diagramas, gráficos e links para questões relacionadas.

Por exemplo, uma consulta sobre a temperatura em Tóquio no ano de 2008 mostrará médias de temperatura, umidade e velocidade do vento, além de um gráfico com as temperaturas médias, mínimos e máximos ao longo do ano. Diferente do Google, que ia mandar você ver o site da agência de meteorologia do Japão. No Wolfram Alpha é como perguntar a um expert na área como naquela frase: “pergunte a quem realmente entende do assunto”.

Consulta sobre temperatura em Tóquio no ano de 2008

Consulta sobre temperatura em Tóquio no ano de 2008

Continue lendo ‘Wolfram Alpha – Você pergunta, a Web responde!?’

As melhores tirinhas do Nerdson

Nerdson é um site com tirinhas nerds, ou como coloca seu autor:  ” é um blog de quadrinhos sobre programação, arte e cultura digital. Quadrinhos feitos de nerd para nerds.”.

Relatando fatos engraçados do nosso mundo como chefes absurdos, novas modas na Internet e piadas técnicas e sobre o estereótipo nerd, as tirinhas do Nerdson são destinadas principalmente aos Computeiros. Diferente do PhD Comics que eu só peguei algumas tiras, no Nerdson eu pesquisei o site inteiro!!

Aí vão alguns exemplos (não entendeu as piadas?  noob!):

nerdson1361 Continue lendo ‘As melhores tirinhas do Nerdson’

Google Profiles

Se você coloca seu nome no google, o que aparece? Parece uma besteira, uma curiosidade apenas, mas na verdade é muito importante. Gestores de recursos humanos usam cada vez mais esse tipo de pesquisa para conhecer o perfil dos candidatos a emprego. No meu caso…

google_me-1

Sem acento aparece:

  1. Meu Twitter
  2. A tag de ontologia no meu blog (por ser a mais usada). Isso é ótimo porque me relaciona a área de pesquisa ;)
  3. Sobre mim do blog, com uma mini biografia e principais publicações. Também muito útil pra Marketing Pessoal.
  4. Lixo (outro Ícaro Medeiros)
  5. Post em uma mailing list do Debian. Também importante pois denota que você é um membro participativo de comunidades técnicas :P

Com acento temos:

  1. Meu currículo Lattes (PERFEITO!)
  2. Página inicial do Blog (já que o título do blog é meu nome)
  3. Tag ontologia no Blog
  4. Meu Twitter
  5. Meu LinkedIn (rede social profissional). Muito útil também, contém minha formação, empregos e contatos profissionais.

Mas o assunto não é esse. A grande questão é que o Google acaba de lançar uma ferramenta que permite buscas mais interessantes quando são consultados nomes de pessoas no sistema, o Google Profiles. Com ele você cria um perfil, uma espécie de “orkut mais sério” e põe  coisas como atividade profissional, onde nasceu, cidades que morou, contato e link para sites com perfis seus como no Orkut, Facebook, etc. Aqui está o meu Google Profile.

E qual a grande vantagem disso? Se procurar pelo seu nome no Google no final da página de resultados aparecerá um link para o seu perfil Google com as suas informações, e você pode ficar a uma busca de ser encontrado. Muito fácil!

landing2updated

Por enquanto a novidade só aparece acessando pelo google.com e com resultados em inglês. Via Marketing de Busca.

Mapa de tendências na Web

Um grupo de japas arquitetos de informação fez mais um daqueles mapas da Web, no melhor estilo linhas de Metrô. Veja o mapa completo (6740 x 4768) ou a versão em Flash navagável (com zoom, etc).

Por exemplo, os 10 sites mais influentes são (na ordem): Google, Yahoo, MSN, Apple, Wikipedia, Amazon, Youtube, Facebook, Twitter e The Pirate Bay. No total são 333 sites e a ordem é dada por critérios como tráfego, receita, idade e empresa proprietária.

Wikipedia e Twitter do mapa da Web mundial

Wikipedia e Twitter do mapa da Web mundial

O mapa do metrô é dividido em linhas com cores específicas como “linha de publicação”, “linha de notícias”, “linha de compartilhamento”, etc. A linha cinza que tem a Wikipédia, mostrada na figura, por exemplo, é a “linha do conhecimento”. Ela abrange sites como OReilly.com, How Stuff Works, IMDB, w3schools, linux.org, etc.

Veja também: Mapa dos 80 melhores blog (brasileiros e internacionais) segundo a revista Época.

Vi no Revolucao.etc.br.

10 habilidades essenciais para desenvolvedores para os próximos 5 anos

Só pra tirar o mofo desse blog, vou ver se volto ao ritmo de postagens de antes.

Repassando um artigo interessante que li hoje sobre habilidades importantes para desenvolvedores para os próximos anos… 10 skills developers will need in the next five years. Adiantando a lista:

  1. Usar uma das “três grandes” linguagens: Java, .NET ou PHP
  2. Aplicações ricas (Rich Internet Applications) com Flex, JavaFX, Silverlight, HTML5, Ajax, etc.
  3. Desenvolvimento Web
  4. Web Services
  5. Habilidades gerenciais e relacionamentos fora do departamento de TI
  6. Usar alguma linguagem dinâmica ou funcional (Ruby, Python, F# ou Groovy)
  7. Metodologia Ágil
  8. Conhecimento de domínio
  9. Ambiente de desenvolvimento adequado (SVN, ferramentas de bug tracking, etc)
  10. Desenvolvimento de sistemas embarcados

E aí? Quantos itens dos 10 você já faz?


posts por mês

assine esse blog

minhas tuitadas

favoritos@del.icio.us

eu uso





Powered by FeedBurner

estatística

  • 16,124 acessos
junho 2017
S T Q Q S S D
« dez    
 1234
567891011
12131415161718
19202122232425
2627282930