Posts Tagged 'tags'

Sugestão de tags

Sugestão de tags é a tarefa de ajudar os usuários a etiquetar recursos (ex: páginas no del.icio.us) recomendando tags relevantes. A principal estratégia é usar tags já usadas para descrever o mesmo conteúdo ou recursos similares.

Como esse é um dos tópicos que eu vou trabalhar em Portugal, resolvi fazer meu trabalho de Recuperação de Informação em cima do assunto (Apresentação do projeto aqui). O protótipo ainda não tem tanta precisão e sugere tags muito genéricas, mas foi um primeiro passo interessante.

Nesse projeto, resolvi usar só o conteúdo textual dos recursos, que nesse caso são artigos da Wikipédia sobre Engenharia de Software, Redes de Computadores e Inteligência Artificial totalizando mais de 6000 artigos.

Alguns exemplos:

C++ – Programação C Linguagem Software Código

UML – Software Modelagem Engenharia UML Desenvolvimento

Model Driven Architecture (MDA) – Software Desenvolvimento Programação Modelo Processo

Todo a coleção: Software Internet Programação Linguagem Sistema Linux Código Computador X Livre Rede Web Windows Dados Redes

Uma coisa que poderia ficar melhor era usar recursos similares, páginas da Wikipédia já rotuladas no del.icio.us, agrupar tags, tentar melhorar as fórmulas, etc. Enfim, é isso… It’s a long way.

O jogo dos (meta)dados

Houve uma discussão sobre a burocracia da Web Semântica num post anterior. Precisamos rolar os dados… Devem haver métodos FÁCEIS (user-friendly), xuxu beleza, dinâmicos, sociais, etc (ao quadrado) para representar conhecimento (dados e metadados) de forma organizada e processável. Não precisa ser tão burocrático!

Só assim a Web pode ser semântica numa escala tão grande como ela agora ou ela daqui a 1 ano, 1 segundo. Mas para garantir semântica precisamos de algumas estruturas (e ontologia é apenas uma delas, porém, a mais completa, formal e bem estudada) para organizar a bagunça.

Duas formas de fazer isso que levam muito em consideração o que a Web 2.0 trouxe, sem precisar editar OWL e saber Lógica de Descrição: folksonomias e Wikis Semânticos. Folksonomias já foram explicadas. Wikis Semânticos são ambientes de edição Wiki onde atributos como relações entre páginas, suas categorias e hierarquias podem ser descritas “in a Wiki way”, facinho como editar um artigo da Wikipédia. Uma grande feature de um Wiki Semântico são os links tipados. É só colocar um rótulo no link, é só dizer o que este link significa. Soa fácil né? Pois é! Veja aí a figura. É do artigo sobre a extensão semântica do MediaWiki (software que a Wikipédia usa debaixo dos panos).

Links tipados no SemanticMediaWiki

Links tipados no SemanticMediaWiki

Um usuário comum e saltitante quer tarefas fáceis, produzir ontologias não é uma delas. Eles querem fazer como os times do Renato Gaúcho, BRINCAR! Assim, o conhecimento deles precisa ser capturado com interfaces analfabetas como caixinhas de texto para tags. Até mesmo tipar links pode ser impeditivo. E agora? Vamos precisar dos “engenheiros de conhecimento” da época dos sistemas especialistas e da “I.A. de papai” pra produzir todas as ontologias? I don’t think so.

Com estruturas de semântica fraca como folksonomias temos dados capturados de qualquer tipo de usuário. Podemos então usar técnicas de estatística, processamento de linguagem natural e análise de redes sociais para a inferência de conhecimento mais formal, que pode servir tanto pra melhorar a propria folksonomia ou para agregar serviços ao site que faz uso do sistema de social tagging. Podemos fazer com que isso convirja para uma ontologia!

Além disso, metadados servem para fazer anotação semântica, ou seja, informação numa página que é processada por agentes com conhecimento de ontologias. Por exemplo, usar metadados dublin core para especificar autor, título e outros dados pessoais numa página, de maneira formalizada, é um começo.

Á-RRAI! I-HI! Web Semântica vale UM MILHÃO!

Á-RRAI! I-HI! Web Semântica vale UM MILHÃO!

Finalmente… vamos usar estruturas com semântica formal bem definida como ontologias ou estruturas de semântica leve e depois extrair essas informações? Eis a pergunta que vale 1 milhão de reais, e talvez não precisemos tanto da ajuda dos universitários, MÁ ÔI!

A fantástica fábrica de conhecimento

Disseram que é só pensar nas primeiras palavras que nos vêm a cabeça sobre o conteúdo de uma página Web e digitar numa caixinha e mandar pro Digg, pro Del.icio.us, pro flickr. Aí se organiza o caos! Fácil né?!

Imagine um supermercado você pode colocar etiquetas em vinhos para classificá-los. Você pode se valer da opinião “etiquetada” de outros consumidores para decidir que marca comprar. Você pode enviesar sua opinião pela classificação de amigos e pessoas próximas.

Já que a classificação foi útil, você também rotula o vinho consumido, para beneficiar mais pessoas, como aconteceu com você. Outra coisa, as pessoas que gostam de vinho frisante como você se identificarão através das etiquetas. Uma comunidade pode surgir!

Isso é o que acontece nos sistemas de Social Tagging (Etiquetamento social??! %$#%!@#, em português fica esquisito, sugestões?). Usando o conceito de atribuir tags (palavras-chave) a recursos da Web como fotos, artigos e páginas favoritadas, eles surgiram como a salvação do rock há alguns anos atrás, no meio do boom da Web 2.0.

definição gráfica for dummies

Folksonomia: definição gráfica for dummies

Com vários apreciadores classificando vinho, podemos então separar os tintos dos brancos, e criar várias outras categorizações. Na Web, isso significa facilitar a navegação, recuperação, descoberta e organização de conteúdo (ou conhecimento!).

É dessa interação de bêbados tomando vinho e classificando produtos que surgem as folksonomias, termo oriundo da junção das palavras folk (pessoas) e taxonomia (estrutura de classificação hierárquica formal), estruturas que organizam o conteúdo rotulado. Um exemplo disso é a estrutura de nuvem de tags (tem uma aqui do lado direito!).

Porém, existem vinhos intragáveis. Vinhólatras (e usuários Web!) podem usar classificações que só valem para organização própria, com rótulos como “comprar mais semana que vem”. São as chamadas tags egoístas, tema pro próximo post.

Além disso, as folksonomias estão bem longe de taxonomias, pois a classificação é “flat”, ou seja, não existem relações entre os conceitos (tags) usados de modo a criar hierarquias, tudo está no mesmo nível. Não se pode dizer que “tinto suave” é uma sub-categoria de “tinto”. Outro pano pra manga que fica pra depois…

Saiba mais:

Sobre o surgimento e definição do termo, pelo criador
Folksonomia e a maneira com que nós colocamos ordem nas coisas (no revolução.etc)
Tags e folksonomia: o usuário classifica a informação (no webinsider)

Apresentações

Ícaro Medeiros, 21 anos, mestrando em Ciência da Computação pela UFPE. Graduado no mesmo curso, pela UFAL.

Viciado em ciência, computação, Web e em escrever. É através dessa combinação que surge este blog. Alguns tópicos:

  • Web 2.0: o quê? por quê? pra quê? como?
  • Redes sociais: as mesmas perguntas.
  • Busca: como achar o que queremos num universo de informação?
  • Web Semântica: o que temos até agora?
  • Tags, folksonomias e suas implicações.
  • Ontologias: definições, aplicações, pesquisa.
  • Inteligência Artificial: saindo do mundo acadêmico para a vida real.
  • Arte, tecnologia em geral, cinema, música, literatura, cotidiano (pausa pra respirar)!

Esses tópicos permeiam minha vida acadêmica há algum tempo. O blog surgiu da necessidade de escrever sobre esses assuntos, ter o feedback dos leitores, enfim, criar um centro de informações (a princípio pra mim) e uma comunidade (a princípio contando apenas comigo) sobre esses assuntos.

Espero que esses “a princípio” desapareçam logo e eu tenha leitores ativos, que venham ao blog ler, comentar e procurar informações.

E por que não falar de outras coisas, de música, de literatura, de cinema e qualquer outra aleatoriedade? Estou aqui pra isso também. Afinal, ninguém é de ferro, eu não faço só estudar e os bares existem pra gente beber cerveja e falar sobre arte, certo? Sinta-se, portanto, num boteco. Pode xingar o presidente nos comentários!

Primeiro post “na vera” em breve.


posts mais populares

posts por mês

assine esse blog

minhas tuitadas

Erro: o Twitter não respondeu. Por favor, aguarde alguns minutos e atualize esta página.

favoritos@del.icio.us

eu uso





Powered by FeedBurner

estatística

  • 16,119 acessos
junho 2017
S T Q Q S S D
« dez    
 1234
567891011
12131415161718
19202122232425
2627282930