martes, 6 de julio de 2010

Web semántica - el buscador

La web contiene un número de documentos difícil de calcular, si tomamos un ejemplo de un buscador especializado en guías y tutoriales, nos puede ayudar a valorar la ingente información acumulada en Internet.

The Guide DB es un buscador—basado en la API de Google—que permite mostrar en los resultados de búsquedas, guías, tutoriales o instrucciones de cualquier producto e índole. Este buscador tiene indexados, poco menos de 48 millones de documentos.

Uno de los problemas que plantea la web actual es el acceso a la información depositada en ella, los buscadores realizan el trabajo de seleccionar la información solicitada, mostrando respuestas según su capacidad de análisis, Google, el buscador más utilizado, nos mostraría como respuesta documentos que incluyeran las palabras utilizadas en la búsqueda a modo de etiquetas (tags), jerarquizados por el número de hiperenlaces que contenga y apunten al documento. Esta forma de búsqueda resulta poco ágil y precisa.
Nos gustaría poder formular preguntas simples y obtener respuestas concretas, disponer de una web semántica en la cual los buscadores supieran lo que buscan.

Ejemplos de búsquedas publicado en Guía Breve de Web Semántica

Los pasos que se están dando para la consecución de la web semántica tiene varios frentes, ya sabemos que la información contenida en la web es incomprensible para las máquinas que la contienen y el lenguaje que utilizan para comunicarse (HTML) es la sintaxis del contenido, insuficiente para dotar de sentido la información que albergan.

Nova Spivack el cual se define como un futurólogo de la tecnología (Nova Spivack is a technology futurist...), presenta 5 aproximaciones a la web semántica (dentro de la presentación recogida en Entendiendo la web semántica, recogida en Nova Spivack: Entender (ahora sí) la web semántica):



  • Etiquetado (tagging), marcadores sociales como Flickr, Delicious, Wikipedia.



  • Estadísticas, buscadores como Google y Lucene como API para indexado y búsqueda de texto.



  • Lingüísticas, como Powerset, realiza búsquedas en artículos publicados en Wikipedia, actualmente forma parte del buscador Bing.



  • Web semántica, como Dbpedia proyect que extrae información de Wikipedia usándola como base de datos, Metaweb que extrae información de redes sociales, noticias de medios y otros dominios cerrados, también en esta categoría encontramos Evri, buscador que hereda el proyecto de Radar Network, Twine. Evri propone al usuario entradas o sitios relacionados con su busqueda.



  • Inteligencia artificial, Cycorp con el proyecto Cyc, intenta reunir una base de conocimiento cotidiano con una definición ontológica del mismo.
Estas actuaciones nos aproximan cada día un poco más al ideal de web semántica, las previsiones serán y están siendo de una evolución tan rápida que tal vez no somos conscientes de que manera actúan en nuestro entorno.
En campos como la medicina, el uso del teléfono móvil en lugares remotos proporciona acceso al diagnóstico del paciente.

La búsqueda de la correcta información en Internet, a día de hoy sigue siendo farragosa, esta circunstancia no ayuda por ejemplo, al despegue de la publicidad, una publicidad poco focalizada puede ser contraproducente.

Evri se presenta como buscador semántico, con las limitaciones del desarrollo actual, pero dando una visión distinta del buscador como lo conocemos ahora, dispone de una serie de fuentes de información (dominios cerrados y bases de datos) que posibilitan relacionar datos, y mostrar no sólo documentos relacionados, también otros aspectos de concordancia (datos de la entidad o persona, tiendas, comentarios en redes sociales..).
La caja de búsqueda te muestra relaciones de lo que escribes, curioso los datos que maneja, si escribes “paella”, lo identifica como “food”. Que listo.


No hay comentarios: