En mayo de este año, Microsoft anunció el lanzamiento de Bing (www.bing.com), un nuevo buscador basado en tecnologías semánticas. Este buscador está disponible en forma de versión definitiva para Estados Unidos, y existe una versión beta para Europa a la que se le irán añadiendo progresivamente algunas funciones de la versión estadounidense. Por el momento, consultas como "¿Quién fue la mujer de Salvador Dalí?" o "¿Cuándo murió Hermann Minkowski?" obtienen la respuesta correcta en la versión estadounidense, pero todavía no en la europea.

Interfaz minimalista de Bing. No todas las funciones están disponibles por ahora para la versión europea del navegador.


Parte de las tecnologías semánticas que usa Bing provienen de Powerset, empresa especializada en búsquedas semánticas mediante lenguaje natural y que fue adquirida en agosto de 2008 por Microsoft. El primer producto de Powerset es un buscador en lenguaje natural para la Wikipedia (www.powerset.com). En el cuadro de búsqueda se pueden introducir palabras, frases y preguntas. Los resultados del buscador de Powerset son bastante precisos, y en algunos casos incluso puede responder directamente ciertas preguntas. Por ejemplo, si introducimos las preguntas "When did Julio Cortázar die?" (¿Cuándo murió Julio Cortázar?), "Where did Julio Cortázar die?" (¿Dónde murió?) y "Was Julio Cortázar married?" (¿Estuvo casado?), descubriremos que el escritor argentino murió el 12 de febrero de 1984 en París y que estuvo casado tres veces: primero con Aurora Bernárdez, luego con Ugné Karvelis y finalmente con Carol Dunlop (según varias biografías del escritor, nunca contrajo matrimonio con Ugné Karvelis, pero supongo que esa información estará mal en la Wikipedia en inglés). Si preguntamos "What did Julio Cortázar write?" averiguaremos que escribió, entre otros libros, Rayuela, Las armas secretas, Final del juego, Fantomas contra los vampiros internacionales y Bestiario.

Ejemplo de consulta en Powerset: ¿dónde murió Julio Cortázar? En este caso, la respuesta es directa.


Si, por ejemplo, preguntamos cómo murió Ernest Hemingway ("How did Ernest Hemingway died?"), el buscador de Powerset responde directamente que la causa de la muerte fue suicidio -era de esperar esa muerte en un hombre que afirmó: "Cazo y pesco porque me gusta matar, porque si no matara animales me suicidaría"- y muestra una imagen que no invita a disfrutar de la vida, precisamente.

Ejemplo de consulta en Powerset: ¿cómo murió Ernest Hemingway? En este caso, la respuesta es directa.


Según Microsoft, Bing combina tecnología de búsqueda semántica y minería de datos. Por necesidad, esta minería de datos es muy rápida: cuando se realiza una búsqueda por palabras clave hay que determinar los conceptos relacionados con estas palabras (por ejemplo, sinónimos), buscar también recursos de la web con esos conceptos y determinar su pertinencia para los resultados de la búsqueda.

Según declara Microsoft, Bing no es un sistema completo de búsqueda semántica por cuestiones de velocidad: analizar el contenido completo de todos los recursos de la web haría que la obtención de resultados fuera muy lenta. Con todo, es probable que el desarrollo de nuevos algoritmos o el perfeccionamiento de los actuales haga posible búsquedas semánticas completas en tiempos muy reducidos.

La aparición de este buscador es una buena noticia, porque es un paso más hacia la Web semántica (por el momento, sólo existen "islotes semánticos") y a la popularización de las tecnologías semánticas. Cada vez hay más grandes empresas que utilizan ontologías y lenguajes formales para manejar los datos que almacenan en sus servidores y centros de datos y para navegar por ellos. Bing también obligará a la empresa Google a que utilice más y mejores tecnologías semánticas en su buscador: la efectividad de la publicidad, así como los ingresos derivados de ésta, será mucho mayor con el uso de tecnologías semánticas que entiendan el significado de las búsquedas y que, por ende, permitan encontrar exacta y rápidamente lo que el usuario busca.

Por el momento, Google usa algoritmos semánticos que detectan relaciones y conceptos relacionados con las palabras clave que introduce el usuario, y los utiliza para sugerir búsquedas relacionadas con las palabras clave introducidas. En la captura de pantalla siguiente puede verse cómo la consulta "corriente filosófica" da lugar a sugerencias de búsquedas relacionadas con el idealismo, el empirismo, el racionalismo, el positivismo, la filosofía de John Locke, de Heidegger, etc. Aunque no hay mucha información sobre estos algoritmos semánticos, supongo que usan taxonomías u ontologías para determinar qué clasificación asignar a los contenidos más importantes de las páginas, y luego determinan mediante reglas de clasificación si las palabras clave de búsqueda corresponden a conceptos y relaciones de esas taxonomías u ontologías. Además, supongo también que la exactitud de las búsquedas relacionadas se va comprobando y refinando teniendo en cuenta qué proporción de usuarios las selecciona.

Google incorpora un sistema de búsquedas relacionadas basado en tecnologías semátnicas.


Fuente.