¿A dónde va la web semántica?

Me encanta la web semántica. Pasé mucho tiempo antes y después de alrededor de 2000 en la web semántica legal, definiendo vocabularios, ontologías, entrando en XML, RDF, DAML, OWL, construyendo modelos de conocimiento, adaptándolos a usos pragmáticos. En el ámbito legal, por ejemplo, es fascinante cómo algo relativamente sencillo como un “veredicto” en un caso tiene matices completamente diferentes en diferentes sistemas legales. Definir esto en varios sistemas legales europeos y estadounidenses (y más adelante, también en algunas leyes islámicas) es un gran desafío, pero potencialmente muy gratificante.

Sin embargo … se topa con los límites de lo que puede modelar si no hay una gran cantidad de fondos (lo que requiere beneficios empresariales reales, no solo interés académico o idealismo). Definiciones muy completas, o incluso una taxonomía y vocabulario útiles es una cantidad increíble de trabajo, y es casi imposible de automatizar. Esto significa que, al final, los proyectos no brindan beneficios tangibles (o al menos no están cerca de los recursos gastados); por lo general no llegan a eso.

Todo eso es solo una manera larga y anecdótica de llegar a mi punto.

Marcar el contenido de una manera significativa tiene un enorme potencial. Esto significa que podemos automatizar todo tipo de inferencia, unir todo de manera sistemática. En todo caso mejoraría enormemente la búsqueda. También podría usarse para construir sitios completamente dinámicos y personalizados. Si define explícitamente “esto es una persona, con estos atributos” de forma legible por la máquina; y haces lo mismo para todos los tipos de significado en el contenido; realmente puede comenzar a usar el contenido en sí mismo de formas mucho más útiles, en lugar de tener solo gotas de contenido que no tienen significado para la máquina.

Para mí, la esencia de la “web semántica” comienza por marcar un significado en el hipertexto; y conduce a la creación de definiciones coherentes de cómo todo se relaciona entre sí.

Pero como en mi proyecto “Legal XML”, en la práctica, esto es muy difícil de poner en marcha. Y es casi igual de difícil encontrar una justificación a corto plazo para poner en ese esfuerzo. Lo mismo es lo que ha frenado la web semántica en cualquier otro lugar. Todavía hay fanáticos que han estado en esto por más de una década, y de alguna manera no se mostraron lo suficientemente escépticos como para dejar de intentarlo; y todavía hay nuevas personas que se están incorporando a esto cuando se dan cuenta del potencial, posiblemente ilimitado. Y todos ellos todavía lo están animando como “Web 3.0”, la gran ola que vendrá después de la Web 2.0. (Tiendo a argumentar que, históricamente, esto ocurrió entre la Web 1.0 y la Web 2.0, y se quedó atrás. Además, hay demasiadas cosas diferentes que afirman ser 3.0).

No quiero decir que sea tan cínico como probablemente suene, ya que como dije al principio … Me encanta la web semántica.

Entonces, ya que es mucho trabajo duro; y no hay suficientes resultados tangibles para compensar esto (en parte debido al arduo trabajo requerido para lograrlo); y debido a eso, todavía no hay muchos sistemas de soporte para que sea más fácil; a donde va esto

Creo que con el tiempo, comenzará a repuntar de nuevo. Pero esta vez, como una combinación de procesos automatizados (herramientas de análisis de texto, categorizaciones automáticas, etcétera, aunque solo lo sugieran, facilitaría mucho el avance) y la lógica y la estructura formalizadas.

Vemos los primeros signos de que esto comienza a suceder. Muchas herramientas populares de “blob” (como WordPress) hacen que sea más fácil crear modelos de contenido más granular. Esto hace que sea más fácil producir marcado “semántico”.

En el lado de “pago” de las cosas, los motores de búsqueda están empezando a presionar para esto. Schema.org tiene muchas definiciones listas para usar. (Ha sido vilipendiado por usar “la sintaxis equivocada”, pero creo que eso no se nota). El beneficio en la vida real de la web semántica ahora comienza a verse desde el SEO. Si marca su receta como una receta, Google tendrá una presentación mucho mejor. Si se marca como autor en su blog, Google tendrá su foto.

Este es un driver importante para la web semántica. Demuestra el valor (y hace que la gente piense cómo proporcionar ese valor). Es el beneficio más tangible hasta ahora.

Así que mi conjetura es, llegaremos allí (lentamente). Y es un tema fascinante, incluso si no lo consigues en ninguna parte; Vale la pena estudiarlo, aunque solo sea por la experiencia.

Web 3.0 también se conoce como web semántica y es un movimiento mutuo del estándar internacional W3C (World Wide Web Consortium). La web semántica es un intento de mejorar la web actual para que las computadoras puedan procesar la información existente en WWW, entenderla y arreglarla y ayudar a los humanos a descubrir el conocimiento requerido. Se propone formar un enorme sistema basado en el conocimiento distribuido para compartir datos en lugar de documentos. En otras palabras, podemos decir que la web semántica es un marco común que permite que los datos se compartan y reutilicen a través de las aplicaciones, las empresas y los límites de la comunidad. El aspecto de la red semántica fue pensado por el científico cognitivo Allan M. Collins, el lingüista M. Ross Quaillin y la psicóloga Elizabeth F. Loftus en 1960 en muchas publicaciones para representar el conocimiento estructurado semánticamente. Tim Berners-Lee acuñó el término web semántica para ampliar la red de contenido legible por humanos (páginas web) con hipervínculo insertando contenido legible por máquina (metadatos) sobre las páginas y su interacción al permitir que los agentes accedan a la web de manera más inteligente y realizar tareas en nombre de los usuarios.

“Una web de datos que las máquinas pueden procesar directa e indirectamente es la web semántica”, Tim Berners-Lee.