Oportunidades de la web semántica en medios online

Hace un tiempo que en BNamericas estamos trabajando y desarrollando tecnologías semánticas para poder extraer entidades (empresas, personas, lugares, términos) de nuestros contenidos no estructurados, o sea las noticias.

Supone encontrar los términos más relevantes en un texto, entendiendo el contexto, la sintaxis de cada oración para diferenciar los sustantivos de los verbos y así localizar las entidades críticas en el documento. Eso requiere un poco más de explicación de cómo se logra, pero que lamentablemente se topa con el lado estratégico de la empresa donde estoy trabajando. De todos modos, cualquier persona con un poco de curiosidad pronto encontrará las pistas para seguir, como las que señalo a continuación.

Hoy por casualidad me enteré del proyecto lainformación.com. Aunque en una primera mirada pareciera ser más de lo mismo, lo que me parece más interesante es el acercamiento a la web semántica que están haciendo. En este caso, todos los sistemas de agregación de contenidos en los que se basan para construir el portal de noticias son sometidos a un proceso de extracción de entidades y minería de texto. El resultado es que lainformacion.com puede generar páginas tópicos o índices para cada entidad.

Lo que en la práctica significa que pueden armar 10 mil portadas, una para cada entidad. En una forma muy inteligente, lainformacion.com está poniendo en práctica a su favor la teoría de la cola larga (The Long Tail) para obtener tráfico desde los motores de búsqueda. Ya que en el corto plazo, va a ser uno de los pocos medios en español que tenga una página tipo portada que contenga decenas de notas, fotos, etc. sobre un tema ultra específico.

Estamos hablando de una especie de Wikipedia de noticias, cada persona, lugar, empresa o tópico, genera una entrada semi-enciclopédica, una suerte de portada de una categoría en forma automática. Es muy probable que Google comience inmediatamente a amar a este sitio, el trabajo viene hecho, está actualizado, etiquetado, optimizado.

semantic-fast

Resultados de una búsqueda usando Fast, al costado aparecen las entidades extraidas de los textos.

En nuestro país, y con un poco menos de conciencia de la web semántica, parte de la gracia del buscador de Emol es que al hacer una búsqueda, al costado izquierdo aparecen las entidades extraídas de las noticias como fuente, persona, empresa, lugares etc.

En este caso, lo que hace la tecnología desarrollada por los noruegos de Fast es crear navegadores que permiten refinar la búsqueda. Pero también están a un paso de crear estas mismas portadas temáticas, con el contenido que reside en las bases de datos de El Mercurio.

Esto significa que muchos medios online que tienen enormes bases de datos históricas pueden por fin ponerlas a disposición de la web en una forma semántica, es decir, ordenada, categorizada, comprensible y además, optimizada para que sean estas páginas tópicos las que primero salgan en los resultados de búsqueda. El resto es esperar.

La nueva cara de Terra

La versión española del portal presentó su nueva versión disponible en beta.terra.es. La nueva diagramación termina con las pequeñas tipografías y cajitas modulares características desde que este portal apareció en la web hace ya casi 9 años.  La navegación ya no es más vertical, sino que una barra superior muestra todos los canales del sitio. Además destaca cada área de contenido en la columna central y llos servicios en una barra vertical.

Tal como hemos venido notando en el último tiempo, la verticalidad de las portadas sin miedo al “scroll” es la forma más útil que los medios han diseñado, teniendo en cuenta la necesidad de mostrar todo su amplitud de contenidos, pero además aumentar los espacios publicitarios en las zonas inferiores de la pantalla. La nueva portada es probable que influencie al resto de sus filiales en América Latina en el curso de los próximos meses

Yahoo quiere conquistar los países emergentes y el negocio de la publicidad móvil

Ayer nos enteramos del lanzamiento de la edición chilena del Yahoo, que demuestra la nueva estrategia del portal. Hace ya varios años la presencia de la empresa en América Latina se había estancado.

Sólo México, Brasil y Argentina alcanzaron a contar con una edición local desde principios de la década. A diferencia de Google, que rápidamente se acercó a la mayoría de los países de la región, con Google News y el dominio local respectivo.

La idea de Yahoo es que en los próximos tres años los ingresos por publicidad vendrán de mercados emergentes, con un crecimiento esperado del 30%, según Reuters. Esta alza vendrá de países en desarrollo donde el acceso online principalmente es a través de teléfonos celulares, y donde Yahoo tiene 130 millones de usuarios en Sudeste Asiático, India y Latinoamérica.

La empresa predice que la penetración de usuarios por celular crecerá cinco veces más rápido que la de los de internet. Dada esta nueva realidad, los ejecutivos esperan atacar mediante un producto con enfoque local con una plataforma móvil.

Yahoo! presenta su propio Digg

Mouse.cl:

 Buzz, [es] un sitio con un diseño agradable y cargado a las imágenes. Si una noticia o video te parece interesante o increíble, debes presionar el botón “Buzz up” y subirá en el escalafón. De lo contrario, la opción “buzz down” mandará el tema hacia abajo.

¿Quien sería el n°3 después de Google y Microsoft-Yahoo?

En un mundo de Falabella, Ripley y Paris existe siempre un La Polar. En el caso de los medios online a nivel mundial pasa lo mismo aunque no sea la empresa más glamorosa ni la más mencionada en los blogs geeks.

¿Después de una fusión entre Yahoo y Microsoft quien pasaría a ser el tercero? Pues existen varios a la cola como Time Warner o Fox, además de sitios como ebay y Wikipedia, pero sólo en términos de audiencia. Por ejemplo Wikipedia está concebida como sin fines de lucro y eBay está orientado a la compra y venta, más que al contenido.

Los otros 2 son compañías tradicionales con propiedades web, que no les va nada de mal, pero no son digitales como Google o Yahoo por naturaleza.

Entonces, quién tiene la mayor oportunidad para pasar al tercer lugar, pues una gran compañía que hace muchísimas cosas, pero que hasta ahora pasa calladita al menos en el mercado hispanoparlante. Se trata de IAC, una empresa con más de 20 mil empleados en 28 países . A diferencia de los 3 gigantes conocidos por todos, IAC han desarrollado experiencias de marca, con más de 60, con particular éxito en retail online, sitios de suscripción y transacciones.

No son colosos de la tecnología, pero tienen buenos productos como Bloglines y Ask. No les va espectacular, pero se han mantenido a lo largo de l0s años como demuestra el gráfico de su acción desde 1993 a la fecha:

iac.gif

Y entre sus marcas de medios digitales y sitios de consumo más populares están:


En comercio y transacciones:

Terra presenta Cyloop, su red social de música

CincoDias.com

El proyecto, que será promocionado de forma intensiva por la operadora en pocas semanas, es una clara competencia para la popular red social Myspace, de Rupert Murdoch. Cyloop es un portal donde los internautas pueden crear sus perfiles, confeccionar sus listas de audio y escuchar de forma gratuita cientos de miles de canciones en streaming, que suben los propios grupos, solistas o las discográficas. El proyecto es de la compañía estadounidense Hoodiny Entertainment, con sede en Miami e infraestructura en Los Ángeles y Madrid. Cyloop se ha convertido desde el pasado noviembre en el sitio de música de Terra, tras cerrar Telefónica un acuerdo en exclusiva para España con la firma americana.

Nueva portada para la BBC (beta)

El portal de BBC está probando una interfaz nueva que tiene una diagramación más limpia y guiños al diseño de la web2.0. También incluye funcionalidades de páginas como Netvibes, que permiten personalizar la disposición de los módulos de contenidos. Los usuarios también pueden fijar su ubicación, lo que les permite obtener información sobre el tiempo, noticias, programas de radio o televisión dentro de Gran Bretaña. Además la búsqueda ocupa un lugar muy relevante en la parte superior de la página. Esta versión se encuentra en beta y es posible ver una versión internacional y otra para el Reino Unido.