Soporte en línea MSN

Accede a...

WebmailcPanelBoletín

Los metadatos detrás de cada Twit
Escrito por JCP   
Martes, 17 de Mayo de 2011 08:46

 

En Twitter cada día se envían algo más de 50 millones de tweets (frente a 200.000 millones de correos electrónicos). A 140 caracteres por tweet, equivale aproximadamente al contenido de un disco de 7GB. Un mundo de mensajes cortos, la mayoría irrelevantes, inconexos en su conjunto, dedicados a la comunicación de un instante.

Pero esa cifra es solo la punta del iceberg. Bajo la superficie del texto, cada tweet va embebido en un envoltorio de software que ocupa mucho más espacio: Hasta 10 o 12 veces más que el propio mensaje. Son los metadatos, paquetes de información que acompañan al mensaje de un lado a otro de la red, pero que el usuario raramente llega a ver.

Tales datos contienen información muy valiosa, si se sabe aprovechar. Dicen mucho acerca de quién, cómo, cuándo y dónde se ha originado el tweet. Un filón para quien se dedique a la minería de datos que, después venderá a las agencias de publicidad y mercadotecnia.

Un "objeto tweet" empieza con una simple "matrícula" de más de diez dígitos que permite identificarlo a lo largo de su recorrido por el ciberespacio.

Después vienen los 140 caracteres reglamentarios (que pueden reducirse si no se utilizan caracteres complejos). Y a partir de ahí, docenas de datos adicionales, incluyendo los nombres o alias del autor, su dirección en la red y desde dónde escribe. También contiene información para identificar la foto del autor, si la hay, la fecha en que creó su cuenta, qué idioma usa, la zona horaria desde donde trabaja, el número de personas a las que sigue y el número de contribuciones que ha hecho.

Las posibilidades son inmensas y un tanto intranquilizadoras. Por ejemplo, cabría investigar las preferencias de un segmento de población, acotado según edades y área geográfica: Cuáles son sus tendencias de voto, sus películas favoritas, sus programas de televisión o incluso qué marcas prefieren. Un verdadero tesoro de información, que algunas empresas comienzan a escarbar.

Son los casos de Crimson Hexagon y Mediasift, que acaban de llegar a un acuerdo con Twitter para acceder a los metadatos de ese tráfico de 50 millones de tweets diarios. La empresa británica, distinguida con premios internacionales por su autoría del botón verde de retweetme, mide y descontextualiza los datos por un precio anual, en su máxima complejidad, de 8.000 dólares.

Gracias a programas complementarios, como Lexalytics, la minería de datos va mucho más allá de saber de dónde proceden los mensajes o qué seguidores tiene quién. En este caso, las computadoras de Mediasift son capaces de distinguir el lenguaje: si se habla bien o mal de una marca, de una película o de cualquier producto que se lanza a la venta; dónde tiene más o menos éxito, entre qué edad y qué sexo. Y todo prácticamente en tiempo real, es decir, mucho más rápido que Google Analyticis. Tweetear es algo más que un pasatiempo.


Fuente: segu-info.com.ar

 

Suscríbete al boletín

Introduce tu correo electrónico:


Diseño y hosting: Onteris.NET