Nube de etiquetas - Tag cloud

Foundation -l word cloud, creada con los archivos de lista completos en gzip (sin correos electrónicos duplicados de archivos y todos los encabezados y texto citado en el cuerpo), utilizando IBM Word Cloud Generator build 32.
Una nube de etiquetas con términos relacionados con la Web 2.0

Una nube de etiquetas ( nube de palabras o wordle o lista ponderada en el diseño visual) es una representación visual novedosa de datos de texto, generalmente utilizada para representar metadatos de palabras clave (etiquetas) en sitios web, o para visualizar texto de forma libre. Las etiquetas suelen ser palabras sueltas y la importancia de cada etiqueta se muestra con el tamaño de fuente o el color. Este formato es útil para percibir rápidamente los términos más destacados y determinar su importancia relativa. Término más grande significa mayor peso. Cuando se utilizan como ayudas a la navegación del sitio web, los términos se vinculan a elementos asociados con la etiqueta.

Historia

Heidi Paris: borrador inicial de la portada de la edición alemana de "A Thousand Plateaus" de Gilles Deleuze y Fèlix Guattari, fechado el 14 de noviembre de 1991

En el lenguaje del diseño visual, una nube de etiquetas (o nube de palabras) es un tipo de "lista ponderada", como se usa comúnmente en los mapas geográficos para representar el tamaño relativo de las ciudades en términos de tamaño de letra relativo. Un ejemplo impresa temprana de una lista ponderada de palabras clave en inglés fueron los "archivos del subconsciente" en Douglas Coupland 's Microsiervos (1995). Una aparición alemana ocurrió en 1992.

La forma visual específica y el uso común del término "nube de etiquetas" se destacaron en la primera década del siglo XXI como una característica generalizada de los primeros sitios web y blogs de la Web 2.0 , utilizada principalmente para visualizar la distribución de frecuencia de los metadatos de palabras clave que describen el sitio web contenido y como ayuda para la navegación.

Las primeras nubes de etiquetas en un sitio web de alto perfil estaban en el sitio para compartir fotos Flickr , creado por el cofundador y diseñador de interacción de Flickr Stewart Butterfield en 2004. Esa implementación se basó en Search Referral Zeitgeist de Jim Flanagan, una visualización de los remitentes del sitio web. Las nubes de etiquetas también fueron popularizadas por la misma época por Del.icio.us y Technorati , entre otros.

La sobresaturación del método de la nube de etiquetas y la ambivalencia sobre su utilidad como herramienta de navegación web llevaron a una notable disminución del uso entre estos primeros usuarios. Más tarde, Flickr "se disculparía" con la comunidad de desarrollo web en su discurso de aceptación de cinco palabras para el premio Webby "Mejores prácticas" de 2006 , donde simplemente dijeron "perdón por las nubes de etiquetas".

Una segunda generación de desarrollo de software descubrió una mayor diversidad de usos para las nubes de etiquetas como método básico de visualización de datos de texto. En este contexto, se han propuesto varias extensiones de nubes de etiquetas.

Tipos

Una nube de datos que muestra la población de cada uno de los países del mundo. Creado en R con el paquete wordcloud . Datos de la población del país . Tenga en cuenta que los tamaños proporcionales de China e India se dividieron a la mitad.

Hay tres tipos principales de aplicaciones de nube de etiquetas en el software social , que se distinguen por su significado más que por su apariencia. En el primer tipo, hay una etiqueta para la frecuencia de cada elemento, mientras que en el segundo tipo, hay nubes de etiquetas globales donde las frecuencias se agregan para todos los elementos y usuarios. En el tercer tipo, la nube contiene categorías, y el tamaño indica el número de subcategorías.

Frecuencia

En el primer tipo, el tamaño representa la cantidad de veces que se ha aplicado esa etiqueta a un solo artículo. Esto es útil como un medio para mostrar metadatos sobre un elemento que ha sido "votado" democráticamente y donde no se desean resultados precisos.

En el segundo tipo, más comúnmente utilizado, el tamaño representa el número de elementos a los que se ha aplicado una etiqueta, como una presentación de la popularidad de cada etiqueta .

Significado

En lugar de la frecuencia, el tamaño puede ser usado para representar el significado de las palabras y de palabras co-ocurrencias , en comparación con un fondo corpus (por ejemplo, en comparación con todo el texto en Wikipedia). Este enfoque no se puede utilizar de forma independiente, sino que se basa en comparar las frecuencias de los documentos con las distribuciones esperadas.

Categorización

En el tercer tipo, las etiquetas se utilizan como método de categorización para elementos de contenido. Las etiquetas se representan en una nube donde las etiquetas más grandes representan la cantidad de elementos de contenido en esa categoría.

Existen algunos enfoques para construir grupos de etiquetas en lugar de nubes de etiquetas, por ejemplo, aplicando co-ocurrencias de etiquetas en documentos.

De manera más general, se puede utilizar la misma técnica visual para mostrar datos sin etiquetas, como en una nube de palabras o de datos.

El término nube de palabras clave se utiliza a veces como un término de marketing de motores de búsqueda (SEM) que se refiere a un grupo de palabras clave que son relevantes para un sitio web específico. En los últimos años, las nubes de etiquetas han ganado popularidad debido a su función en la optimización de motores de búsqueda de páginas web, así como a ayudar al usuario a navegar por el contenido de un sistema de información de manera eficiente. Las nubes de etiquetas como herramienta de navegación hacen que los recursos de un sitio web estén más conectados, cuando son rastreados por una araña de motor de búsqueda, lo que puede mejorar la clasificación del motor de búsqueda del sitio . Desde la perspectiva de la interfaz de usuario, a menudo se utilizan para resumir los resultados de búsqueda para ayudar al usuario a encontrar contenido en un sistema de información en particular más rápidamente.

Apariencia visual

Las nubes de etiquetas se representan normalmente mediante elementos HTML en línea . Las etiquetas pueden aparecer en orden alfabético, en un orden aleatorio, se pueden clasificar por peso, etc. A veces, se manipulan otras propiedades visuales además del tamaño de la fuente, como el color, la intensidad o el peso de la fuente. El más popular es un arreglo de etiqueta rectangular con clasificación alfabética en un diseño secuencial línea por línea. La decisión de un diseño óptimo debe basarse en los objetivos esperados del usuario. Algunos prefieren agrupar las etiquetas semánticamente para que las etiquetas similares aparezcan cerca unas de otras o usan técnicas de incrustación como tSNE para colocar palabras. Se pueden agregar bordes para enfatizar las co-ocurrencias de etiquetas y visualizar interacciones. La heurística se puede utilizar para reducir el tamaño de la nube de etiquetas, ya sea que el propósito sea agrupar las etiquetas o no.

La taxonomía visual de la nube de etiquetas está determinada por una serie de atributos: regla de ordenación de etiquetas (por ejemplo, alfabéticamente, por importancia, por contexto, aleatoriamente, ordenada por calidad visual), forma de la nube completa (por ejemplo, rectangular, círculo, bordes de mapa dados), forma de límites de etiquetas (rectángulo o cuerpo de carácter), rotación de etiquetas (ninguna, libre, limitada), alineación de etiquetas vertical (apegarse a las líneas base tipográficas, libre). Una nube de etiquetas en la web debe abordar problemas de modelado y control de la estética, construyendo un diseño bidimensional de etiquetas, y todo esto debe hacerse en poco tiempo en una plataforma de navegador volátil. Las nubes de etiquetas que se utilizarán en la web deben estar en HTML , no en gráficos, para que sean legibles por robots, deben estar construidas en el lado del cliente utilizando las fuentes disponibles en el navegador y deben caber en un recuadro rectangular.

Nubes de datos

Una nube de datos que muestra el movimiento del precio de las acciones. El color indica un cambio positivo o negativo, el tamaño de fuente indica un cambio porcentual.

Una nube de datos o datos en la nube es una pantalla de datos que usa el tamaño de fuente y / o color para indicar valores numéricos. Es similar a una nube de etiquetas, pero en lugar del recuento de palabras, muestra datos como la población o los precios del mercado de valores .

Nubes de texto

Nube de texto que compara el discurso sobre el estado de la Unión de 2002 del presidente Bush de EE. UU. Y el discurso sobre el estado de la Unión de 2011 del presidente Obama.
Nube de texto malayalam con palabras relacionadas con la ciencia

Una nube de texto o una nube de palabras es una visualización de la frecuencia de las palabras en un texto dado como una lista ponderada. La técnica se ha utilizado popularmente recientemente para visualizar el contenido de actualidad de los discursos políticos.

Colocar nubes

Ampliando los principios de una nube de texto, una nube colocada proporciona una vista más enfocada de un documento o corpus . En lugar de resumir un documento completo, la nube de colocación examina el uso de una palabra en particular. La nube resultante contiene las palabras que se utilizan a menudo junto con la palabra de búsqueda. Estos colocados están formateados para mostrar la frecuencia (como tamaño) así como la fuerza de colocación (como brillo). Esto proporciona formas interactivas de navegar y explorar el idioma.

Percepción

Las nubes de etiquetas han sido objeto de investigación en varios estudios de usabilidad. El siguiente resumen se basa en una descripción general de los resultados de la investigación proporcionada por Lohmann et al .:

  • Tamaño de la etiqueta: las etiquetas grandes atraen más la atención del usuario que las etiquetas pequeñas (efecto influenciado por otras propiedades, por ejemplo, número de caracteres, posición, etiquetas vecinas).
  • Escaneo: los usuarios escanean en lugar de leer nubes de etiquetas.
  • Centrado: las etiquetas en el medio de la nube atraen más la atención del usuario que las etiquetas cerca de los bordes (efecto influenciado por el diseño ).
  • Posición: el cuadrante superior izquierdo recibe más atención del usuario que los demás (hábitos de lectura occidentales).
  • Exploración: las nubes de etiquetas brindan un soporte subóptimo al buscar etiquetas específicas (si estas no tienen un tamaño de fuente muy grande).

Felix y col. compararon cómo el rendimiento de lectura humana difiere de las nubes de etiquetas tradicionales que asignan valores numéricos al tamaño de la fuente y diseños alternativos que utilizan, por ejemplo, colores o formas adicionales como círculos y barras. También compararon cómo la diferente disposición de las palabras afecta el rendimiento.

  • Usar una barra o círculo adicional en lugar del tamaño de fuente aumenta la precisión al leer el valor numérico
  • Sin embargo, los usuarios pueden encontrar una palabra específica más rápido cuando no se usa ninguna marca adicional.
  • El rendimiento depende de la tarea, las tareas simples como encontrar una palabra se ven muy afectadas por la elección del diseño, sin embargo, el efecto en tareas como identificar el tema de una nube de etiquetas es mucho menor.

Creación

Wordle se construyó a partir de los 1000 artículos vitales más importantes de Wikipedia ordenados por número de visitas. Disponible en la galería Wordle.

En principio, el tamaño de fuente de una etiqueta en una nube de etiquetas viene determinado por su incidencia. Para una nube de palabras de categorías como weblogs, la frecuencia, por ejemplo, corresponde al número de entradas de weblog que se asignan a una categoría. Para frecuencias más pequeñas, se pueden especificar los tamaños de fuente directamente, desde uno hasta el tamaño máximo de fuente. Para valores mayores, se debe hacer una escala. En una normalización lineal, el peso de un descriptor se asigna a una escala de tamaño de 1 a f , donde y están especificando el rango de pesos disponibles.

para ; demás
  • : mostrar tamaño de fuente
  • : máx. tamaño de fuente
  • : contar
  • : min. contar
  • : máx. contar

Dado que el número de elementos indexados por descriptor generalmente se distribuye de acuerdo con una ley de potencia , para rangos de valores más grandes, una representación logarítmica tiene sentido.

Las implementaciones de nubes de etiquetas también incluyen el análisis de texto y el filtrado de etiquetas inútiles como palabras comunes, números y puntuación.

También hay sitios web que crean nubes de etiquetas ponderadas de forma artificial o aleatoria, con fines publicitarios o para obtener resultados humorísticos.

Ver también

Referencias

enlaces externos