almirot Un internauta más desde 1997

Estadísticas de la Wikipedia como alternativa a Google Trends

Publicado: 8 junio, 2015
john_nash_wikipedia

Hace unos meses buscando datos para apoyar una propuesta para un cliente me encontré con que la Wikipedia da acceso público a las estadísticas de sus páginas de una forma sencilla aunque un poco escondida:

john_nash_wikipedia

No hay más que acceder a la pestaña de Ver Historial de la página que nos interese (no hace falta estar registrado), y fijarnos en el apartado de Estadísticas. En concreto en Número de Visitas podremos consultar este dato desde finales del año 2007 y en tramos de 30, 60 o 90 días (ojo NO son visitantes únicos).  En Detalle y en Información de la página podemos encontrar otros datos interesantes como número de revisiones realizadas, editores que han colaborado en la página, etc.

De esta forma podemos usar la información sobre consultas a páginas de la Wikipedia, en lugar de las búsquedas en Google, para obtener datos de tendencias de una forma alternativa a Google Trends. Este método sobre todo puede ser útil en el caso de temáticas de nicho que por su reducido volumen de búsquedas no aparecen en la herramienta de Google. Eso sí, es necesario que exista una página de la Wikipedia para la temática en cuestión 😛

Un ejemplo con las elecciones municipales al Ayuntamiento de Madrid del 24 de Marzo

En primer lugar comparemos  las tendencias de búsqueda de los últimos 90 días con Trends para los 3 grandes protagonistas de las elecciones del 24M a las municipales en Madrid, Esperanza Aguirre, Manuela Carmena y Antonio Carmona:

google_trends_elecciones_madrid

 

Y ahora los datos de consulta a las respectivas páginas de Wikipedia de cada candidato:

Esperanza_Aguirre

esperanza_aguirre_wikipedia

Manuela_Carmena
manuela_carmona_wikipedia

Antonio_Miguel_Carmona
antonio_miguel_carmona_wikipedia

El problema con los datos de la Wikipedia es la visualización de los mismos ya que no dispone de una interfaz para comparar las páginas entre si y cada gráfica lleva su propia escala (Aguirre 0/5.400, Carmena 0/42.000, Carmona 0/1.800). Para solucionar este inconveniente tenemos que trabajar un poco aprovechando la funcionalidad de consultar los datos en formato JSON que aparece debajo de cada gráfica. De esta forma podremos por ejemplo cargar los datos en una hoja de cálculo de Drive (usando la librería import-json) para hacer nuestra propia comparativa:

municipales_madrid_wikipedia

Interesante, pero si queremos realizar un estudio de investigación en profundidad, alargado en el tiempo y con un gran número de páginas, este método de consulta sería muy laborioso... ¡No hay problema! el bueno de Jimmy Wales y su equipo también nos dan acceso a los logs por hora y día del tráfico de la Wikipedia, Wikimedia y resto de sites de la organización (documentación sobre el formato de los logs).

Ventajas de usar los datos de la Wikipedia sobre los de Google Trends

Si nos paramos a pensar, las ventajas son varias e importantes:

  • Google Trends no devuelve datos para búsquedas con un número reducido de consultas.
  • Los datos mostrados por Trends son relativos en una escala de 0 a 100 (concretamente indican "Las cifras representan los intereses de búsqueda relativos al punto más alto del gráfico. Estas cifras no ofrecen volúmenes de búsquedas absolutos."), mientras que la Wikipedia nos ofrece datos absolutos.
  • En el ejemplo anterior, se ha realizado la búsqueda en Trends por "Antonio Carmona" ya que por "Antonio Miguel Carmona" no se devolvían resultados. El problema es que Antonio Carmona también se llama un cantador de flamenco, y por tanto Trends estará devolviendo búsquedas mezcladas. En la Wikipedia cada uno tiene su propia página.

Por su parte, Google Trends nos ofrece una interfaz más sencilla y datos de volumen de búsquedas, que en primera instancia pueden indicar un mayor interés que las consultas en la Wikipedia. Además pueden haber términos que no aparezcan en la enciclopedia libre, pero que si tienen un volumen suficiente de búsquedas aparezcan en Trends.