¿Qué es Semalt y como bloquear sus visitas?

¿Qué es Semalt y como bloquear sus visitas?

Desde hace algunos meses, algunas webs han comenzado a registrar visitas desde una fuente llamada Semalt. Esta aparece como tráfico referido (Procedente de otra web) en Google Analytics. Pero ¿Qué es Semalt? ¿Está dañando a mi web? ¿Qué puedo hacer para que no desvirtúe los datos de Google Analytics?

¿Qué es Semalt?

Empecemos por el principio. Semalt es una empresa de Ucrania que comercializa una herramienta de analítica (Enfocada en SEO) de desarrollo propio. Básicamente lo que han hecho para captar clientes es crear un bot que se dedica a visitar webs. El objetivo de esto es generar repercusión, es decir, que el posible cliente vea en Analytics que tiene visitas desde Semalt, vaya a su web y acabe contratándoles. Una estrategia que a priori resulta curiosa pero también bastante spam. Tampoco voy a hablar mas de la herramienta que ofrecen ya que sería hacerles publicidad y no quiero que el artículo se trate de eso. Este artículo trata de como evitar que aparezcan sus visitas en tus datos de Google Analytics o directamente bloquear su acceso a tu web.

También aclarar, que las visitas de Semalt en ningún momento dañan a tu web. Es simplemente tráfico referido de un bot que llega a tu web y se va. Sin hacer nada raro, ni ningún estropicio.

¿Cuál es el problema que causa?

El principal problema de este bot es la desvirtualización de datos. Es decir, si analizo datos en Google Analytics de mi web, podré ver como de repente el tráfico referido o referral ha podido crecer. Estos datos pueden desvirtuar también datos no solo de visitas si no de métricas como tiempo en el sitio, páginas por visita, etc.. Es decir al fin y al cabo en Google analytics queremos ver de donde llega el tráfico a mi web y como se comporta el usuario en mi web. En ambos casos, la presencia del bot de Semalt está alterando estos datos.

¿Cómo aparece Semalt en Google Analytics?

semalt

Aquí otro ejemplo de la alteración de datos de métrica de uso de la web, como podemos ver el tiempo en el sitio es solo cero y marca solo una página por sesión:

semalt metricas

¿Qué podemos hacer?

Existen dos opciones para que estos datos no aparezcan en Google Analytics. El primero y quizás mas sencillo es filtrar ese tráfico en la propia herramienta. Esto no hace que semalt siga accediendo a nuestra web pero sí que se excluyan sus datos en nuestros informes.

1) Vamos a administrador y ahí en el perfil en el que nos interesa bloquearlo, hacemos click en filtros. (Imagen)

tutorial semalt

2) Una vez dentro de filtros, tenemos que hacer click en crear nuevo.

3) Después tenemos que crear un filtro de referencia con la siguiente expresión regular ^semalt\.semalt\.com$ con esta expresión (Gracias a www.victordelaiglesia.com) conseguiremos eliminarlo. Si sigue apareciendo, también podemos añadir el campo de filtro “Fuente de Campaña” y la siguiente expresión regular en el patrón del filtro: \.semalt\.

filtro semalt

La segunda forma de bloquear a semalt es directamente bloquearlo desde el htaccess. Esto evitará directamente que entré en nuestra web y por tanto tampoco aparezcan datos en Analytics.

SetEnvIfNoCase Referer semalt.com spammer=yes
Order allow,deny
Allow from all
Deny from env=spammer

Lo que NO RECOMENDAMOS es utilizar su herramienta de exclusión. Sinceramente, no lo hagáis ya que básicamente estás ayudando a esta gente a crecer. Lo mas gracioso de todo es que se está generando tantos artículos que hasta los mismos responsables de la empresa se meten a responder y a comentar en foros o twitter. Una lástima que algunas empresas tengan que recurrir a estas técnicas.