Las expresiones Regulares en Google o RegEx suponen un recurso de máxima utilidad para aprovechar al máximo la potencia de los filtros de esta herramienta, maximizando y optimizando el rendimiento que sacamos para hacer nuestros diferentes análisis.
Pero las expresiones regulares o RegEx, sobre todo al principio, son complejas de entender. Aunque con experiencia y uso las vas a utilizar mucho y notarás que son tan útiles que sabrás que habrías ganado muchísimo tiempo de tu vida que perdiste filtrando a mano si las hubieras conocido antes.
Contenidos
¿Qué son las expresiones regulares?
Las expresiones regulares o RegEx (Regular Expressions), consisten en una serie de caracteres que se pueden utilizar para acotar una búsqueda a los patrones deseados. Con ellas es posible realizar tareas como extraer una lista de e-mails de un informe o conocer cuántas páginas de un sitio web incluyen una o varias palabras determinadas en su URL.
Cuando necesitamos buscar palabras concretas a lo largo de la red, muchas personas conocen una serie de trucos que facilitan el trabajo. Por ejemplo, si introduces en Google “related:” y a continuación la dirección de una página web, el buscador te devolverá páginas web similares a aquella que indiques. En esta dirección se enfocan las expresiones regulares.
Para poder utilizarlas nos serviremos de herramientas que soporten su uso y que están ligadas con el mundo del marketing digital:
- Crawlers para la optimización on-page.
- Google Analytics y sus filtros personalizados.
- Editores de texto como el bloc de notas o Word.
- Google Sheets, las hojas de cálculo que ayudan a organizar toda la información obtenida.
- Lenguajes de programación.
Una vez familiarizado con las semánticas de las RegEx es posible ahorrar muchísimo tiempo y esfuerzo a la hora de trabajar con datos sin un orden lógico.
Patrones básicos de las expresiones regulares Google
Las expresiones regulares utilizan los mismos caracteres y números que estamos acostumbrados a usar diariamente: letras (A-Z) y números (1-9), además de ciertos símbolos normales en nuestros teclados, que son:
. Un punto
Significa que en su lugar, en el patrón, puedes coincidir cualquier carácter único: una letra, un número, un signo de puntuación o un espacio, pero no un carácter de final de línea. A veces, cuando en el patrón quieres identificar específicamente el valor del punto (.) no el comodín, necesitarás escapar y para eso deberás proceder de la barra invertida para hacerlo literal:.
La barra diagonal invertida o slug invertido
Es el carácter de escape, que hemos visto al final del punto anterior.
[] Los corchetes
Se usan cuando identificamos en un patrón la coincidencia de uno y sólo uno de los elementos que metemos en el corchete. Para palabras no vale, sólo para caracteres uno a uno.
– El guión medio
Es para crear un rango en una lista. Por ejemplo [0-9] es exactamente lo mismo que [0123456789].
^ Acento circunflejo
Si este símbolo está entre corchetes significa NO; por ejemplo: [^0-9] será cualquier cosa menos un número de un dígito. Fuera de los corchetes identifica a algo que está al principio de una línea.
$ Dólar
Significa que el elemento al que acompaña ha de terminar una línea. Por ejemplo: https://jbmoreno.es$ identifica sólo a la home de mi sitio y no a cualquier URL.
? Signo de interrogación
Coincide con cero o uno (no más) de los elementos anteriores, por lo que y? coincidirá con y o yy, pero no con yyy.
+Más
El signo más (+), añadido a un carácter o comodín hará que en el patrón coincida con -al menos- una o más coincidencias.
*Asterisco
Es una combinación de los dos anteriores. Así, un asterisco acompañando a un carácter o comodín significa que buscas la coincidencia de cero, uno o más de los elementos a los que acompaña. Por lo tanto y* coincidirá con una cadena vacía o también coincidirá con y, yy, yyy o cualquier número de «y» repetidas en una fila.
{} Las llaves
Sirven para identificar en el patrón un número exacto de repeticiones, por ejemplo [0-9]{4} coincidirá con cualquier número de exactamente cuatro cifras. También permite establecer opciones, por ejemplo [0-9]{3,6} identifica en el patrón a números de 5 ó 6 cifras.
() Paréntesis
Cuando los paréntesis en RegEx rodean a unos caracteres, sirven -a modo de variable- para almacenar ese texto encerrado en el paréntesis y usarlo posteriormente.
| La barra vertical (también llamada «pipe»)
Se utiliza para alternar varias opciones. Úsala como cuando quieres que sea “esto o esto”.
Ejemplos prácticos de las expresiones regulares de Google
Como hemos comentado anteriormente, utilizar las expresiones regulares de Google o RegEx puede llegar a ser complicado al principio. Por eso, desde Online Zebra te dejamos algunos ejemplos prácticos para que puedas empezar a utilizarlas desde ya mismo:
Busca la coincidencia con una dirección IP
El problema de identificar direcciones IP es que usan el punto, y este es el comodín más potente; así que si queremos hacer coincidir la dirección específica 192.168.1.1, deberemos usar en el filtro la expresión regular 192.168.1.1 (si no lo hicieras, también podrías obtener valores como 192×16831,1).
Si lo que quieres es filtrar un rango de direcciones, puedes usar 129.168.1.1[0-9], para valores como 192.168.1.10 ó 192.168.1.19, etc.
Buscar la coincidencia con un nombre de directorio
En una URL, el delimitador de carpetas es la barra inclinada o slash (/); por ejemplo, si queremos ver las páginas vistas del directorio “comunicación”, usaremos la siguiente RegEx .+?/comunicación/.+? (el uso de + significa que queremos que haya “algo” delante y detrás, porque si usamos .* podría dar errores al devolver la palabra sola.
Buscar la coincidencia de una variable en una URL
Cuando no se usan URLs amigables, como en muchos catálogos, es fácil encontrar el uso de variables en las URL. Por ejemplo: para algo como http://www.unaweb.es/index.php?ID=34 podemos usar ID=(d+).
En definitiva, las expresiones regulares se utilizan para detectar palabras o números que pueden suponer un error en el SEO interno de un sitio web. Además, con ellas es posible conocer elementos cruciales para el posicionamiento, como cuántos enlaces tiene un página y cuál es su anchor text (las palabras en las que están anclados).
En Online Zebra como agencia SEO sabemos la importancia de utilizar las expresiones regulares de Google. Ponte en contacto con nosotros si quieres más información.
0 comentarios