▷ Guía sobre expresiones regulares y REGEX SEO para WordPress

Tabla de contenidos

¡Ya estoy otra semana más por ahí querido lector! Y, en esta ocasión, vengo a hablarte sobre un tema que quizás desconozcas y que, a mi punto de vista, es super interesante. Hoy te mostraré el mundo de las expresiones regulares o Regex.

Ahora te preguntarás, pero, ¿qué es esto Borja?

Bien no te preocupes porque en el post de hoy te mostraré qué son las expresiones regulares (Regex), para que sirven y cómo aplicarlas a nivel SEO y al gestor de contenidos WordPress.

No me entretendré más ya que si de algo habla el post de hoy es ahorrar tiempo y con las expresiones regulares te ahorrarás mucho pero mucho tiempo.

Así que…

¡En el lío!

¿Qué son las expresiones regulares (Regex) y para que sirven?

Las expresiones regulares (También conocidas como Regex) te permitirán buscar y encontrar una determinada frase dentro de un texto de forma rápida.

Es decir, las expresiones regulares te ayudarán a encontrar entre X líneas de código en un texto determinado.

Una vez encontrado este fragmento de texto podrás hacer con él lo que tú consideres.

Por tanto, una Regex es una especie de buscador avanzado para filtrar sólo aquella información relevante dentro de un contenido.

De hecho, las expresiones regulares son utilizadas frecuentemente por programadores y algún consultor SEO para localizar X fragmento de código entre las miles y miles de líneas de código que cualquier aplicación puede llegar a tener.

De esta forma, los programadores con una simple Regex serán capaces de encontrar una determinada línea de código en un par de minutos.

¿Empiezas a entender las decenas y decenas de utilidades que pueden llegar a tener las expresiones regulares?

¿Cuándo se utilizan las REGEX?

Una Regex podrá utilizarse siempre que haya un patrón detectable dentro de una frase, un código o un texto.

Este hecho será especialmente importante en el sector SEO ya que gracias a las expresiones regulares podrá, por ejemplo, filtrar un determinado patrón de URL rápidamente.

Te pondré un ejemplo:

Con una simple Regex SEO podrás agrupar todas las URLs que tengan o que empiecen por una determinada palabra clave para posteriormente redirigirlas hacia otra URL.

También podrá utilizar expresiones regulares para cambiar todo el nombre de una categoría en concreto, etc, etc, etc.

Por tanto, las expresiones regulares serán especialmente útiles siempre que exista un patrón filtrable.

¿Dónde podrás utilizar Regex a nivel SEO?

Dentro del mundo SEO es común utilizar expresiones regulares o Regex en:

análisis de Google

Una de las principales funciones de Google Analytics es utilizar expresiones regulares para filtrar un patrón de URL determinado.

También con Regex podrás filtrar un determinado número de sesiones vía IP, etc.

Google Search Console

Otro uso muy común de Regex en SEO es la utilización de expresiones regulares en Google Search Console para entre otras cosas:

  • Filtrar una determinada palabra clave.
  • Filtrar un grupo de URLs en concreto.
  • Etc.

El archivo Robots

Dentro del archivo robots.txt también podrás utilizar algunas expresiones regulares para impedir el acceso al bot el Google en una serie de URLs dentro de tu página web.

Sin embargo, el uso de estas expresiones regulares en robots está muy limitado a sólo ciertas órdenes como:

  • /
  • *
  • $
  • *.php
  • *php$
  • /palabra*.php

Expresiones regulares comunes a SEO

A continuación le mostraré las expresiones regulares más utilizadas en SEO que le servirán para utilizar principalmente en Google Analytics, en Google Search Console o en herramientas SEO como Sistrix.

Sin embargo, si quieres profundizar en ello a fondo te dejo esta guía sobre expresiones regulares en PHP con lo que podrás aprender todo sobre esta materia.

Filtrar o no filtrar el nombre de marca

Para incluir en el filtro el nombre de mi marca utilizaría la siguiente Regex:

.*(borja|borja aranda|borjaav|borja aranda tejano).*

También podría aplicar el camino inverso con el siguiente ejemplo de expresión regular que me permitiría excluir mi marca del filtrado:

^(?!.*(borja|borja aranda|borjaav|borja aranda vaquero).*?)

Incluir o excluir palabras que comienzan por una palabra clave en concreto

Utilizando esta Regex podrás buscar palabras que empiecen por las siguientes marcas de coches:

^(bmw|audi|mercedes|ford).*

También podrás hacer el camino inverso y excluir las keywords que empiecen por las siguientes marcas de coches utilizando esta Regex:

^(?!(bmw|audi|mercedes|ford).*)

Agrupar keywords en base a una característica concreta

Esta expresión regular será muy importante para comercio electrónico o tienda online ya que con ella incluirás en tu búsqueda toda aquella keyword que contenga una keyword de intención. En ese caso esta keyword podrá ser oferta, barato, económico, etc.

.*(barato|economico|oferta|precio).*

Incluye o excluye URL por idiomas

Por eso y partiendo de la base de que cada URL de tu página web en español colgaría del directorio /es/ con la siguiente expresión regular filtrarías todo el directorio de español («/es/»).

.*(\/es\/).*

Incluir o excluir subdominios mediante expresiones regulares

Si tu página cuenta con un subdominio (www.tudominio.com) o con un dominio móvil tipo (m.tudominio.com) podrás filtrar sus resultados con esta Regex:

(www|m)

También podrá utilizar este sistema para filtrar subdominios por idioma. Esto será especialmente importante a la hora de realizar SEO Internacional.

Incluye o excluye provincias por Regex

También podrás utilizar la siguiente Regex para saber cuántas de tus keywords posicionadas son geolocalizadas en todo el territorio español:

.*(alava|álaba|a coruña|coruña|albacete|alicante|alicante|almería|almería|asturias|ávila|avila|badajoz|islas baleares|baleares|baleares|barcelona|bcn|barna|burgos|caceres|cáceres|cadís |cádiz|cantabria|castillo|castillo|ciudad real|córdoba|cordoba|cuenca|girona|girona|granada|guadalajara|guipuzca|guipúscua|gipuzcoa|gipúscua|huelva|huesca|jaen|jaén|la rioja|rioja|las palmas| palmas|las palmas de gran canaria|león|león|lleida|lleida|lérida|luco|madrid|málaga|malaga|murcia|navarra|orense|ourense|palencia|pontevedra|salamanca|segovia|sevilla|soria|tarragona|tenerife| santa cruz|santa cruz de tenerife|teruel|toledo|valencia|valladolid|vizcaya|bizkaia|zamora|zaragoza|ceuta|melilla).*

También podrás hacer el camino inverso si tu negocio es nacional y no deseas dar relevancia a las keywords geolocalizadas:

^(?!(.*(alava|álava|a coruña|coruña|albacete|alicante|alicante|almería|almería|asturias|ávila|avila|badajoz|islas baleares|baleares|baleares|barcelona|bcn|barna|burgos| cacerías|cáceres|cadís|cadiz|cantabria|castellón|castellón|ciudad real|córdoba|cordoba|cuenca|girona|girona|granada|guadalajara|guipuzca|guipuzca|gipuzcoa|gipuzca|huelva|huesca|jaen|jaén|jaén| rioja |las palmas|palmas|las palmas de gran canaria|león|león|lleida|lleida|leída|luco|madrid|málaga|malaga|murcia|navarra|orense|ourense|palencia|pontevedra|salamanca|segovia|sevilla|soria | tarragona|tenerife|santa cruz|santa cruz de tenerife|teruel|toledo|valencia|valladolid|biscaya|bizkaia|zamora|zaragoza|ceuta|melilla).*))

Incluye o excluye las URL terminadas con barra inclinada («/») o barra inclinada («/»)

Para filtrar las URLs con slash («/»):

.*/$

Para filtrar las URLs sin slash («/»):

^(?!(.*/$))

Incluir o excluir URLs que contengan un número

Para filtrar las URLs con números:

.*-[0-9]+$

Para filtrar las URLs sin números:

^(?!(.*-[0-9]+$))

Incluir o Excluir URLs con un determinado formato

Para filtrar las URLs en función de su formato podrás utilizar la siguiente Regex:

.*(htm|html)$

El camino a la inversa sería:

^(?!(.*(htm|html)$).)

Expresiones regulares en WordPress

Bien, una vez descubiertas las principales expresiones regulares SEO será el momento que conozcas también las principales expresiones regulares para WordPress.

Como siempre, a pesar de que existe un sinfín de expresiones regulares para WordPress hoy te mostraré las Regex más utilizadas para redireccionar ciertas partes de tu página web WordPress.

PD. Para llevar a cabo este tipo de redirecciones mediante expresiones regulares en WordPress te recomiendo el plugin de SEO Redirección. Gracias a este plugin y el marcado de opción «Regex» podrá realizar redirecciones masivas con una simple expresión regular.

¡En el lío!

Eliminar y redirigir las etiquetas de WordPress con Regex

Si sabes algo de SEO ya se habrá dado cuenta de que la gestión de etiquetas/tags de WordPress o se hace muy bien, o por lo general suele perjudicar el SEO de tu página web.

Por eso, lo mejor será poner fin a estas etiquetas y solucionar el problema de raíz.

El problema es que al eliminar estas etiquetas muchas de las antiguas URL asociadas a ellas podrán ocasionarte errores 404.

Por este motivo, lo mejor será que toda URL que contenga en el patrón /tag/ sea redirigido a otra URL de tu página para que devuelva un código de respuesta 200 (Lo correcto).

Para esta tarea (Filtra todas las URLs que contengan «/tag/») te servirá la siguiente expresión regular:

^/(?!etiqueta)(.*)

Redirigir URLs sin slash («/») a páginas con slash («/») a WordPress

Otro error muy común en WordPress es que por X motivo las URL sin slash no se redirijan automáticamente hacia las URLs con Slash (Y viceversa).

Esta situación a menudo provoca que se creen dos páginas web idénticas dentro de un mismo dominio perjudicando así al SEO de una página web por duplicidad de contenidos.

Por este motivo, utilizando la siguiente Regex podrás filtrar todas las URLs de la página web que no acaben con slash (/):

/([^/.]+)$

Para posteriormente ordenar que todas las URLs se redirijan a su correspondiente con slash (/)

/$1/

Cambiar una categoría entera de nombre

A menudo, y más si revisas el SEO de tu página web de forma continua cambiarás la arquitectura de tu página web modificando de forma colateral los nombres de ciertos directorios de su sitio web de WordPress.

Por este motivo, y para asegurarte de que ninguna URL del antiguo directorio quede colgada tendrás que filtrar con la siguiente Regex todas las URLs de la categoría y redirigirlas:

/mi-url/.*

Eliminar el AMP de WordPress con una expresión regular

Quizás has sido otro de los afectados por la fiebre del AMP. Sí, esa tecnología que cambiaría el mundo de Internet y que hoy se ha quedado nada.

Por este motivo, si finalmente te has decidido a sacarlo de tu WordPress lo primero que tendrás que hacer será desinstalar el plugin que creaba las versiones AMP de la página web y aplicar la siguiente Regex:

/(.*)\/amp

Con esta expresión regular conseguirás redirigir las antiguas páginas AMP de tu WordPress hacia las URL originales sin AMP.

Cómo validar si tu Regex es correcto

Cómo habrás podido comprobar las expresiones regulares NO SON SENCILLAS.

Por eso, lo mejor antes de lanzarte a utilizarlas en tus páginas web será mejor validar si tu expresión regular o Regex es correcta.

Por eso podrás optar por los siguientes validadores de Regex:

PD. Las redirecciones realizadas con Regex pueden romper tu página web a causa de bucles de redirecciones. Por tanto, valida que su Regex sea correcto antes de implementarlo en real.

Conclusiones sobre las expresiones regulares

Cómo has podido comprobar a lo largo del post, las expresiones regulares serán una herramienta super útil que le ahorrará un montón de tiempo.

Por este motivo, si te devuelves un maestro conseguirás mejorar tu rendimiento a la hora de aplicar ciertos procesos de filtrado o redireccionamiento.

Sin embargo, todos los ejemplos de expresiones regulares que has visto en este post son sólo una pequeña introducción a las mismas.

Como siempre, al final lo mejor será que practiques por ti mismo para dominarlas como es debido.

Por este motivo, te animo a que practiques tus dotes en expresiones regulares ya que lo que hoy te he mostrado es sólo la punta del iceberg y hay mucho más detrás de que te ayudará tanto al SEO como al mundo de la programación.

Ahora te toca a ti ¿Conocías las expresiones regulares ¿Te parecen útiles? Te leo en los comentarios.

¡Hasta la próxima!

Becario Friki del SEO en general

VER MAS ENTRADAS
X