Tener un podcast dentro de tu Drupal de forma automática y mejorar el SEO

Portada del podcast Drupalízate
Drupalízate es un podcast semanal creado por mí, donde hablo sobre desarrollo web basado en Drupal.
El contenido central es resolver las típicas dudas que pueda tener alguien que tiene o quiere tener una web en Drupal.
Aparte de resolver dudas de "clientes", también se habla de tips, recomendaciones y buenas prácticas para el Developer que recién empiezan en este mundo.
Audio y notas del episodio

Hoy os vengo a contar como de fácil es crear una nueva sección de una web.

He creado el listado de menetray.com/podcast usando el módulo Views y creando un tipo de contenido específico para ello, y luego una simple migración usando el módulo Migrate para leer el feed del podcast original en Anchor.

La gracia de todo esto es que también hay un campo para el audio transcrito (usando transcribe.webificando.com) que permite tener un texto de todo el audio.

El objetivo de todo esto es mejorar el SEO del podcast y de mi web. El futuro dirá si esto ha funcionado como esperaba o no.

Transcripción automática de este episodio de audio (puede contener errores)

 Hola, bienvenido aquí otra semana más a Drupalizate. Hoy os quiero comentar sobre hacer una sección nueva, en este caso es en mi web, en menetray.com, una sección para que automáticamente se importen los episodios de este podcast que estáis escuchando y así aprovecho para comentar cómo lo he hecho, cómo en una web en Drupal puedes hacer una importación de contenido y además cómo se va haciendo para tener una transcripción para temas de mejorar el SEO de la web. Sin caso empecemos los motivos por los que he hecho esta sección. Hasta ahora tengo menetray.com que es mi web, digamos era una página, una web simple de tipo servicios o tipo empresarial donde hay páginas básicas o tipo landing, al final es de venta de servicios, y una sección de la web que da un blog, hay páginas de blog donde yo escribía cosas y se publicaban. Problema con ello de que hace bastante tiempo que o no tengo tiempo o no tengo ganas y publico muy poco en mi blog. Así que ya hace un tiempo que viendo que tenía este problema y esto por SEO supuestamente es malo porque es una web digamos que está parada, que no genera contenido constantemente, esto Google lo sabe y cada vez te indexa, deja más tiempo entre indexación e indexación porque verá que no generas contenido nuevo y esto como digo para SEO supuestamente es malo porque no es una web activa. Pues al final lo que hice yo es por tema de... ya que tengo la newsletter que es contenido semanal que yo hago en LinkedIn, que si no estás suscrito pues vete a LinkedIn, me buscas y te suscribes o vas a mi web y barra newsletter, tienes el botón de suscripción en la newsletter, pues ya que tenía esto yo copié, o sea hice una sección nueva que es hacer una views, un listado, que me lista un tipo de contenido que he llamado newsletter que tiene un título, un body, o sea un campo de texto y un campo de imagen y ahí es donde copio y pego manualmente lo que yo publico en LinkedIn, con lo cual todo el contenido que hago semanalmente en LinkedIn lo tengo en la web también. La idea es que Google vea que es una web activa y además intentó posicionar las palabras clave que son las que yo soy trabajando también en LinkedIn. He dicho todo esto, yo he dicho a principio que estoy venido en podcast, no de una newsletter, el problema es que teniendo una newsletter veo de aquí, aunque poco a poco sí que he tenido un poco de mejora en SEO, o sea me ha llegado unas 50 personas en estos dos últimos meses o tres meses a la web desde la newsletter, o sea buscando palabras clave que aparecen en las newsletters, así que hasta este punto bien, es muy poco SEO y también tiene que ver con que es muy poco contenido con palabras clave relevantes, digamos de la temática Drupal o de módulos Drupal. Y otro tipo de contenido, otro contenido que estoy generando yo es este mismo podcast, pero el podcast lo tengo alojado en Anchor, no está alojado en la web y en la web lo que tenía hasta ahora es una página básica donde sale el título, sería podcast Drupal y un embebido de un reproductor de creo que puzzle de Spotify. Esto por SEO es nada porque no hay texto, no posiciona en nada eso, con lo cual cuando alguien buscaba podcast Drupal o algo así no aparecía y cuando alguien buscaba palabras clave de un episodio en concreto que yo había publicado tampoco aparecía, a menos no en Google. Mi intención es de que al meter todo esto en la web, mi web salga mejor posicionada y además cada una de las páginas de los episodios cuando se busque en Google x palabras clave también salgan. ¿Cómo he hecho todo esto para que sea lo más fácil para mí? Como digo esto es un Drupal, he creado una nueva selección que básicamente es barra podcast que es un es un abuse, es un listado automático de un tipo de contenido nuevo que también he llamado podcast y básicamente es un tipo de contenido pues muy simple donde hay el título, un campo de texto que es la descripción, un campo url donde va a ir en la url del episodio o sea del mp3 que esto después en el frontend yo lo maqueto como un reproductor de html5 para que la gente le pueda dar al play y además hay un campo de texto que también he puesto que es el de transcripciones porque si estoy transcribiendo todos los audios para que estén en formato texto para que cada página tenga la mayor cantidad de palabras clave posibles para que google lo posicione lo mejor posible y que a mí me lleve el menor tiempo generar cada página. Además de esto como he dicho me importa el tema de SEO estoy usando el módulo meta tags para que el título sea el mismo título del podcast, o sea del episodio y que la meta descripción use las notas del episodio o un resumen de las notas del episodio con lo cual también por SEO va a posicionar mejor o sea intentó facilitar que se posicionen bien las páginas de los episodios. Además de todo esto digamos de que para que para mí sea simple de usar esto tengo que hacer que sea automático no voy a crear yo manualmente cada vez que subo un episodio todo o sea copiar el título copiar las notas copiar la url del episodio del mp3 no no lo que he hecho es una migración automatizada para que me detecte automáticamente cuando hay episodios nuevos y me los cree en mi web. Opciones de hacer esto en Drupal digamos que hay tres o hacerlo todo con código custom que yo no lo he hecho así después hay la opción de usar el módulo feeds el módulo feeds es un módulo contribuido en Drupal creo que ya lo comenté en episodios pasados de esto. Para migraciones muy simples como puede ser un feed xml es totalmente factible y además lo puedes configurar para que sea automáticamente cada x horas o cada x tiempo. En mi caso lo probé para esta tarea en concreto pero vi de que el feed de un podcast no es bien bien un feed normal como puede ser un feed de un blog con lo cual por ejemplo el campo url que a mí me interesaba tenerlo para tener reproductor dentro de mi web no me lo detecta a menos no desde no por defecto con lo cual me obligaba a tener que hacer un poco de código o usar el módulo feeds tamper que te permite finalmente el código por medio para obtener los datos de ese valor de la url del mp3 y en mi caso en concreto yo que soy mucho más acostumbrado y me gusta mucho más cómo funciona el módulo migrate que ven en el core de Drupal y lo encuentro mucho más robusto pues ya he puesto a tener que tocar código para tener la url pues en vez de hacer el módulo tocar el módulo feeds toco el módulo migrate con lo cual hice un sub módulo o sea un módulo mío custom que usa la migración del módulo migrate, especificé con nada cuatro líneas custom un proceso nuevo para migrate que me detecta la url del episodio y esto me lo guardan en el campo que yo especificé con lo cual tengo la migración con migrate que me crea los nodos de tipo episodio y después tengo una vista que me lista esos nodos en una página en barra podcast esto es literalmente tarde un par de días un par de mañanas en tener la sección nueva maquetada y después transcribir todos los audios y ponerlos todo junto fue en un par de días o sea un par de mañanas y quizás media mañana más para el tema de transcripciones o algo así o sea no llegaron a tres mañanas hacerlo todo o sea es bastante rápido de implementar esto teniendo en cuenta que también se maquetó un poco para que fuera visualmente más o menos atractiva la web después comentar el tema de transcripciones cómo hago el tema de transcripciones en esta web y qué cosa tiene todo esto viene de otro podcast en el que participo yo que es verificando que lo hago con un compañero y como hoy día en este podcast en la parte premium comentamos que tenemos que mejorar justamente el seo de nuestra web que es verificando punto com al final en nuestra web en verificando.com lo que tenemos son entrevistas muy largas muy largas comparadas con las que hago aquí en Drupalized que aquí lo normal son un cuarto de hora más o menos episodio en verificando las entrevistas son de hora hora y pico dos horas y las cortamos para que sean episodios de una hora más o menos pues son mucho más largas o sea los audios son mucho más largos con lo cual el texto que se obtendrá es mucho más largo y también nos interesa el tema del seo porque lo tenemos todo alojado el podcast incluido todo dentro del mismo servidor en la web lo estamos gestionando con un web es en este caso y el seo es fatal o sea todo muy mal no posicionamos en nada también porque sólo tenemos el título y las notas no tenemos la transcripción puesta ahora mismo y bueno esto que como motivos lo discutimos en el podcast de cómo podemos mejorar el seo en nuestra web de verificando pues nos salió la idea de que tenemos el audio podemos transcribir el audio obtener el texto y poner el texto en la web en cada episodio con lo cual tenemos más texto google va a ver que hay páginas con más texto con palabras clave y la idea es que lo posiciones mejor que lo que tenemos ahora y todo esto en web llegando es mucho trabajo porque como digo son transcripciones más largas y además es un golpe es que se tienen que modificar cosas para permitir poner todo esto como debería y teniendo la idea yo ya hace tiempo desde que quería hacer la migración automática del episodio del podcast en mi web dije pues mira ya que es una buena excusa pues lo hago además creo un campo nuevo y hago el tema de las transcripciones y dicho y hecho el tema de transcripciones lo hicimos en verificando es una herramienta gratuita que publicaríamos transcribe punto verificando.com también lo pone en las notas del episodio por si algún podcast me está escuchando estamos usando una inteligencia artificial que es de código abierto con lo cual te puedes descargar y ejecutar donde tú quieras en tu máquina local o en un servidor y después estamos usando google colab como servidor google al final tiene un servicio de digamos de que te presta un servidor potente en tarjeta gráfica para ejecutar justamente inteligencia artificial es para temas de investigación y es totalmente gratuito con lo cual tenemos una inteligencia artificial de código abierto un servidor de google que nos presta de forma gratuita durante un tiempo pues se junta todo y ya tenemos un servicio de traducción de transcripción perdón de podcast gratuito y además de bastante alta calidad total que es coger la url del fit de que yo ya tengo importada en mi web se coge esa url de cada episodio se va a la herramienta se pone la url se da al botón de transcribir se obtiene el texto en unos 10 minutos o menos en mi caso porque es un episodio cortito y lo copie y pego manualmente en mi web total que obtengo automáticamente desde el fit en este caso tengo en anco dio en tu paliza te lo tengo automáticamente en mi web al cabo de unas horas y sólo tengo que ir copiar la url de mp3 obtener la transcripción y pegarla en mi web con eso tengo una sección nueva en mi web con apenas coste de tiempo mío y que espero que esto afecte positivamente al seo porque tengo urls limpias en base al título del episodio tengo una meta descripción en base a las notas del episodio tengo un texto largo en cada página que es la transcripción del episodio y como digo final la idea es tener contenido ya que estoy generando contenido en formato audio y contenido en formato newsletter que todo esto siempre lleve a tener mejor contenido o más contenido en mi web y que esto me mejore a mí el seo a fin de cuentas digamos que la web mi opinión siempre tiene que ser el nodo central donde todo el contenido tengas allí como digo más que nada por temas de seo y de generación de contenidos que esté todo centralizado que no tengas a una cosa en youtube a una cosa en el que din a una cosa en formato podcast la gente se pierde y hay gente que no sabía que tenía podcast o que tenía newsletter si lo tengo todo en la web al menos la gente que me entra allí sabe todo lo que tengo de un solo vistazo y nada más que me largo básicamente esto como veis que hay una sección nueva en dupal como sección me refiero a un listado y un tipo de contenido es hiper simple hacer una migración de contenido externo es hiper simple también e integrarte integrarte entre comillas cada un campo de texto para copiar pegar una cosa que viene de una transcripción también es hiper simple la flexibilidad que te da dupal para hacer todo esto y en un tiempo récord en fin como digo en todo han sido un par de mañanas yo creo que es muy bueno desde el punto de vista del cliente de que ves la potencia que tiene esta herramienta para hacer cosas más o menos complejas y nada más espero que os sirva y la semana que viene ya hablaré de otras cosas no sé de qué pero ya veremos eso lleva todas ideas como siempre si quieres me hablas por linkedin o desde mi web con menetray.com me contactas y me dices de temáticas que quieres que responda o cosas interesantes que crees que debía hablar más en este podcast y nada más muchas gracias por el feedback hasta la semana que viene chao

¿Tienes algún proyecto en mente?

Si quieres hacer algo en Drupal tal vez puedas contratarme.

Ya sea para consultoría, desarrollo o mantenimiento de sitios web Drupal.