Hoy he estado trabajando en OpenBOE, el servicio que pretende dar la información de los RSS del BOE/Borme de una forma sencilla y por la que se pueda filtrar.

Hasta el momento no había casi nada, era un parseador de RSS que buscaba directamente en los enlaces que proveía ese RSS y daba un resultado según el filtro, todo ha cambiado.

Actualmente OpenBOE consta de dos scripts que se ejecutan sobre cron. Uno hace scraping sobre la web del boe donde se ubican los rss y los organiza por categorías, guardándolos en una base de datos en MongoDB. El segundo simplemente itera sobre los RSS y cada hora actualiza la lista de publicaciones nuevas en la base de datos.

Debido a toda esta automatización y al incluir la base de datos en Mongo, los controladores han sido modificados completamente. Quizás sería necesario quitar un par de líneas duplicadas que existen en los controladores y sacarlo a un plano superior del que estas vistas heredasen, por el momento no me lo planteo, quizás para la primera versión de OpenBOE que sacaré en un par de semanas.

Todo esto va construido sobre Flask, un framework al que tenía ganas de meter mano y se ejecuta sobre un Nginx con uWSGI.

Tenéis el código en github tanto si queréis tocarlo, criticarme (constructivamente), para nuevas ideas o para lo que queráis. :-)