Ejemplo Web Scraping en Python: IBEX35® la Bolsa de Madrid
En este artículo aprenderemos a utilizar la librería BeatifulSoap de Python para obtener contenidos de páginas webs de manera automática.
En internet encontramos de todo: artículos, noticias, estadísticas e información útil (¿e inútil?), pero ¿cómo la extraemos? No siempre se encuentra en forma de descarga ó puede haber información repartida en multiples dominios, ó puede que necesitemos información histórica, de webs que cambian con el tiempo.
Para poder generar nuestros propios archivos con los datos que nos interesan y de manera automática es que utilizaremos la técnica de WebScraping.
Contenidos:
- Requerimientos para WebScraping
- Lo básico de HTML y CSS que debes saber
- Inspeccionar manualmente una página web
- Al código! Obtener el valor actual del IBEX35® de la Bolsa de Madrid
- Exportar a archivo csv (y poder abrir en Excel)
- Otros casos frecuentes de “rascar la web”
Seguir LeyendoPuedes ver y descargar el código python completo de este artículo desde GitHub haciendo click aquí