martes, 8 de mayo de 2018

El Web Scraping

Se conoce como "Web Scraping" (algo así como raspado de la Web) a una técnica que utiliza ciertos softwares para extraer información de sitios Web. Usualmente, estos programas simulan la navegación de un humano en la World Wide Web, ya sea utilizando el protocolo HTTP manualmente, o incorporando un navegador en una aplicación.

Esta técnica artificial se relaciona con lo que se llama indexación de la Web, que consiste en indizar la información utilizando un robot, siendo esta una técnica general adoptada por la mayoría de los motores de búsqueda. Sin embargo, el Web Scraping se enfoca más en la transformación de datos sin estructura en la Web (como el formato HTML) en datos estructurados que pueden ser almacenados y analizados en una base de datos central, en una hoja de cálculo o en alguna otra fuente de almacenamiento. 

Alguno de los usos del Web Scraping son: la revisión de precios en tiendas, la monitorización de datos relacionados con el clima de una región, la detección de cambios en sitios Webs y la integración de datos en portales. También es utilizado para obtener información relevante de un sitio a través de ciertos fragmentos de data en internet. Páginas muy conocidas de comparación de precios de habitaciones de hoteles utilizan esta técnica, por ejemplo.  

Ese proceso de recopilar información de forma automática de la Web se ha ha convertido en una técnica muy utilizada dentro del sector del mercadeo y la comunicación, gracias a su capacidad de generar grandes cantidades de datos para crear contenidos de interés hacia grupos de usuarios definidos.


No hay comentarios:

Publicar un comentario