Autor: Ab. Marlon Ron

Con el nacimiento de las Tecnologías de la Información y Comunicación TIC’S, el traspaso de información a través del uso de la tecnología, se realizó de manera inmediata y simultánea.

Sin embargo, en la sociedad de la información no todo resultado es positivo, en la esfera legal podemos encontrar una multitud de casos que surgen a través del mal uso de las TIC’s, en los cuales las leyes nos los regula, un ejemplo tangible es la técnica conocida como Web scraping.

  • El Web scraping en la web, es aquel mecanismo que mediante el uso de las Tecnologías de la Información y Comunicación TIC’s, se extrae información, de manera automática, de cualquier sitio web. A través de softwares programados, que imitan la navegación de una persona por el internet, se obtiene datos personales de páginas web con la finalidad de trasladar esa información a un formato inicial no reutilizable, para que sea manipulados y procesados de diferentes maneras.

En un primer momento el uso de la técnica Web scraping, no ocasionaba problema legal alguno, sin más de poder ser una ventaja comercial para una determinada empresa; empero, con el incremento de valor de los datos personales, que manejan ciertas empresas en sus sitios web, ha surgido un sinnúmero de situaciones legales.

Anteriormente si los datos obtenidos eran para una finalidad propia y de ayuda social no existía problema alguno, no obstante, en la actualidad en legislaciones de países como España, Estados Unidos y Chile, la obtención de datos personales no solo radica en su finalidad sino, en el medio por el cual se trasladó y procesó dicha información, es decir, la obtención de los datos personales de manera legal.

Bajo esta línea, radica la importancia de conocer la técnica de obtención de datos personales en la web conocida como Web scraping, puesto que en nuestro varias instituciones estatales como el Servicio de Rentas Internas, la Contraloría General del Estado, el Consejo de la Judicatura y demás, a través del uso de internet solicita en el registro de los usuarios, nombres, direcciones, claves (en muchos de los casos es el número de cédula de ciudadanía), etcétera; sin embargo, los mayores casos legales de Web scraping son entre empresas privadas.

  • Las técnicas utilizadas por Web scraping, son las siguientes:
  • La automatización a través del uso de softwares;
  • Restricción del copiar y pegar información;
  • La utilización de formato HTML y protocolo HTTP;
  • Utilización de programa de datos personales; y,
  • Reconocimiento de información semántica.

Para que exista un mayor entendimiento acerca de lo mencionado, me permito señalar los casos legales más relevantes conexos a la técnica Web scraping:

  • eBay vs Bidder’s Edge.- La Corte Suprema de los Estados Unidos, en el año 2000, resolvió que: ‘‘ (…)Bay, una compañía de subastas en línea, utilizó con éxito la teoría de ‘traspaso a bienes muebles’ para obtener una orden judicial preliminar que evitaba que Bidder’s Edge, un agregador de datos de subastas, utilizara un ‘rastreador’ para recopilar datos del sitio web de eBay (…)’’[1].
  • Feist Publications v. Rural Telephone Service.- La Corte Suprema de los Estados Unidos, en sentencia de 27 de marzo de 1991, resolvió que: ‘‘(…) Feist había copiado información de la guía telefónica de Rural para incluirlos en la suya, y Rural rehusó licenciar dicha información. El 9 de enero de 1991 Rural había iniciado una demanda por infracción de derechos de autor (…) ’’[2].
  • RyanAir vs Atrápalo.- En el año 2012, el Tribunal Supremo de Chile, a través de la sentencia Nro. 572/2012, resolvió que: ‘‘el web scraping llevado a cabo por Atrápalo era legal. Si bien esta decisión señaló que no todo web scraping lo era, la importancia de esta sentencia radica en el hecho de que el Tribunal Supremo considerase legales las técnicas de web scraping, siempre y cuando, eso sí, se cumpliesen una serie de condiciones’’[3].
  • Field vs Google.- El Tribunal de los Estados Unidos, en el 2006, en donde Google Inc. defendió con éxito una demanda por infracción de derechos de autor. Field argumentó que Google infringió su derecho exclusivo de reproducir sus obras protegidas por derechos de autor cuando «almacenó en caché» su sitio web y puso a disposición una copia del mismo en su motor de búsqueda. Google planteó múltiples defensas: uso justo, licencia implícita, impedimento legal y protección de puerto seguro de la Ley de Derechos de Autor Digital Millennium, resolvió que: ‘‘ (…) otorgó la moción de juicio sumario de Google y denegó la moción de juicio sumario de Field (…)’’[4].

Requisitos Esenciales

Para que se configure el mal uso de la técnica de Web scraping, dicho acto debe cumplir ciertos requisitos esenciales, tales como:

  • Vulneración al derecho de propiedad intelectual de los titulares de la página web. Si bien es cierto que actualmente se está debatiendo acerca de la propiedad intelectual de los datos personales en páginas web para que exista una conexión directa con su titular, pero plataformas como Facebook tienen clausulas restringida de los derechos de propiedad intelectual, o como Twitter que se encarga de regular la propiedad intelectual de sus usuarios;
  • Competencia desleal. Cuando a través del Web scraping se busque crear una empresa o sitio web que cause confusión por parte de los usuarios o el aprovechamiento indebido de la reputación o esfuerzo ajeno;
  • Violación de los términos legales y condiciones de uso. Generalmente en el momento de ingresar nuestros datos personales en un sitio web, existe un cuadro pequeño en el cual nos da la potestad los términos legales y condiciones de uso de dicha información y usualmente lo aceptamos sin leer. Cuando se obtenga datos personales a través del Web scraping y se da un uso diferente a los aceptados por su titular podemos indicar que se ha vulnerado los términos legales y condiciones de uso de dicha información; y,
  • Violación de la protección de datos personales. Si a través del Web scraping se traslada información personal sin consentimiento de su titular, no se puede proceder al almacenamiento y procesamiento de los mismos, además de lo cual debe estar informado de las finalidades del uso de dichos datos personales.

Sin embargo, los administradores de los sitios web pueden realizar ciertos para detener el uso Web scraping, tales como:

  • Bloquear los bots o scrapers;
  • Monitorear el exceso de tráfico proveniente de cierta IP;
  • Añadir un sistema de verificación manual al sitio web;
  • Requerir servicios comerciales antibots;

Conclusión

Consecuentemente, podemos señalar que regular normativamente la técnica Web scraping es fundamental en un Estado en progreso, tener la seguridad jurídica que nuestros datos personales ingresados en una página web se encuentran debidamente regulados y la legalidad de actos realizados por empresas o administradores de sitios web para la obtención de información con la finalidad de tener una ventaja competitiva.

Bibliografía

Bo Zhao, Web Scraping, College of Earth, Ocean, and Atmospheric Sciences, Oregon State University, Corvallis, OR, USA.

Javier Ibañez, Screen Scraping, http://riunet.upv.es/bitstream/handle/10251/10104/PFC_Javier_Iba%C3%B1ez.p df, (25/06/2014).

Open Knowledge Foundation, Data Journalism Handbook, http://datajournalismhandbook.org/1.0/en/getting_data_3.html, (25/06/2014).

Code Proyect, 2007, http://www.codeproject.com/Articles/676672/Web-Scraping-Problems-Solutions, (25/06/2014).

Aced, E. (2005).

Transferencias Internacionales de Datos. Protección de Datos de Carácter Personal en Ibeoramérica. II Encuentro Iberoamericano de Protección de Datos. La Antigua- Guatemala, 2-6 de junio de 2003. Valencia: Tirant lo Blanch. P.105-127. Argüello, F. (2005).

Protección de datos personales: la directiva comunitaria, su influencia y repercusiones en Latinoamérica. II Encuentro Iberoamericano de Protección de Datos. La Antigua- Guatemala, 2-6 de junio de 2003. Valencia: Tirant lo Blanch. P.69-104.

Arias, B. (2002). Vacíos legales en Costa Rica por el uso de la Red: El “e-practice”. Revista de Ciencias Jurídicas. No. 97. San José: Colegio de Abogados y Facultad de Derecho de la Universidad de Costa Rica.

Barth, J. F. (2005). Marco Normativo y Jurisprudencial de la Protección de Datos en Costa Rica. II Encuentro Iberoamericano de Protección de Datos. La Antigua- Guatemala, 2-6 de junio de 2003. Valencia: Tirant lo Blanch. P.261-270.Barriuso Ruiz, C. (2002).

BBC, Conozca a los «scrapers», los ladrones de páginas de internet, 2013, http://www.bbc.co.uk/mundo/noticias/2013/10/131002_tecnologia_screen_scrapers.shtml, (28/06/2014).

Nicolás Marin Torres, Web Scraper con PHP, 2013, http://www.nicolasmarin.com/web-scraper-con-php/, (28/06/2014)

Escuela de Datos, Introducción a la extracción de datos de sitios web: scraping, http://es.schoolofdata.org/introduccion-a-la-extraccion-de-datos-de-sitios-web- scraping/, (26/08/2014)


[1] Véase en https://law.justia.com/cases/federal/district-courts/FSupp2/100/1058/2478126/ 100 F. Supp. 2d 1058 (N.D. Cal. 2000).

[2] Véase en https://cyber.harvard.edu/people/tfisher/1991%20Feist.pdf, caso Nro. 89-1909.

[3] Véase en https://ecija.com/web-scraping-legal-ilegal/

[4] Véase en https://fairuse.stanford.edu/primary_materials/cases/fieldgoogle.pdf