#ParcBitInspira: Data Scraping

El passat 13 de març de  2019 tingué lloc a l’espai Emprenbit el segon taller del cicle #ParcBitInspira. Jorge Morell, de Términos y Condiciones ens explicà els aspectes legals del Data Scraping, o el sistema que empren les empreses per recopilar dades de les webs per un ús propi. Com a expert en dret i tecnologies ens advertí sobre els seus límits legals.

El data scraping no és quelcom nou. Tot va començar amb Pete Warden al 2010, enginyer de software, que va crear dataset amb dades de perfils públics al Facebook. Facebook l’amenaçà. Conclusió: “Big data? Cheap. Lawyers? Not so much”.

Què és datascraping? És com llençar una xarxa d’arrossegada. Software per extreure de forma automatitzada dades d’un lloc web simulant la navegació d’un humà. És legal? No és més que un instrument, la tecnologia en sí és legal, però cal posar atenció a l’ús que se’n fa.

Les dades són clau i ho seran més pels negocis, vivim a l’era de les dades.

Jorge Morell (Términos y Condiciones) i Anne Laure Debrix (Fundació Bit)

 

Alguns precedents judicials:

A EEUU el 2000 el cas Bidder’s Edge (generaven 10.000 acessos al dia al web d’Ebay, representant un 1,53% del seu trànsit diari). Tenir en compte per scraping: no generar danys i pèrdues al web que scrapeges.

Ryanair al 2008-2009 contra data scraping a agències online ( els va anomenar paràsits del sector) , però van perdre alguns judicis.

Cas Fixtures Marketing al·legant que es vulnerava propietat intel·lectual en relació als calendaris de futbol de la Premier League i la lliga escocesa, i si podien ser protegits com a obra, però van perdre.

Atenció, les vulneracions legals del data scraping són acumulables. Llegir bé els termes i condicions.

Clàusula habitual: “Es prohibeix l’ús de qualsevol sistema automatitzat o software per extreure dades d’aquest lloc web per finalitats comercials”.

Predictim: Cas de datascraping a perfils públics de Twitter i Facebook per “espiar” babysitters i concloure si eren recomanables o no, va ser prohibit per Facebook i Twitter.

Si l’ús de les dades és personal o  no comercial, no hi hauria d haver problema. Per exemple, com fem a Términos y Condiciones, scrapejant termes i condicions d’altres llocs amb la finalitat de tenir tenir més coneixements, business intelligence.

Si data scraping és per ús comercial, cal veure cada cas, hi podria haver vulneració legal, però hi ha algunes pautes bàsiques:

Cal una “acceptació” de les condicions; l’accés i ús del web pel bot no basta,cal acceptar específicament les condicions; no equival a un “dret d’admissió digital”.

Com es pot protegir el servei i convertir el data scraping en vulneració? Adoptar mesures tecnològiques apropiades;  exigir l’acceptació de condicions per accedir al lloc o a les dades.

En tot cas, si el servei considera que s’han vulnerat les condicions legals, et tancaran l’accés al mateix.

Cal demanar-se si estam fent datascraping a una base de dades que requereixi una creació intel·lectual protegible (requereix certa feina i originalitat en les dades).

Propietat intel·lectual pot ser:  pel dret d’autor ; o pel dret “sui generis” sobre la base de dades. Cal veure cada cas, si la dada en sí ( un nombre sol, per exemple) no està amparat per la propietat intel lectual, no ho seria protegible. Distint seria altre tipus de contingut, com fotos, vídeos o text.

Propietat intel·lectual: Generant una base de dades que pels recursos invertits per la seva obtenció, verificació o presentació, sigui protegible. Fern-ne data scraping pot suposar un problema legal. En tot cas, caldrà veure el caràcter substancial o no de la utilització de les dades escrapejades.

Si vols fer data scraping de dades personals, atenció al RGPD. Problemes:

1r problema: Què es considera una dada personal? Amb el RGPD, metadades o identificadors numèrics associables a una persona amb dades personals.

2n problema: sobre quina base legal els reculls? No només consentiment, també es pot fer per interès legítim, un contracte,etc…

3r problema: mesures de seguretat, com xifrar dades,anonimitzar les? Quant conservar les?

4t problema: per què empres les dades recollides en el data scraping? Per exemple, si mesos despres vols tractar dades amb una altra finalitat que no era la inicial.

5è problema: Data scraping implica algun perfilat o tractament automatitzat? per exemple, per detectar frau bancari o en procès de compra.

També es considera data scraping no legal per altres motius. Exemples: emprar els servidors de l’empresa per minar criptomonedes ( consum recursos); si sense voler scrapejant t’emportes dades que no volies per ser massa obertes…pèrdua per publicitat en pagaments per impressions,etc…

Conclusions :

Quin ús en faràs de les dades.

Llegir bé termes i condicions.

Si la base de dades està protegida pet la propietat intel·lectual.

Alerta amb les dades personals (RGPD).

No convé fer scraping a dades públiques sense autorització.

Quant a Dr.TIC

Servei d'assessorament tecnològic per a empreses que volen obtenir una visió general del grau d'ús de les TIC al seu negoci i millorar la seva salut TIC.
Aquesta entrada s'ha publicat en Big Data, Dr. TIC, Intel·ligència artificial, Notícies, TenTIC i s'ha etiquetat amb , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

L'adreça electrònica no es publicarà Els camps necessaris estan marcats amb *

Spam protection by WP Captcha-Free