image

Google wijzigt privacybeleid dat het AI-modellen met publieke data kan trainen

dinsdag 4 juli 2023, 16:19 door Redactie, 17 reacties

Google heeft op 1 juli het privacybeleid gewijzigd, waardoor het nu openbare data op internet kan gebruiken voor het trainen van AI-modellen. In een vorige versie wel nog gesteld dat publiek beschikbare informatie kan worden verzameld voor het trainen van de taalmodellen en ontwikkelen van features zoals Google Translate. In de nieuwste versie van het privacybeleid is deze tekst aangepast.

Er staat nu dat publiek beschikbare informatie van publiek beschikbare bronnen kan worden gebruikt voor het trainen van Googles AI-modellen en het ontwikkelen van producten zoals Bard en Cloud AI mogelijkheden. Onlangs werd er nog een rechtszaak tegen tegen ChatGPT-ontwikkelaar Open AI gestart wegens het scrapen van persoonlijke informatie voor het trainen van de chatbot.

Reacties (17)
04-07-2023, 17:29 door majortom - Bijgewerkt: 04-07-2023, 17:30
Due Google beslist zelf dat dit mag? Beetje de omgekeerde wereld, maar dat deden ze natuurlijk ook al met het ongebreideld verzamelen van alle (meta) data van hun gebruikers.
04-07-2023, 19:51 door Anoniem
Onze overheid gaat dit ook met ons allemaal doen,
dus een beetje expertise van de scanners van het eerste uur,
valt niet te versmaden. Dus hand in foot samenwerken maar.

Men deed het al lang in het geniep en gaat het nu een wettelijk kadertje geven via Content Side Scanning.
Uw regering zegt all your data is/belongs to us.
Resistance is futike, you will be assimilated.

De nieuwe mens in de 4e technologische revolutie is The-Borg-genesis.
Leuker kunnen we het niet maken, wel dramatischer,

luntrus
04-07-2023, 20:16 door Anoniem
Wetgeving staat niet alles toe, en op deze manier dekken ze dat echt niet af. Ze kunnen voorwaarden stellen voor wie hun diensten gebruikt, maar hun voorwaarden gelden echt niet voor hun gebruik van wat anderen beschikbaar stellen.

Het lijkt wel alsof ze denken dat ze op deze manier een overeenkomst hebben met iedereen met wie ze nooit een overeenkomst hebben gesloten.

Wat mij betreft laat Google hier zien in wezen geen haar beter te zijn dan Facebook.
04-07-2023, 23:26 door Anoniem
Door Anoniem: Wetgeving staat niet alles toe, en op deze manier dekken ze dat echt niet af. Ze kunnen voorwaarden stellen voor wie hun diensten gebruikt, maar hun voorwaarden gelden echt niet voor hun gebruik van wat anderen beschikbaar stellen.

Het lijkt wel alsof ze denken dat ze op deze manier een overeenkomst hebben met iedereen met wie ze nooit een overeenkomst hebben gesloten.

Wat mij betreft laat Google hier zien in wezen geen haar beter te zijn dan Facebook.

Tjonge kom je daar nu pas achter. Je hebt een paar miljard aan boetes gemist.
05-07-2023, 08:48 door Anoniem
Het grote totale sleepnet wordt opgetuigd.
Gaan we er allemaal kritiekloos in mee.
Laten we de Borg (AI) ons regeren?
05-07-2023, 08:53 door Anoniem
Zo probeert men steeds karma af te dekken.
Vertel je slachtoffers wat je van plan ben.

Protesteert men niet, gaat men kennelijk akkoord
Is karma echt zo makkelijk te omzeilen voor
the invincible? Iemand in the know?

We will er voor de staat hier nu aan meewerken tegen hun medeburgers. Waar zit die vijfde kolonne

luntrus
05-07-2023, 09:07 door Anoniem
Wat mij betreft laat Google hier zien in wezen geen haar beter te zijn dan Facebook.
Hoezo Google beter dan FB, het zijn zowat dezelfde bedrijven wat betreft privacy en ze hebben de macht om te
doen wat ze willen, en die boetes zijn er om die paar die dit begrijpen hun mond dicht te houden.

Als het waar is weet ik maar op de TV in een programma hadden ze het over Zuckerberg die een huis had gekocht
en de huizen die hier naast stonden ook om als waarborg voor zijn privacy, toch iets om over na te denken maar dat
kan alleen maar als je kunt nadenken.

Zij die weinig denken, vergissen zich heel veel. Citaat van Leonardo da Vinci
05-07-2023, 09:30 door _R0N_
Door Anoniem: Wetgeving staat niet alles
Wat mij betreft laat Google hier zien in wezen geen haar beter te zijn dan Facebook.

Uhh Facebook leert veel van Google, Google is altijd al slechter geweest dan facebook en loopt ook voor op facebook.
Google heeft het datagraaien uitgevonden en zal daar ook mee doorgaan tot iemand ze stopt.
05-07-2023, 10:34 door Anoniem
En wat gebeurt er met data die abusievelijk door datalekken gelekt zijn? Of data privacygevoelige data die door criminelen buit gemaakt is en vervolgens door hen openbaar gemaakt wordt?
05-07-2023, 10:58 door Anoniem
Is er een definitie van "openbare data op internet"?
Is dat alles wat je zonder toestemming kan vinden? Is dat ook:
- data van een bedrijf die door een randomwarecrimineel openbaar gemaakt is?
- data op een besloten site die slecht beschermd was?
- data zoals in bv. gmail, die niet voor iedereen beschikbaar is maar wel toegangkelijk door Google?
- laster door personen over andere personen, zonder bewijs dat het correct is?
- artikelen in kranten en andere media die in het kader van algemeen belang gedeeld worden maar die bezwarend voor individuen kunnen zijn?
- andere gelekte data (bv. foto's)?
- data op openbare web sites waarbij door bv. een robot.txt aangegeven wordt dat deze niet gecrawled mag worden?

Het blijft natuurlijk altijd van belang om niet je hele hebben en houden op Internet te zetten, maar het lijkt me dat de simpele kreet "openbare data op internet" niet eenzijdig van toepassing verklaard kan worden...

Q
05-07-2023, 12:13 door Anoniem
Door Anoniem: Is er een definitie van "openbare data op internet"?
Is dat alles wat je zonder toestemming kan vinden? Is dat ook:
- data van een bedrijf die door een randomwarecrimineel openbaar gemaakt is?
- data op een besloten site die slecht beschermd was?
- data zoals in bv. gmail, die niet voor iedereen beschikbaar is maar wel toegangkelijk door Google?
- laster door personen over andere personen, zonder bewijs dat het correct is?
- artikelen in kranten en andere media die in het kader van algemeen belang gedeeld worden maar die bezwarend voor individuen kunnen zijn?
- andere gelekte data (bv. foto's)?
- data op openbare web sites waarbij door bv. een robot.txt aangegeven wordt dat deze niet gecrawled mag worden?

Het blijft natuurlijk altijd van belang om niet je hele hebben en houden op Internet te zetten, maar het lijkt me dat de simpele kreet "openbare data op internet" niet eenzijdig van toepassing verklaard kan worden...

Q

Het antwoord is 'nee'.
Wellicht een beter antwoord: 'het licht eraan'. Waaraan?
- waar je woont
- waar het bedrijf is gevestigd. In verschillende landen is er verschillende wetgeving.

Data is altijd eigendom van degene die de data heeft.
Mag die er dan alles mee doen? Nee.
Wat er wel en wat er niet mag is afhankelijk van de wetgeving waar de data is en soms ook over wie die data gaat.

In de USA.
Alles mag tenzij.
- het nationaal geheim is
- onder andere regelgeving valt (zoals NIST 800-171)

In EU
De burger en het bedrijfsleven : Alles mag tenzij
- er een verbod is opgenomen in wetgeving zoals (nationaal geheim oid)
- er specifieke wet- en regelgeving is (AVG, Wet Politie Gegevens, Wet Inlichtingen, Wet Medische gegevens, etc, etc)

tegelijkertijd ook voor overheden: Niets mag tenzij
- het nadrukkelijk in de wet is opgenomen of op andere wijze (ministeriele regeling, uitvoeringsbepaling) dat het moet/mag

De EU GDPR heeft extraterritoriale werking.
Dit betekent dat ook buitenlandse partijen (Facebook, Google, Microsoft, etc) zich aan de GDPR (AVG) moet houden als zij gegevens hebben over EU burgers vanuit zaken doen in de EU (dat laatste hoort erbij).

Ook de USA heeft extraterritoriale wetten. Zoals de export wetgeving die ook een data-component bevat (export controlled information).

De wereld van publieke data en van eigenaarschap is dus redelijk complex.

De manier waarop de data is verkregen heeft echt wel betekenis, maar ook dat is afhankelijk van de context.

Bedenk altijd.
Het internet is een publiek domein. Wellicht niet de oorspronkelijke bedoeling geweest (of juist wel). Maar nu zeker wel het geval.
Dit betekent dat alles dat aan internet is aangesloten vanuit het publieke domein kan worden benaderd, aangevallen, gehakt, etc. Tenzij beschermingsmaatregelen afdoende zijn. En wanneer is dat dan het geval.

denk er maar eens over na
05-07-2023, 14:06 door Anoniem
Data is altijd eigendom van degene die de data heeft.
Kun jij dit onderbouwen, hier ben ik echt benieuwd naar.

https://www.ictrecht.nl/juridisch-advies/eigendom-van-data

https://www.impactsmartsolutions.com/blog/wie-is-de-eigenaar-van-data/
05-07-2023, 15:55 door Anoniem
Door Anoniem:
Data is altijd eigendom van degene die de data heeft.
Kun jij dit onderbouwen, hier ben ik echt benieuwd naar.

https://www.ictrecht.nl/juridisch-advies/eigendom-van-data

https://www.impactsmartsolutions.com/blog/wie-is-de-eigenaar-van-data/


Nou. Nee. Niet helemaal. Soms weer wel. Het ligt eraan (het standaard antwoord van de jurist ;-)


Maar de-facto.
Ieder die data heeft, die is eigenaar van die instantie van de data. De eigenaar moet het ook beschermen.
Ik neem dus het gezichtspunt in van diegene die de data op zijn (of ingehuurd) systeem heeft en beschermingsplichtig is.

Er zijn natuurlijk ook andere gezichtspunten denkbaar.
zoals die van: het gaat over mij, dus ben ik eigenaar. Ik meen dat dit gezichtspunt niet houdbaar is. Ook als een gegeven over mij gaat, dan hoeft die instantie van dat gegeven niet van mij te zijn.

Bijvoorbeeld: mijn adres hoort bij mij.
Als afleveradres zal ik dat moeten doorgeven aan een webwinkel. Op dat moment is hun instantie van mijn adres hun eigendom. Ook als ik verhuis, dan blijft mijn oude adres (waar ik dus niet meer woon en waar dus niets meer voor mij kan worden afgeleverd hun instantie van inmiddels verouderde data. Alleen is voor mij wel verouderd, maar niet voor die webwinkel. Met dat voor mij verouderde gegeven is voor de webwinkel nog steeds relevant om ook achteraf aan te kunnen tonen waar het door mij gekochte product is afgeleverd.

Jouw link 1. gaat over het recht om de data in te zien, te blijven gebruiken. Dat is een vraag die te maken heeft met continuïteit van dienstverlening, inhuur van diensten, enzovoort. Dit gaat niet over eigendom zoals dat voor goederen zou gelden. De link gaat ook over intellectueel eigendom en de vragen die daaromheen zitten. Wie heeft beschikkingsrecht over de gegevens en wie heeft beslissingsrecht over distributie en opbrengsten. Dit zijn vraagstukken die in verschillende wetten zijn geregeld.
Dit illustreert dat de omstandigheden bepalen (en dat was mijn niet expliciet geschreven kernboodschap)

Jouw link 2.
Een vergelijkbaar verhaal. Hier wordt weer een ander gezichtspunt ingenomen. Namelijk dat van meten en onderhoudbaarheid. Uiteindelijk wordt gesteld dat gegevens helemaal géén eigenaar kan hebben. Juist omdat gegevens eindeloos te kopieren zijn. Hier wordt blijkbaar bedoeld 'exclusief eigenaarschap'.
Ook hier weer: de omstandigheden bepalen (ook het gezichtspunt en dan alleen in die specifieke casus).

Mijn belangrijkste punt is
- in verschillende landen bestaat verschillende juridische cultuur
- vanuit verschillen in juridische cultuur ligt eigenaarschap bij een ander
- er bestaat dus géén breed gedragen definitie over eigenaarschap van gegevens
- er bestaat dus ook géén breed gedragen definitie over/wat openbare informatie is.

overigens
ik ben geen jurist
hoewel nogal stellig gebracht: het is slechts een mening
05-07-2023, 16:23 door Anoniem
Thierry Breton houd toezicht. Sinds 4 juli ook op Google, want ze zijn nu GateKeeper.

https://www.reuters.com/technology/amazon-google-apple-meta-microsoft-say-they-meet-eu-gatekeeper-status-2023-07-04/
05-07-2023, 16:27 door Anoniem
Ieder die data heeft, die is eigenaar van die instantie van de data. De eigenaar moet het ook beschermen.
Dank voor je antwoord, maar is het niet zo dat als mijn data in een cloud zit dat die data mijn eigendom blijft,
blijkbaar niet dus. En bij een datalek kan iemand deze tegen mij gebruiken en dan is het blijkbaar weer mijn
data met alle kwalijke gevolgen voor mij. En als het was zoals jij het stelt dan zijn die ook verantwoordelijk
voor de gevolgen van een datalek, maar we weten hoe dit in de praktijk werkt, ik ben trouwens ook geen jurist.
05-07-2023, 20:59 door Anoniem
Kamer van Koophandel. Tja publieke data van al die zzpers.
06-07-2023, 07:38 door Anoniem
Dus Google kan feitelijk doen wat hen profijtelijker uitkomt.
Daar maken we een wettelijk kader voor, ze hebben ook legers juristen.
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.