Le Parisien nous annonce que YouTube a connu une panne mondiale hier soir 13 mars 2014, entraînant avec lui la pléthore de sites qui proposent ses vidéos à mêmes leurs pages web via le lecteur embarqué. On remarquera que pour mieux nous informer l’article en question intègre deux tweets (paresse de journaliste ?).

Vidéos YouTube, encarts Twitter, musiques Soundcloud, boutons Facebook… nos pages web deviennent de plus en plus souvent un savant mélange entre notre propre contenu et celui des autres, apporté sur un plateau par des multinationales à forte dominante américaine.

C’est pratique et gratuit. Il y a un juste à faire un copier/coller avec un bout de code pour que, ô magie, le contenu des autres apparaisse instantanément sur votre page, l’enrichissant ainsi à moindre frais.

Mais il y a un risque et un prix à payer. Le risque c’est que comme rien n’est éternel, le jour où YouTube, Facebook, Twitter… disparaîtront (si, si, ça leur arrivera à eux aussi), on se retrouvera avec des pages pleines de zones vides qui n’auront plus de sens. Avant de disparaître, ces sociétés en difficulté auront pris le soin de modifier le contenu même de toutes ces (frêles) embarcations avec, qui sait, toujours plus de publicité. Elles en ont parfaitement le droit, c’est un accord tacite que vous signez avec elles lorsque vous recopiez leur code. Google peut ainsi très bien du jour au lendemain ne faire afficher qu’une seule et unique vidéo dans tous les milliards lecteurs YouTube embarqués avec, disons, une pub pour Coca-Cola : impact marketing garanti !

Quant au prix à payer il est lourd à l’ère de l’informatique post Snowden, c’est celui de votre vie privée car, comme on le verra plus bas, ces intégrations collectent de nombreuses informations vous concernant.

Ici donc c’est au tour de l’énorme banque Getty Images de vous proposer d’embarquer ses photos. Et vous avez le choix parmi… 35 millions d’images ! D’un côté cela rend service et sensibilise au respect du crédit, de la licence et du lien vers le document d’origine. De l’autre ça participe à la fameuse citation « si c’est gratuit, c’est que c’est vous le produit »…

À comparer avec ce qu’a fait la British Library, l’équivalent britannique de la BnF, en décembre dernier : verser 1 million d’images du domaine public en haute résolution sur Flickr. Un autre monde, un monde à défendre, promouvoir et encourager.


Potzuyoko - CC by


Getty Images autorise l’incorporation gratuite, mais quel en est le prix pour la vie privée ?

Getty Images Allows Free Embedding, but at What Cost to Privacy?

(Traduction : r0u, Juliette, Achille, goofy)

Getty Images — probablement la plus grande banque d’images d’illustrations et de photos éditoriales au monde — a annoncé un changement majeur dans ses offres d’images à destination des sites web. Depuis cette semaine, en plus des traditionnelles options de contenus sous licence, il est possible d’incorporer leurs images à son site, gratuitement et sans filigrane, pour peu que soient utilisés le code d’incorporation et l’iframe fournis (par Getty).

Il existe au moins une raison pour que ce changement soit positif et enthousiasmant : c’est encourageant de voir des entreprises expérimenter différents modèles économiques et faire appel à la carotte proverbiale plutôt qu’au bâton. En d’autres termes, Getty facilite le fait de s’engager dans un comportement souhaitable — en citant comme il faut ses sources et en donnant un lien — plutôt que de se contenter d’augmenter les pénalités des contrevenants en proférant des menaces et en intentant des poursuites judiciaires. C’est mieux pour les utilisateurs et cela pourrait s’avérer au final plus efficace pour l’entreprise.

Getty a aussi un point de repère. Ils se sont déjà lancés auparavant dans une stratégie de lettres de menaces et ils ont même intenté des procès pour lutter contre les utilisations illégales. Et il y a d’autres précedents. Même si l’échelle est fondamentalement différente, la Recording Industry Association of America (NdT : la RIAA, association interprofessionnelle qui défend les intérêts de l’industrie du disque aux États-Unis) a déjà pratiqué à peu près la même technique dans son infortunée campagne de long terme contre ses fans. Il n’y a aucune certitude que Getty ait abandonné cette stratégie — selon Businessweek, la société aurait lancé cinq nouvelles actions pour atteinte au copyright en une seule semaine au mois de janvier — mais si c’est le cas, c’est une avancée dans la bonne direction.

Mais pour d’autres raisons cette décision doit nous inquiéter — tout spécialement sur le plan du respect de la vie privée. Certaines de ces critiques sont communes à tous les sites pourvoyant des ressources ou des scripts tiers : quand un site embarque ce type de contenu, que ce soit Google Analytics, une vidéo de Youtube, un bouton Facebook Like ou désormais une iframe Images de Getty, une connexion supplémentaire est créée entre le lecteur et l’hébergeur tiers. Cet hébergeur de contenu tiers peut possiblement obtenir et enregistrer votre IP et l’heure précise de la requête, des informations à propos du type de navigateur que vous utilisez, son numéro de version, sur votre sytème d’exploitation, votre processeur, vos préférences de langue et d’autres données encore ; l’URL du site que vous consultiez et parfois des cookies traceurs.

Ce problème, malheureusement, est une caractéristique fondamentale du Web tel que nous le connaissons. Mais quelques faits à propos de Getty rendent cette situation particulièrement troublante. En effet, en raison de la taille et de la popularité de Getty, un utilisateur unique pourra retrouver ces images incorporées sur un nombre significatif de sites qu’il visite. Cela permettra à Getty de croiser plus d’informations sur l’historique de navigation de l’utilisateur que n’importe quel autre site unique avant lui. Ces informations, à leur tour, sont susceptibles d’être réquisitionnées par un gouvernement, vendues à des courtiers de données, voir même victimes de fuites ou de failles de sécurités.

Ces préoccupations pourraient être atténuées par une politique ferme de respect de la vie privée ou par quelques indications sur ce que Getty compte archiver et sur la façon dont cela sera utlisé. Malheureusement, c’est l’inverse qui s’est produit. Un responsable du développement commercial de Getty Images a déclaré à The Verge que l’entreprise avait « sûrement pensé » à monétiser les données, mais qu’elle n’a pas de plans précis. Nous avons parlé à un responsable de Getty Images qui nous a confié, qu’à ce jour, l’entreprise ne collecte pas plus d’informations qu’il n’est nécessaire pour connaître le nombre de vues de chaque image. C’est louable, mais puisque cette pratique est significativement plus protectrice de la vie privée que ce que l’entreprise affirme dans sa déclaration de confidentialité générale - mise à jour en mai 2012 - cela peut changer à tout moment. Les bonnes pratiques consistent à limiter, en fonction des besoins du site, le nombre de données collectées et conservées, mais ces bonnes pratiques sont mises à mal par la tentation de collecter les données en masse et de trier ce qui est utile plus tard.

Au-delà de ce que Getty Images fait avec les données de ces utilisateurs, les images sont actuellement fournies au moyen d’une connexion HTTP non chiffrée. En conséquence, une personne sur le même réseau, ou le fournisseur d’accès internet de l’utilisateur, peut intercepter ces requêtes HTTP. Dans le cas d’un site d’actualité protégeant l’anonymat de ses lecteurs à l’aide d’une connexion HTTPS, ce lien parallèle pourrait dévoiler les articles qu’ils lisent.

Ces menaces pour la vie privée n’auront probablement pas de conséquences pour tout le monde, mais elles en auront pour certaines personnes. Elles en auront également pour les archives ou pour les sites soucieux de conserver leur propre historique : laisser un autre site héberger les images peut sembler être une bonne affaire, mais ces images ne seront peut-être pas toujours disponibles et cela pourrait interférer avec la capacité de l’Internet Archive à conserver une page telle qu’à sa publication.

Si Getty Images continue de proposer ses images par le biais d’iframes embarquées, il existe plusieurs moyens pour eux d’améliorer leur service pour l’utilisateur final. Il leur faudrait offrir leurs images à travers une connexion HTTPS par défaut. Ils devraient expliquer clairement et publiquement leurs pratiques pour limiter la collecte et le stockage de données sur les utilisateurs. Et même si l’entreprise respecte son standard actuel de collecte minimale de données, elle devrait s’engager à suivre un niveau d’exigence plus élevé comme celui donné par les spécifications Do Not Track : si l’utilisateur envoie un signal indiquant qu’il ne souhaite pas être suivi, Getty Images se devrait de le respecter.

Enfin, les responsables des sites web devraient se demander si le fait d’intégrer des ressources en provenance de tiers est ce qu’il y a de mieux pour leurs visiteurs. Il y a, après tout, d’autres options. Certaines publications ont décrit Getty Images comme la plus grande banque d’images et de photos mais c’est oublier une catégorie majeure : Flickr à lui seul dispose de plusieurs millions d’images distribuées sous licence Creative Commons, et Wikimedia Commons en a des dizaines de millions d’autres. À l’inverse des conditions d’utilisation des contenus embarqués de Getty Images, les licences Creative Commons permettent au site hébergeur de proposer directement des images qui ne seront pas susceptibles d’être modifiées dans le futur, et parfois certaines licences autorisent même de modifier ou de recombiner ces images.

C’est une bonne chose de voir Getty explorer ces nouvelles pistes, et nous serons encore plus rassurés si cette stratégie remplace complètement l’ancienne posture procédurière. Mais il est important pour les utilisateurs de savoir que, dans certains cas, l’incorporation gratuite de photos peut avoir un véritable coût pour le lecteur.

Crédit photo : Potzuyoko (Creative Commons By)