#12 Comment Google anonymise vos données personnelles avec la Differential Privacy cover
#12 Comment Google anonymise vos données personnelles avec la Differential Privacy cover
Post Mortem

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

38min |04/05/2021
Play
#12 Comment Google anonymise vos données personnelles avec la Differential Privacy cover
#12 Comment Google anonymise vos données personnelles avec la Differential Privacy cover
Post Mortem

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

38min |04/05/2021
Play

Description

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997.  Wikipedia


  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.




  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145


  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL




Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privacy.”


  • Natyana Sweeney est à l'origine de l'observation  "87% of the U.S. population is uniquely identified by date of birth, gender, postal code." Source: wikipedia

Chapters

  • La Differential Privacy ~ 2 exemples

    00:00

  • Chemin parcourir depuis le k-anonymat

    02:00

  • Confidentialité différentielle ~ L'intuition

    06:50

  • Pile ou face? ~ La Randomized Response

    10:09

  • Les 3 Raisons d'utiliser la Differential Privacy

    14:17

  • Zoom sur une application en prod à Google

    19:15

  • La Differential Privacy, vraiment incrackable?

    22:56

  • Côté CI, comment tester de l'aléatoire?

    27:04

  • Une librairie à recommander?

    29:35

  • Les challenges à l'adoption

    33:21

  • Le mot de la fin

    37:33

Description

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997.  Wikipedia


  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.




  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145


  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL




Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privacy.”


  • Natyana Sweeney est à l'origine de l'observation  "87% of the U.S. population is uniquely identified by date of birth, gender, postal code." Source: wikipedia

Chapters

  • La Differential Privacy ~ 2 exemples

    00:00

  • Chemin parcourir depuis le k-anonymat

    02:00

  • Confidentialité différentielle ~ L'intuition

    06:50

  • Pile ou face? ~ La Randomized Response

    10:09

  • Les 3 Raisons d'utiliser la Differential Privacy

    14:17

  • Zoom sur une application en prod à Google

    19:15

  • La Differential Privacy, vraiment incrackable?

    22:56

  • Côté CI, comment tester de l'aléatoire?

    27:04

  • Une librairie à recommander?

    29:35

  • Les challenges à l'adoption

    33:21

  • Le mot de la fin

    37:33

Share

Embed

You may also like

Description

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997.  Wikipedia


  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.




  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145


  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL




Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privacy.”


  • Natyana Sweeney est à l'origine de l'observation  "87% of the U.S. population is uniquely identified by date of birth, gender, postal code." Source: wikipedia

Chapters

  • La Differential Privacy ~ 2 exemples

    00:00

  • Chemin parcourir depuis le k-anonymat

    02:00

  • Confidentialité différentielle ~ L'intuition

    06:50

  • Pile ou face? ~ La Randomized Response

    10:09

  • Les 3 Raisons d'utiliser la Differential Privacy

    14:17

  • Zoom sur une application en prod à Google

    19:15

  • La Differential Privacy, vraiment incrackable?

    22:56

  • Côté CI, comment tester de l'aléatoire?

    27:04

  • Une librairie à recommander?

    29:35

  • Les challenges à l'adoption

    33:21

  • Le mot de la fin

    37:33

Description

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997.  Wikipedia


  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.




  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145


  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL




Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privacy.”


  • Natyana Sweeney est à l'origine de l'observation  "87% of the U.S. population is uniquely identified by date of birth, gender, postal code." Source: wikipedia

Chapters

  • La Differential Privacy ~ 2 exemples

    00:00

  • Chemin parcourir depuis le k-anonymat

    02:00

  • Confidentialité différentielle ~ L'intuition

    06:50

  • Pile ou face? ~ La Randomized Response

    10:09

  • Les 3 Raisons d'utiliser la Differential Privacy

    14:17

  • Zoom sur une application en prod à Google

    19:15

  • La Differential Privacy, vraiment incrackable?

    22:56

  • Côté CI, comment tester de l'aléatoire?

    27:04

  • Une librairie à recommander?

    29:35

  • Les challenges à l'adoption

    33:21

  • Le mot de la fin

    37:33

Share

Embed

You may also like