-
Notifications
You must be signed in to change notification settings - Fork 0
/
sciencespo.Rmd
193 lines (110 loc) · 5.1 KB
/
sciencespo.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
---
title: "Intervention Stratégies Territoriales et Urbaines"
subtitle: ""
author: "Clément Mandron, Datactivist"
date: "1er mars 2024"
output:
SlidesDatactivist::moon_reader:
css: [default, datactivist, datactivist-fonts]
lib_dir: libs
nature:
highlightStyle: github
highlightLines: true
countIncrementalSlides: false
params:
event: SciencesPo Ecole Urbaine
slug: dixchoses/sciencespo
---
layout: true
`r paste0("<div class='my-footer'><span>", params$event, "</span> <center><div class=logo><img src='https://github.com/datactivist/slides_datactivist/raw/master/inst/rmarkdown/templates/xaringan/resources/img/fond_noir_monochrome.png' width='100px'></center></span></div>")`
---
class: center, middle
Ces slides en ligne : `r paste0("http://datactivist.coop/", params$slug)`
Sources : `r paste0("https://github.com/datactivist/", params$slug)`
Les productions de Datactivist sont librement réutilisables selon les termes de la licence [Creative Commons 4.0 BY-SA](https://creativecommons.org/licenses/by-sa/4.0/legalcode.fr).
<BR>
<BR>
![](https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-sa.png)
---
<img src='https://github.com/datactivist/slides_datactivist/raw/master/inst/rmarkdown/templates/xaringan/resources/img/logo.png' width='320px'>
### We .red[open data], we make them .red[useful]
![](./img/equipe.png)
---
![](img/clients.png)
---
class: inverse, center, middle
# Trois choses qui n'existeraient pas sans l'open data
---
## 1. Yuka
.pull-left[
- 25 millions d'utilisateurs
- 35 scans de produits par seconde
- Top 50 des applis gratuites sur l'Appstore et le Playstore
- 2 million € de CA en [2022](https://www.pappers.fr/entreprise/yuca-817769466)
]
.pull-right[
![](./img/logo_yuka.png)
]
???
Trois sources de revenus (wikipedia) :
- fremium (70%). exemple accès hors ligne
- vente calendrier produit de saison (20%)
- vente d'un programme nutrition (10%)
En 2017, Yuka s'appuyait exclusivement sur Open Food Facts
À partir de janvier 2018, une base de données propriétaire est mise en place pour ajouter un système de contrôle et de vérification des contributions
La base de données de Yuka continue à être alimentée par les contributions des utilisateurs à travers l’application. De plus, les industriels partagent aussi les informations de leurs produits14, grâce à la plate-forme Alkemics
Reste premier contributeur d'OFF
---
[.center[![](./img/off.png)]](https://fr.openfoodfacts.org/decouvrir)
???
Derrière OFF, une association commun numérique, gouvernance partagée, données en ODBL
---
## 2. Les applis de mobilité
.center[.reduite[![](./img/CityMapper.png)]]
---
## 2. Les applis de mobilité
.center[.reduite[![](./img/stan.png)]]
---
## 3. ChatGPT
![](./img/sandwich.png)
???
Sans CommonCrawl = les données d'entrainement dans les mains d'un nombre réduit de personnes
ChatGPT et les autres LLM sont entraînés sur des données ouvertes. Par exemple Wikipedia. Mais aussi CommonCrawl
CommonCrawl : biais, souvent des versions mal-filtrées sont utilisées
Popular Common Crawl versions is often limited to removing pornography and relies on simple keyword lists or AI classifiers trained on user generated content that can itself be problematic
---
class: inverse, center, middle
# Mon métier à travers deux exemples
---
## Obsevatoire des données de l'achat public
[![](./img/bretagne.png)](https://achat-public.data.bretagne.bzh/pages/indicateurs/?chantier=1&objectif=1)
???
Idée : faire des entretiens avec les services pour voir qu'elle donnée est remplie comment ?
Une fois cette observatoire en place, aller voir les filières. Co-construire des indicateurs avec l'observatoire
Aller sur le site, BILAN 1ER SCHÉMA 2018-2022 > source de données
178 333,33 de drapeaux bretons en 2021
---
## MonDiagnosticArtificialisation
[![](./img/mda.png)](https://mondiagartif.beta.gouv.fr/)
???
Parler des mêmes chiffres.
Porter à connaissance
Rapports triennaux
Aller sur le site, CA melun val de sein, croisement avec document d'urbanisme. Quelles données utilisent MonDiagnosticArtificialisation ?
Expliquer un algorithme, c'est d'abord expliquer les données
---
## Travailler dans la "data" après STU ?
- Au délà de son aspect normatif (et performatif), la donnée est une opportunité pour des coalitions d'acteurs
- Développer votre culture générale de la donnée (savoirs, savoirs-faire, savoir-être)
- Vous êtes formé·e·s pour !
---
### Ce sera (peut-être) à vous de le faire
Des fonctions consacrées à la donnée encore relativement rares dans les administrations
.center[.reduite[[![](./img/datapub.png)](https://enquete.data-publica.eu/rapport/Rapport.html#1_Utiliser_les_donn%C3%A9es_:_Motivations_et_obstacles)]]
---
### Conférence-Débat Open data, pouvoirs et contre-pouvoirs
.center[.reduite[[![](https://framaforms.org/sites/default/files/forms/img/affiche_conf_goeta_2.jpg)](https://framaforms.org/conference-debat-open-data-pouvoirs-et-contre-pouvoirs-1708942001)]]
---
class: inverse, center, middle
# Merci !
Contact : [clement@datactivist.coop](mailto:clement@datactivist.coop)