-
Notifications
You must be signed in to change notification settings - Fork 0
/
06-hypothesis-tests.qmd
521 lines (360 loc) ยท 35.2 KB
/
06-hypothesis-tests.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
# ืืืื ื ืืฉืขืจืืช {#sec-hypothesis-tests}
ืืคืจืง ืื ื ืืื ืขื ืืืื ื ืืฉืขืจืืช ืคืฉืืืื ืฉื ืืชื ืืืคืขืื ื-R. ืืืืข ืืืืจืื, ืืืืืื ืฉ-R ืืื ืฉืคื ืกืืืืกืืืช ืืฉ ืขืจื ืจื ืฉื ืืืื ื ืืฉืขืจืืช ืคืจืืืจืื ืื-ืคืจืืืจืืื, ืฉืืืื ืื ืืฉืขืจืืช ืฉืื ืืช ืืืฆืืื ืฉืื ืื, ืืื ืืกืคืจ ืื ื ืชืืงื ืืืืื ื ืืืฉืขืจืืช ืฉืืืืฆืื ืืงืืจืก ืืืื ืืกืืืืกืืืงื (ืืืืื ืขืื ืงืฆืช).
ืืืจืช ืืคืจืง ืืื ืื ืืกืคืง ืืช ืืชืืืืจืื. ืืฆืืจื ืืฉืืืืช ืชืืืืจืชืืืช, ืื ื ืืืืืฅ ืืงืจืื ืืช [@walpole1993probability].
ืืืจืช ืืคืจืง ืฉืืคื ืืื ืืื ืืชืช ืืืื ืืขืฉืืื ืืืืฆืืข ืืืื ื ืืฉืขืจืืช, ืืคืจื ื ืืื ืืืงืจืื ืืืืื:
- ืืืื ื ืืฉืขืจืืช ืขื ืชืืืืช
- ืืืื ื ืืฉืขืจืืช ืขื ืฉืื ืืช
- ืืืื ื ืืฉืขืจืืช ืขื ืื-ืชืืืช
- ืืืื ื ืืฉืขืจืืช ืขื ืืชืคืืืืช
## ืืืื ืืฉืขืจืืช ืขื ืชืืืืช
ืืื ืืืคืจืืืจืื ืืืฉืืืื ืฉื ืืชืคืืืืืืช ืืื ืืชืืืืช. ืืชืืืืช ืืืืืืฆืข ืืฉ ืงืฉืจ ืืืืง ืืื ืืื - ืืืฉืจ ืื ืื ื ืืืฆืขืื ืืืืื ืืชืื ืืืืืืกืื, ืืืืฆืข ืืืืื ืืื ืืื ืืืืืฆื ืืช ืืชืืืืช.
```{r setup}
#| warning: false
#| message: false
#| include: false
ggplot2::theme_set(ggplot2::theme_bw())
```
ื ืืืื ืืืช ืืขืืจืช ืืืื ืืคืื ืืืืื ืื ืฉืจืืื ื ืืคืจืง ืืงืืื:
```{r penguin means}
#| warning: false
#| message: false
#| include: false
library(palmerpenguins)
library(tidyverse)
penguins %>%
filter(!is.na(bill_length_mm)) %>%
group_by(species) %>%
summarize(avg_length = mean(bill_length_mm),
sample_size = n())
```
ืืื ืืื ืืื ื ืืคืื ืืืืื ืื ืืืืฆืข ืฉืื ื ืืืืจื ืืืงืืจ. ืืืืืื, ืคืื ืืืืื ืื ืืกืื Adelie ืื ืืขืื ืืงืืจ ืืืืจื ืืืืฆืข 38.8 ื"ื. ืืคืืขื ืืืืืจ ืืืืืฆืข ืืืืืฉื ืขื ืืืื ืฉื 151 ืชืฆืคืืืช, ืืกืืืจ ืืื ืื ืฉืืชืืืืช ืืืื ืืืืืืกืืช ืืคืื ืืืืื ืืื Adelie ืืื ืงืฆืช ืฉืื ื. ืืืืืื, ืชืืืืช ืฉื 38 ื"ื, ืืืืื ืืืืื ืืื ืฉืืืืฆืข ืขื ืคื ื ืืืืื ืฉื 151 ืชืฆืคืืืช ืืืื 38.8 ื"ื.
ืืืืจื ืฉื ืืืื ืืฉืขืจืืช ืขื ืืชืืืืช ืืื ืืขืืืจ ืื ื ืืงืืืข ืืจืืช ืฉืืืื ืฉื $\alpha$ (ืืฉืจ ืืืจื ืืื ื ืงืืขืช ื-5% ืฉืืืื), *ืืื ืืชืืืืช ืืื ืืขืืช ืขืจื ืืกืืื* $\mu_0$, *ืืืื ืชื ืชืืฆืืืช ืืืืื* ืฉืื ื.
ืฆืืจืช ืืกืชืืืืช ืืืจืช ืืื ืื ืืืช ืจืืื ืืจ ืกืื ืืชืืืืช, ืื ืืืืืื ืืืจืืช, *ืื ืืืืื ืืกืืืจ ืฉืื ื ืืฆืืช ืืชืืืืช ืืืื ืชื ืชืืฆืืืช ืืืืื*.
ืืฉืื ืื ื ืชืืืืก ืืืืื ืืื, ืืืืืจ ืืื ื ืืืื ืืช ืืืกืชืืืืช ืืฉื ื ืืืืืื.
ืืชืจืฉืื ืืื ืืฆืื ืืช ืืชืคืืืืช ืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Adelie ืืืืฆืขืืช ืืืกืืืืจืื.
ืขื ืืืืกืืืืจืื ืืืืฉื ื ืฉื ื ืงืืืื ืื ืืืื: ืืืืืฆืข ืืคืืขื ืืืจืืง (38.3913), ืืืขืจื ืฉืืืชื ื ืืื ืืชืืืืช (38) ืืืืฆืขืืช ืืืื ืืฉืขืจืืช.
```{r adelie bill length histogram}
adelie <- penguins %>%
filter(species == "Adelie") %>%
filter(!is.na(bill_length_mm))
ggplot(adelie, aes(x = bill_length_mm)) +
geom_histogram(bins = 15) +
geom_vline(xintercept = 38, color = "#E41A1C", linewidth = 1, linetype = 2) +
geom_vline(xintercept = mean(adelie$bill_length_mm), color = "#4DAF4A", linewidth = 1) +
ggtitle("Distribution of Adelie bill length")
```
ื ืฉืชืืฉ ืืคืงืืืช `t.test` ืขื ืื ืช ืืืืฆืจ ืจืืื ืืจ ืกืื (ืื ืืืื ืืฉืขืจืืช) ืืชืืืืช ืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Adelie.
ื ืื ื ืืช ืจืืื ืืจ ืืกืื ืืจืืช ืืืืืื ืฉื 95% (ืืืืืจ ืจืืช ืืืืืืืช ืฉื ืืืืืื ืฉื ืงืื ืืื 95%, ืื 5% ืฉืืืื). ืืื ืื, ื ืืื ืืื ืืืชืื ืฉืืชืืืืช ืืื ื 38, ืืืจืืช ืฉืืชืฆืคืืืช ืืืืื ืืขืืืช ืืืืฆืข ืฉื 38.8.
```{r adelie ttest}
adeliettest <- t.test(adelie$bill_length_mm,
alternative = "two.sided",
mu = 38, conf.level = 0.95)
adeliettest
```
**ืคืจืฉื ืืช ืชืืฆืืืช ืืืืื: ืื ื ืืืืื ืืช ืืฉืขืจืช ื-0 ืฉืืชืืืืช ืืื ื 38.** ืืืื ืืกืืจ ืืคืืจื ืืคืื:
1. ืืจืืฉ ืืคืื ืืืคืืข ืกืื ืืืืื ืฉืืืคืขื (One Sample t-test), ืืืืืจ ืืืื t ืขืืืจ ืืืื ืืืื (ืืฉ ืื ืืืื ืื ืขืืืจ ืฉื ื ืืืืืื ืืืืืืื, ืืฉื ื ืืืืืื ืื-ืืืืืืื, ืืื ื ืืืื).
2. ืืฉืืจื ืืฉื ืื ืืืคืืข ืืืืื ืฉืื ืืฉืชืืฉื ื.
3. ืืฉืืจื ืืฉืืืฉืืช ืืืฉืขืจื ืืืืืจื ืืืืืช ืฉื ืืื ื (ืืืืื ื $H_1$ . ืืืงืจื ืื ืืืืจื ื ืืืจืืืื ื `alternative` ืืืื ืืฉืขืจื ืื-ืฆืืื, ืืืืืจ: $H_1: \mu\neq38$.
4. ืืฉืืจื ืืจืืืขืืช ืขืจื $T$ ืฉื ืืืืื (ืืืืื ื ืื ืกืืืืกืื ืืืืื), ืืืงืจื ืื ืขืจืื ืืื 3.6513, ืืื ืืกืฃ ืืกืคืจ ืืจืืืช ืืืืคืฉ (df), ืืขืจื ืืืืืืงืืช (p-value). ืขืจื p-value ืืืงืจื ืื ืืื ื ืืชืืช ื-0.05 ืื ืฉืืขืื ืขื ืื ืฉืขืืื ื ืืืืืช ืืช ืืฉืขืจืช ื-0 ($H_0: \mu=38$).
5. ืืฉืืจื ืืืื (ืืืื ืฉืืืจืื) ืืืคืืข ืืจืืื ืืจ ืกืื ืืชืืืืช. ืืืงืจื ืื ืืจืืื ืืจ ืกืื ืืจืืช ืืืืื ืฉื 95% ืืขืื ืขื ืื ืฉืชืืืืช ืืืจื ืืืงืืจ ืฉื ืืคืื ืืืืื ืืืื ืื ืืื ื ืืฆืืช ืืื 38.36 ืืืื 39.22. ื ืืชื ืืฉืื ืื ืฉืืชืืืืช ืืืชื ืืื ื ืืืฉืขืจืช ื-0 (\$\\mu=38\$) ื ืืฆืืช ืืืืฅ ืืืืื ืื, ืืื ืขืืื ืืงื ื ืืื ืขื ืืืืื ืฉืชืืืจื ื ืืกืขืืฃ ืงืืื ืืืชืืืืก ืืขืจื ื-p-value.
6. ืืืกืืฃ ืืืคืืข ืืืืืฆืข ืขืฆืื ืฉื ืืืฉืชื ื (38.7914).
::: callout-tip
# ืืขืืจ ืืืืื ืื-ืฆืืื ืืืืื ืื-ืฆืืื
ืืืขืืจื ืืชืืขืื ืืคืงืืื `t-test` ืืฉื ื ืืช ืืืจืืืื ื `alternative` ืขื ืื ืช ืืืฆืข ืืช ืืืืื ืืกืืืืกืื:
$$
H_0: \mu=38
$$
$$
H_1: \mu>38
$$
ืื ืชืืฆืืช ืืืืื? ืื ืืืกืงื ื?
:::
## ืฉื ื ืืืืืื ืื-ืืืืืืื
ืืขืช ื ืคื ื ืืืืื t-test ืฉืื ื ืฉืชืืฉ ืืืฉืจ ืืจืฆืื ื ื ืืืฉืืืช ืืื ืฉื ื ืืืืืื, ืื ืืืืืืื. ืืืืืื ืขื ืื ืช ืืืื ืืื ื ืืชื ืืืืืช ืืช ืืืฉืขืจื ืฉืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Chinstrap ืืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Gentoo ืฉืืืื (ืืคื ืฉืจืืื ื ืขืจืืืื ืืืืื ืืืกืืช).
ืจืืฉืืช, ื ืฆืื ืืช ืืืชืคืืืืช ืฉื ืฉื ื ืืื ืื ืืชืจืฉืื ืืื:
```{r distribution of chinstrap and gentoo bill length}
chin_gentoo <- penguins %>%
filter(!is.na(bill_length_mm)) %>%
filter(species != "Adelie")
ggplot(chin_gentoo,
aes(x = bill_length_mm, color = species)) +
geom_density() +
ggtitle("Distribution of Chinstrap and Gentoo bill length")
```
ืืชืจืฉืื ืืืืืฉ ืื ื ืืืืืื ืืื ืืชืคืืืืช ืืืจื ืืืงืืจ ืฉื ืฉื ื ืืื ืื (ืืืืืฉื ืืคืจืง ื ืจืื ืืื ืืืื ืื ืืืืืื ืืื ืฉืชื ืืชืคืืืืืืช), ืื ืืขืช ื ืจืฆื ืืืืื ืืช ืืืืืืื ืืื ืืืืฆืขื ืืืจื ืืืงืืจ ืฉื ืื ืื. ื ืฉืชืืฉ ืืคืงืืื `t-test` ืื ืืฆืืจืช ืืคืขืื ืืขื ืฉืื ื ืืื ืฉืื ืืฉืชืืฉื ื ืืืงืจื ืฉื ืืืื ืืืื.
```{r two sample ttest}
chin_gentoo_ttest <- t.test(formula = bill_length_mm ~ species,
data = chin_gentoo)
chin_gentoo_ttest
```
ืฆืืจืช ืืืคืขืื ืฉืื ืืฉืชืืฉื ื ืืืืืจื ื ืืกืื ืืืืื. ืื ืืกืื ืืื `bill_length_mm ~ species`, ืืืืืจ ืืื ืืช ืืืจื ืืืงืืจ ืืคื ืืืฉืชื ื species (ืืืงืจื ืื, ืืืืืื ืฉืืืฉืชื ื ืืืกืืืจ `species` ืืืื ืืืืืง ืฉืชื ืจืืืช, ืืืจืช ื ืงืื ืฉืืืื).
**ืงืืืื ื ืืืื ืฉื ืืฉืขืจืช ื-0, ืืืืืจ ื ืืชื ืืืืืช ืืช ืืืฉืขืจื ืฉืชืืืืช ืืืจื ืืืงืืจ ืืื ืฉื ื ืืื ืื ืฉืืื.** ืืจืืช ืืืืืงืืช ืฉื 0.00773.
ืืจืืื ืืจ ืกืื ืืชืืืืก ืืืคืจืฉ ืืื ืืชืืืืืช, ืงืจื, ืืจืืช ืืืืืื ืฉื 95% ืืืคืจืฉ ืืื ืืชืืืืืช ื ืข ืืื 0.357 ืืืื 2.301 (ืืืืืช Chinstrap ืฉืืขืื ืืืจื ืืงืืจ ืืืื ืืืชืจ).
ืืคืงืืื ืฉืืจืฆื ื ืืฉืชืืฉืช ืืืืื ืืื ืื ืฉืื ืืช ืฉืื ื, ื ืืชื ืืฉื ืืช ืืืช ืขื ืืื ืืืกืคืช ืืืจืืืื ื `var.equal=TRUE`.
```{r two sample ttest non equal variance}
chin_gentoo_nonequal_var_ttest <- t.test(formula = bill_length_mm ~ species,
data = chin_gentoo,
var.equal = TRUE)
chin_gentoo_nonequal_var_ttest
```
## ืฉื ื ืืืืืื ืืืืืืื
ื ืืืื ืืขืช ืืืื t-test ืฉืื ืืฉืชืืฉืื ืืืฉืจ ืืฉ ืื ื ืฉื ื ืืืืืื ืืฉืจ ืืืืืืื ืืื ืืื. ืืืืืื ืืืืืืื ืื ืืืืืื ืืฉืจ ืืื ืขืจื ืืืืื ืืจืืฉืื ื ืืชื ืืืืื ืขืจื ืืืืื ืืฉื ื (ืืืืคื ืื-ืื ืขืจืื). ืืฉืื ืื, ืืืืืื ืืืืืืื ืชืืื ืืืื ืฉืืืื ืืืืืื. ืืืืืื ื"ืงืืืกืืช" ืืืืืืื ืืืืืืื ืื ืืืงืจ ืฉืื ืืฉ ืฉืื ืฉื "ืืคื ื" ืืฉืื ืฉื "ืืืจื": ืื ืืืืืืื ืืฉืื ืฉื ืืชื ืืืฆืืื ืืืจื-ืืคื ื ืขืืืจ ืื ื ืืื. ืืืงืจืื ืืื ืจืืฆืื ืืืืื ืืชืขืจืืืช ืืกืืืืช ืื ืืคืฉืจ ืืืฉืืืช ืืช ืืืคืจืฉืื ืฉื ืืืจื-ืืคื ื ืืืจืืืช ืืื ืืืคืจืฉืื ืฉืื ืื ืืืืคื ืืืืืง ื-0 (ืืื ืื ืืืืจ ืฉืืฉ ืืคืงื ืขื ืืืืื ืืกืืื ืืืชืขืจืืืช).
ื ืืืืฉ ืืืช ืขื ืืื ืืฉืืืื ืืื ืืืจื ืืืงืืจ ืืขืืืง ืืืงืืจ (`bill_length_mm`, `bill_depth_mm`). ืืืืืจ ืืฉื ื ืืืืืื, ืื ืื ืงืฉืืจืื ืืื ืืื (ืืฉืื ืฉืื ืชืฆืคืืช ืฉื ืืืจื ืงืฉืืจื ืืชืฆืคืืช ืืกืืืืช ืฉื ืขืืืง).
ืจืืฉืืช ื ืฉืชืืฉ ืืชืจืฉืื ืขื ืื ืช ืืืืืืฉ ืืช ืืืชืคืืืืืืช ืฉื ืืืฉืชื ืื:
```{r length and depth distribution}
penguins %>%
mutate(specimen = seq_along(species)) %>%
select(specimen, bill_length_mm, bill_depth_mm) %>%
pivot_longer(cols = -specimen, names_to = "measurement_type", values_to = "mm") %>%
ggplot(aes(x = mm, color = measurement_type)) +
geom_density()
```
ืืคื ืฉื ืืชื ืืจืืืช, ืืืชืคืืืืืืช ืฉืื ืืช ืืืื (ืืืืจื ืืจืื ืืฉืืขืืชื ืื ืืขืืืง), ืืืื ื ืืชื ืืืขืจืื ืฉืื ืืืื ืืืืืืงืืช ืืืื ืืืช.
ื ืฉืชืืฉ ืฉืื ืืคืงืืืช `t.test` ืขื ืฉืื ืื ื ืืกืฃ.
```{r paired sample ttest}
paired_ttest <- t.test(x = penguins$bill_length_mm,
y = penguins$bill_depth_mm,
paired = TRUE)
paired_ttest
```
ืืคืื ืืืื ืืืื ืืคืืืื ืฉืืืจ ืจืืื ื (ืฉืืื ืื ืฉืืืืชืจืช Paired t-test ืืืฆืืื ืฉืืืืืจ ืืืืื ืืืืื), ืืืืงืจื ืื ืืืืื ืืืืืง ืกืืืืกืืืช.
ื ืืชื ืืจืืืช ืฉืืืืื ืืื ืืืจื ืืขืืืง ืืืงืืจ ืขืืื ืขื 26.1 ืืขื 27.4 ื"ื, ืืจืืื ืืจ ืกืื ืฉื 95%.
::: callout-tip
ืืืขืืจื ืืคืงืืื `t.test` ืขื ืื ืช ืืืืื ืืช ืืืฉืขืจื ืฉืืืืื ืืื ืืืจื ืืขืืืง ืืืงืืจ ืขืืื ืขื 26.5 ื"ื.
ืืฉื ืื ืืฉืชืืฉื ืืืืื ืืืืื ืขื ืืืจืืืื ื `mu` (ืื ืฆืจืื ืืืืืช ืขืจืื ืฉื ืืืจืืืื ื?).
:::
## ืืืื ืืฉืืืืืื ืฉืื ืืืืช
ืืฉืื ืืช ืืชืืจืช ืืช ืคืืืืจ ืืชืฆืคืืืช, ืืืื ืืขื ืืื ืช ืืืืืื ืกืืืืช. ืืคืจื, ืืคื ืฉืจืืื ื ืืคืงืืืช `t.test` ืืขืืชืื ื ืจืฆื ืืืืืืจ ืืคืงืืื ืืื ืืื ืื ืฉืื ืืืืช ืฉืืืช ืื ืฉืื ืืช (ืืื ืืฉืคืืข ืขื ืืืืื, ืืืืืจ ืื ืืกืืืืช, ืฉืืคืงืืื ืืืฆืขืช). ืืืคืฉืจืืชื ื ืืืฉืชืืฉ ืืคืงืืื `var.test` ืขื ืื ืช ืืืืื ืืื ืืฉืื ืืืืช ืฉื ืฉื ื ืืืืืื ืฉืืืช (ืืฉืขืจืช ืืืคืก ืืื ื ืฉืืืืืื ืืฉืื ืืืืช, ืืืืฉืขืจื ืืืืืจื ืืืืืช ืืื ืฉืืฉืื ืืืืช ืืื ื ืฉืืืช).
ืืืืื ืฉืื ื ืฉืชืืฉ ืืืื ืืช ืืืืก ืืื ืืฉืื ืืืืช, ืืื ืืื ืื ืื ืฉืฉืชื ืืฉืื ืืืืช ืื ืฉื ืืฉืชื ืื ืืงืจืืื ืืืงืืืื ืืืชืคืืืืช ื ืืจืืืืช. ืืืืื ื ืงืจื ืืืื F. ื ืืืื ืืช ืืืืื ืขื ืืฉืื ืืช ืฉื ืืืจื ืืืงืืจ ืฉื Gentoo ืืขืืืช ืืืจื ืืืงืืจ ืฉื Chinstrap.
```{r var test gentoo chinstrap}
chin_gentoo_vartest <- var.test(formula = bill_length_mm ~ species,
data = chin_gentoo)
chin_gentoo_vartest
```
ืฉืืื ืื ืฉืืืคื ืืฉืืืืฉ ืืคืงืืื ืืืื ืืืื ืืืืคื ืืฉืืืืฉ ืืคืงืืื `t.test` (ืจืื ืืืืง ืฉื ืืืืืื ืื ืืืืืืื). ืืืื ืืกืืจ ืขื ืคืื ืืคืงืืื:
- ืืฉืืจื ืืจืืฉืื ื ืฉื ืืคืื ืืฆืืื ืช ืฉืืืืืจ ืืืืื F.
- ืืฉืืจื ืืฉืืืฉืืช ืื ืื ื ืจืืืื ืืช ื ืชืื ื ืืืืื (ืืกืืืืกืื, ืืจืืืช ืืืคืฉ ืืืื ื ืืืืื ื, ืืื ืืช ื-p-value ืืืืืฉื) ืืคื ืฉื ืืชื ืืจืืืช p-value \> 0.05, ืืืื ืื ื ืืชื ืืืืืช ืืช ืืฉืขืจืช ืืืคืก ืฉืืฉืื ืืืืช ืฉืืืช ืืื ืฉื ื ืืืืืืื.
- ืืฉืืจื ืืืื ื ืืชื ืืจืืืช ืื ืืื ืืืืื (ืืืฉืขืจื ืืืืืจื ืืืืืช ืืื ืฉืืืืก ืืื ืืฉืื ืืืืช ืฉืื ื ื-1).
- ืืืืจ ืืื ืืืคืืข ืจืืื ืืจ ืกืื ืืืืก ืืื ืืฉืื ืืืืช $(0.778, 1.819)$. ื ืืชื ืืจืืืช ืจืืื ืืจ ืืกืื ืืืื ืืช ืืขืจื 1 (ืฉืงืื ืืื-ืืืืืช ืืฉืขืจืช ื-0).
- ืืฉืืจื ืืืืจืื ื ืืคืงืืื ืืกืคืงืช ืื ื ืืื ืืืืก ืืื ืืฉืื ืืืืช (1.17).
## ืืืื ืื-ืืจืืืืข (ืืื ืืชืืื, ืื-ืชืืืช)
ืืืื ืื-ืืจืืืืข (\$\\Chi\^2\$) ืืืื ืืฉืืฉ ืืืชื ื ืืฉืชื ืืืจืืช ืืจืืืืืช (ืฉืชืืื ืืืื ืืช ืืช ืืฉืื ืืช):
1. ืืืื ืืื ืืชืืื
2. ืืืื ืื-ืชืืืช
ืืืืืจ, ืืื ืืืืื ื ืืืืื ืก ืืกืคืจ ืื ืืชืืืืจืื ืืขืืืืช ืืืืืจื ืืืืื, ืื ืืืกืืกื ืขืืื ืืขืืงืจืื ืฉื ืคืืจืืง ืืืืื ืืชืืื ืกืืืืกืืืื, ืฉืืื ืืื "ืกืคืืจื ืฉื ืชืฆืคืืืช". ืืกืืืืกืื ืฉืืืืกืก ืขื ืกืคืืจื ืื ืฉื ืชืฆืคืืืช ืืื ืกืืื ืฉื ืจืืืืขื ืืฉืชื ืื ืืงืจืืื, ืืืื ืืชืคืื ืื-ืืจืืืืข.
### ืืืื ืืื ืืชืืื
ืืืืื ืืื ืืชืืื ืื ืื ื ืื ืกืื ืืจืืืช ืืื ืืชืคืืืืช ืืกืืืืช ืื ืฆืคืืช ืื ืชืื ืื ืืืืคืืจืืื ืชืืืืช ืืืชืคืืืืช ืืืจืช ืชืืืืจืชืืช. ืืฉืขืจืช ืืืคืก ืืื ื ืฉืืืชืคืืืืช ืืืืคืืจืืช ืืงืืื ืืชืื ืืชืคืืืืช ืชืืืืจืชืืช ืืืืขื, ืืขืืืช ืืืฉืขืจื ืืืืืจื ืืืืืช (ืฉืืื ื ืืงืืื ืืืชืคืืืืช ืื). ืืื ืืืื ื ืืืืื ืืื-ืืชืืื (ืื ืืื ืืืืช goodness-of-fit).
ื ืืืืจ ืืืืืื ืขื ืื ื-Adelie ืื ืืื ืืช ืืืฉืขืจื ืฉืืชืคืืืืช ืืืจื ืืืงืืจ ืืงืืื ืืืชืคืืืืช ื ืืจืืืืช.
ื ืืืืฉ ืืช ืืืชืคืืืืช ืื ืฆืคืืช ืืืืชืคืืืืช ืืชืืืืจืชืืช (ืขื ืืืืฆืข ืืกืืืืช ืชืงื ืืคื ืืืืืฆืข ืืกืืืืช ืืชืงื ืื ืืืืื ืืื ืชืื ืื).
```{r distribution adelie bill length}
length_mu <- mean(adelie$bill_length_mm)
length_sd <- sd(adelie$bill_length_mm)
theoretical_bill_length <- tibble(x = seq(32, 46, 0.1)) %>%
mutate(length_dens = dnorm(x = x,
mean = length_mu,
sd = length_sd))
ggplot(adelie, aes(x = bill_length_mm)) +
geom_density(color = "blue") +
geom_line(data = theoretical_bill_length,
inherit.aes = FALSE,
aes(x = x, y = length_dens), color = "red") +
ggtitle("Density of Adelie bill length with theoretical density")
```
ืืฉืืืื ืฉืืืฆืขื ืืงืื ืืืื ืจืืฉืืช ืื ืืืช ืืืื ืฉื ืฆืคืืคืืช ืฉื ืืืชืคืืืืช ืื ืืจืืืืช ืขื ืืืืฆืข `r round(mean(adelie$bill_length_mm), 2)`, ืืกืืืืช ืชืงื `r round(sd(adelie$bill_length_mm), 2)`, ืื ืืืืืื ืืื ืชืื ืื ืืืืคืืจืืื ืฉื ืชืืืืช ืืกืืืืช ืชืงื ืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Adelie. ืืคืื ืงืฆืื `dnorm` ืืฉืืฉืช ืืืืฉืื ืืฆืคืืคืืช ืื ืืจืืืืช.
ืืืืจ ืืื ืืฉืชืืฉื ื ื`ggplot`, ืฉืืืื ืืืกืคื ื ืฉืืื ื ืืกืคืช ืฉื `geom_line` ืืฉืจ ืื ืืฉืชืืฉืช ืืืืื ืืจืืฉื (`adelie`) ืืื ืืืืื ืืืฉื ืืช ืฉืืืฉืื ื ืืฉืื ืงืืื (`theoretical_bill_length`). ืืฉืชืืฉื ื ืืืจืืืื ืืื `data = theoretical_bill_length` ืื-`inherit.aes = FALSE` , ืขื ืื ืช ืืื ืืืช ืืช ืืคืงืืื ืฉื `geom_line` ืืืฉืชืืฉ ืืืืื ืฉืื ื, ืืืืืืจืืช ืืกืืืืงื ืฉืื ืืช.
ืืชืืฆืื ื ืจืืืช ืืื ืฉื ื ืืจืคื ืฆืคืืคืืืืช ืืืืื ืืื ืืฉื ื, ืขื ืืจืืื ืืกืืืืช (ืืืืื ืืฆืคืืคืืช ืืชืืืืจืชืืช ืืืืืื ืืืืคืืจืืช). ืืืืื, ืืื ืื ืืืื. ืืื ืื "ืฉืื ืื ืืกืคืืง" ืขื ืื ืช ืฉื ืืื ืืช ืืฉืขืจืช ืืืคืก (ืฉืื ืืืชื ืืืชืคืืืืช)?
ืฆืขื ืืื ืืงืืื ืืคื ื ืฉื ืืฆืข ืืช ืืืื ืืื ืืืชืืื, ืืื ืืื ืืช ืชืจืฉืื ืื ืืชื ืื ื ืืื ืืืฉืืืช ืืื ืืชืคืืืืืืช. ืชืจืฉืื ืืกืื Q-Q-Plot.
#### ืชืจืฉืื Q-Q-Plot
ืืชืจืฉืื ืืกืื Q-Q-Plot ืืืืฉื ืืฆืื ืืืืืื ืื ืฉื ืฉืชื ืืชืคืืืืืืช ืื ืงืืืืช ืืืจืื (ืืชืคืืืืช ืืืช ืืฆืืจ X ืืืฉื ืื ืืฆืืจ Y). ืื ืื ืงืืืืช ืืืืฆืืืช ืืชืืืฉืืช ืขื ืืืืกืื ืืืืจ ืืขืื ืขื ืื ืฉืื ืืืืขืืช ืืืืชื ืืชืคืืืืช. ืืื ืฉืื ืงืืืืช ืืชืจืืงืืช ืืืืืืกืื, ืืืืจ ืืขืื ืขื ืื ืฉืืืชืคืืืืืืช ืืื ื ืืืืช. ืืชืจืฉืื ืืืืื ืืื ืืืืืืื ืฉืืืื ืืชืืื ืืช ืืชืืืืจ ืฉื ืืืื ืืื ืืืชืืื.
```{r qqplot demonstration}
adelie %>%
ggplot(aes(sample = bill_length_mm)) +
geom_qq(distribution = stats::qnorm) +
stat_qq_line()
```
ืืชืจืฉืื ืื ืื ื ืืืืืื ืืจืืืช ืฉืืจืืืช ืื ืงืืืืช ืฉืืืจืื ืืืชืคืืืืช ืคืืืช-ืื-ืืืชืจ ืืืคืคืืช ืขื ืืงื ืฉืืืฆื ืืชืจืฉืื, ืื ืืงืฆืืืช (ืืืืืื ืืงืฆื ืืชืืชืื) ืจืืืื ืฉืืืชืคืืืืช ืืืืคืืจืืช (ืืืืฆืืช ืืฆืืจ y) ืืฉ ืขืจืืื ืืขื ืืืืืื ืืืืฆืืคื ืื ืฉืืืช ืืฉืืื ืืื ืืจืืื ืื ืืกืคืืงื ืขื ืื ืช ืืืืืช ืืช ืืืฉืขืจื ืฉืืืจื ืืืงืืจ ืืชืคืื ื ืืจืืืืช (ืื ืงืืืืช ืฉื ืืฆืืืช ืืชืืช ื-1- ืืฆืืจ ื-x ื ืืฆืืืช ืืขื ืืงื ืืืฉืจ ืืืืฆื ืืชืจืฉืื). ืืขืช ื ืคืขืื ืืืื ืกืืืืกืื ืขื ืื ืช ืืืืื ืืช ืืื ืืืชืืื ืฉื ืืืชืคืืืืช ืืืชืคืืืืช ื ืืจืืืืช ืขื ืืคืจืืืจืื ืฉื ืชืืืืช ืืกืืืืช ืชืงื, ืืคื ืฉืืืืฉืืื ืืื ืชืื ืื ืฉื ืืืจื ืืืงืืจ.
#### ืืืฆืืข ืืืื ืืื ืืืชืืื
ืืืืื ืืื ืืืชืืื ืขืืื ื ืืืืง ืืช ืืืชืคืืืืช ืืืืคืืจืืช ืืชืืื ืกืืืืกืืืื (ืฉืืืจื ืืื ืืงืืื ืืกืื ื-\$O_i\$ ืืืฉืื Observed), ืืืืฉืืืช ืืืื ืชืืื ืืืชืคืืืืช ืืชืืืืจืชืืช (ืฉืืงืืื ืืกืื ืืืืช $E_i$ ืืืฉืื Expected). ืืื ืืชื ืืื ืืฉืืืืฉ ืืืืื ืืื ืฉืืื ืชื ืกืืืืกืื ืืกืคืจ ืืชืฆืคืืืช ืืฆืคืื ืืืื ืืคืืืช 5 ืชืฆืคืืืช.
```{r showing goodness of fit}
distribution_breaks <- c(0, 35, 37, 39, 41, 50)
observed_expected_counts <- adelie %>%
mutate(length_groups = cut(bill_length_mm,
breaks = distribution_breaks)) %>%
count(length_groups, name = "observed") %>%
mutate(probability_upper =
pnorm(q = distribution_breaks[-1], mean = length_mu, sd = length_sd),
probability_lower =
pnorm(q = distribution_breaks[-6], mean = length_mu, sd = length_sd)
) %>%
mutate(expected_prob = (probability_upper - probability_lower)) %>%
mutate(expected_counts = expected_prob * sum(observed))
observed_expected_counts
goodness_of_fit_chisqtest <- chisq.test(x = observed_expected_counts$observed,
p = observed_expected_counts$expected_prob,
rescale.p = TRUE)
goodness_of_fit_chisqtest
```
ืจืืฉืืช ื ืงืืขื ืืืืืืืช ืฉื ืืงืืืฆืืช ืืืชืคืืืืช (ืืืืกืงืจืืืืฆืื, ืืฆืืจืช ืืชืคืืืืช ืืืืื), ืื ืฉืืืชืคืืืืช ืชืืื ืืช ืื ืชืืฆืืืช ืืืชืคืืืืช ืืืคืฉืจืืืช ื-0 ืืขื 1.
ืืืืง ืืฉื ื ืฉื ืืงืื ืืืืฆืจ ืืช ืืืืช ืืชืฆืคืืืช ืืคืืขื ืืืช ืืกืคืจ ืืชืฆืคืืืช ืืฆืคืื (ืขื ืืื ืืืฉืื ืืืกืชืืจืืช ืืชืื ืืืืืฆืข ืืกืืืืช ืืชืงื ืฉื ืืืืื), ืืืืคืื ืืกื ืืชืฆืคืืืช ืืืืื.
ืืืืจ ืืื ืื ืื ื ืืฉืชืืฉืื ืืคืงืืื `chisq.test`. ืฉืืื ืื ืฉืืืขืฉื ืื ืืฉืชืืฉื ื ืืืกืคืจ ืืชืฆืคืืืช ืืฆืคืื ืืื ืืืชืคืืืืช ืฉืืื (ืืืจืืืื ื `p`), ืฉืืขืื ืื ืืืกืชืืจืืช ืืงืื ืืืืืืช ืืชืืื ืืกืืืืกืืืื ืื ืืื ืื.
ืืืงืจื ืื ืงืืืื ื `p.value=0.801` ืืืืืจ ืื ื ืืชื ืืืืืช ืืช ืืฉืขืจืช ืืืคืก ืฉืืืชืคืืืืช ืื ืืื ื ืืื ืืชืคืืืืช ื ืืจืืืืช (ืืื ื ืืืจ ืฉืืฉ ืืกืืก ืืืชืืืืก ืืืชืคืืืืช ืืืชืคืืืืช ื ืืจืืืืช).
::: callout-note
ืืืจืืืช ืกืคืจื ืืกืืืืกืืืงื ืชืชืืงืื ืื ืืกืื ืืืื ืขืืืจ ืืืื ืื-ืืจืืืืข.
ืจืืฉืืช ืืืฉืืื ืืช ืืกืืืืกืื:\
$$
X=\sum_{i=1}^l\frac{\left(O_i-E_i\right)^2}{E_i}
$$
ืืืฉืจ $l$ ืืื ืืกืคืจ ืืชืืื ืืกืืืืกืืืื (ืืืืืื ืืงืืืืช 5), ืืืกืคืจ ืืจืืืช ืืืืคืฉ ืืืชืคืืืืช ืืืื $df=l-1$.
ืืืืจ ืืื ืืืฉืืื ืืช ื-p-value ืืคื ืขืจืื ืฉื ืืกืืืืกืื:
$$
\Pr\left(X>\chi^2_{df}\right)
$$
ืืคืงืืื ืฉืืจืฆื ื ืืืขืฉื ืืืฆืขืช ืืืฉืื ืื ืืืืืง. ื ืืชื ืืืืืื ืืืช ืขื ืืื ืืืฆืืข ืืืืฉืื ืืืืคื ืืฉืืจ.
```{r chi sq direct computation}
X <- ((observed_expected_counts$observed -
observed_expected_counts$expected_counts)^2) /
observed_expected_counts$expected_counts
p.value <- pchisq(q = sum(X), df = 4,
lower.tail = F)
p.value
```
:::
### ืืืื ืื-ืชืืืช
ืืืื ืื-ืชืืืช ืืฉืืฉ ืืืชื ื ืขื ืื ืช ืืืืืื ืืื ืฉื ื ืืฉืชื ืื ืืงืจืืื ืืืฉืื ืื ืืขืื ืชืืืช ืืกืืืืช ืื ืื, ืืืฉืจ ืฉื ืืื ืืฉืชื ืื ืงืืืืจืืืืืื. ื ืืืื ืืช ืืฉืืืืฉ ืืืืื: ืื ืชืื ื ืืคืื ืืืืื ืื ืฉืขืื ืื ืื ื ืขืืืืื ืืืืืืืืช ืืฉื ื ืืกืคืจ ืืฉืชื ืื ืงืืืืจืืืืืื (ืื, ืื, ืืื, ืืฉื ืช ืืืืืื ืฉืืจืฃ ืืืืชื ืืกืคืจื ื ืืชื ืืืชืืืืก ืืืื ืื ืืงืืืืจืื). ื ืจืฆื ืืืืื ืืืืฆืขืืช ืืืื ืื-ืชืืืช ืืื ืืฉ ืงืฉืจ ืืื ืื ืืคืื ืืืืื ืื ืืืื ืฉื ืช ืืืืืื: ืืืืืจ ืืื ืืืืงืจืื ืฉืืกืคื ืืช ืืืืื ื ืชื ื ืืืฉืื ืขื ืืืกืืฃ ื ืชืื ืื ืฉื ืื ืื ืืกืืืืื ืืฉื ืื ืืกืืืืื ืื ืฉืขืืื ืืืืคื ืืืื ืืืืืืช ืคืื ืืืืื ืื ืืื ืฉืืืฉืช ืืื ืื ืืื ืฉืืืฉืช ืืฉื ืื ืืืืื (2007-2009). ื ืชืืื ืืืฆืืจืช ืชืจืฉืื ืฉืืฆืื ืืช ืืชืคืืืืช ืืื ืื ืืื ืฉื ืช ืืืืื.
```{r year and island penguin sampling}
penguins %>%
count(year, species) %>%
group_by(year) %>%
mutate(prop = n/sum(n)) %>%
ggplot(aes(x = factor(year), y = prop, fill = species)) +
geom_col(position = position_fill()) +
scale_y_continuous(labels = scales::percent) +
ylab("Sample distribution") + xlab("") +
ggtitle("Sample distribution of species over years") +
geom_text(aes(label = glue::glue("{round(prop*100)}%")),
position = position_fill(vjust = 0.5), show.legend = FALSE)
```
ืืคื ืฉื ืืชื ืืืืืื ืืชืจืฉืื, ืืฉื ื ืืืืืื ืืกืืืืื. ืืืืืื, ืืฉื ืช 2007 ืจืง 31% ืืืืืืืืช ืื ืฉื ืคืื ืืืืื ืื ืืื Gentoo ืืขืืืช ืฉื ืช 2008 ืฉื 40% ืืืืืืืืช ืื ืืื Gentoo. ืืฉืขืจืช ืืืคืก ืฉืื ื ืืื ืฉืืืฉืชื ื ืฉื ื ืืืืฉืชื ื ืื ืืคืื ืืืืื ืื ืืืชื ืชืืืืื, ืืืืฉืขืจื ืืืืืจื ืืืืืช ืืื ื ืฉืื ืชืืืืื.
ืื ืืืงืจื ืื ื ืฉืชืืฉ ืืคืื ืงืฆืื `chisq.test`. ื ืืืื ืฉืชื ืฉืืืืช ืืืคืขืื ืืช ืืคืื ืงืฆืื, ืฉืชืืื ืืืืืืช ืืืชื ืืชืืฆืื. ืืฉืืื ืืจืืฉืื ื ืืื ืืืืื ืืช ืืคืื ืงืฆืื ืืฉื ื ืืงืืืจืื ืฉื ืืืฉืชื ืื:
```{r independence test variation one}
independent_chisqtest <- chisq.test(x = penguins$year, y = penguins$species)
independent_chisqtest
```
ืืฉืืื ืืฉื ืื ืืื ืจืืฉืืช ืืื ืืช ืืืจืืฆื (ืืืืื 3 ืขื 3 ืืืงืจื ืฉืื ื, ืื ืืื ืืฉืชื ื ืฉืืืฉื ืขืจืืื ืืคืฉืจืืื), ืืื ืืืืื ืืืชื ืืคืื ืงืฆืื ืื:
```{r independence test variation two}
penguin_species_year_counts <- penguins %>%
mutate(year = as.character(year)) %>%
count(year, species) %>%
pivot_wider(names_from = species, values_from = n) %>%
select(-year) %>%
as.matrix()
chisq.test(x = penguin_species_year_counts)
```
::: callout-note
# ืืื ืืชืืฆืืืช ืืืืช?
ืชืืฆืืืช ืืืืื ืืฉื ื ืืืงืจืื ืืืืื ืืืืช, ืืฉืื ืฉืืืจืืืฆืื ืืจืืฉืื ื ืืคืื ืงืฆืื ืืืฆืขืช ืืืืคื ืคื ืืื ืืช ืืกืคืืจื ืฉืืืฆืขื ื ืืืจืืืฆืื ืืฉื ืื. ืืกืืื ืฉืืฆืื ื ืืช ืฉืชื ืืืคืฉืจืืืืช ืืื ืฉืืขืืชืื ืื ืชืื ืื ืฉืืฉ ืืืืื ื ืื ืจืง ืืกืคืืจืืช ืืื ืืคืงืืืจืื ืืืงืืจืืื (ืืื ื ืืื ืืืืืื ืืืฉืชืืฉ ืืืคืฉืจืืช ืืฉื ืื).
:::
ืืืืื ืช ืคืจืฉื ืืช- ื ืืชื ืืจืืืช ืฉืขืจื ื-`p.value` ืืื ื 0.5224, ืืืื ืื ื ืืชื ืืืืืช ืืช ืืฉืขืจืช ืืืคืก (ืืืืืจ ืืืชืื ืฉืืืฉืชื ืื ืืืชื ืชืืืืื).
## ืืืื ืคืจืืคืืจืฆืืืช
ืืืงืจืื ืืื ืื ืื ื ืจืืฆืื ืืืฉืืืช ืคืจืืคืืจืฆืืืช ืืื ืฉืชื ืงืืืฆืืช (ืฉื ื ืืืืืื), ืื ืืืฆืข ืืืื ืืฉืขืจืืช ืขื ืคืจืืคืืจืฆืืืช ืืงืืืฆื ืืกืืืืช, ื ืฉืชืืฉ ืืืืื ืคืจืืคืืจืฆืืืช.
## ืืืื ืคืจืืคืืจืฆืืืช ืขื ืืืื ืืืื
ืจืืฉืืช ื ืืืื ืืืื ืคืจืืคืืจืฆืืืช ืขื ืืืื ืืืื: ื ืืฆืข ืืืื ืกืืืืกืื ืขื ืคืจืืคืืจืฆืืช ืืคืื ืืืืื ืื ืฉืฉืืงืืื ืืขื 4 ืง"ื, ืื ืืื ืืื ืคืจืืคืืจืฆืื ืื ืฉืื ื ืืืืคื ืืืืืง ื-50%.
```{r proportion test}
penguins %>%
filter(!is.na(body_mass_g)) %>%
mutate(is_above_4kg = body_mass_g >= 4000) %>%
summarize(tot_above_4kg = sum(is_above_4kg),
tot_under_4kg = sum(!is_above_4kg),
total_specimens = n())
```
ืืคื ืฉื ืืชื ืืจืืืช ืืฉ 165 ืคืจืืื ืขื ืืฉืงื ืืชืืช ื-4 ืง"ื, ื-177 ืคืจืืื ืขื ืืฉืงื ืืขื 4 ืง"ื. ืกื"ื 342 ืคืจืืื. ื ืฉืชืืฉ ืืคืงืืื `prop.test` ืขื ืื ืช ืืืืื ืืช ืืืฉืขืจื ืฉื ืืืืงื ืฉืืื (ืคืจืืคืืจืฆืื 50%).
```{r prop test penguins}
penguin_prop <- prop.test(x = 177, n = 342, p = 0.5)
penguin_prop
```
ืืคื ืฉื ืืชื ืืจืืืช ืืคืื ืืคืงืืื, ืขืจื ื-p-value ืืื ื 0.552, ืืืื ืื ื ืืชื ืืืืืช ืืช ืืฉืขืจืช ืืืคืก ืฉื ืืืืงื ืืฆื/ืืฆื. ืจืืื ืืจ ืกืื ืืคืจืืคืืจืฆืื ืฉื ืืคืื ืืืืื ืื ืืขืื ืืฉืงื ืืขื 4 ืง"ื ืขืืื ืขื ืืื 0.463 ืืขื 0.571.
::: callout-tip
# ื ืงืืืืช ืืืืฉืื
ื ืกื ืืืฆืข ืืช ืืืืื ืขื ืคืจืืคืืจืฆืืช ืืคืจืืื ืืชืืช ืืืฉืงื 4 ืง"ื. ืืื ืืชืงืืืช ืืืชื ืืชืืฆืื? ืื ืฉืื ื ืืื ืืืื ืืคืื? ืืกืืืจื.
:::
## ืืืื ืคืจืืคืืจืฆืืืช ืืฉื ื ืืืืืื
ื ืืฆืข ืืืื ืืืฉืืื ืืช ืฉืืขืืจ ืืคืจืืื ืืขืื ืืฉืงื ืืขื 4.5 ืง"ื ืืืฉืืื ืืื ืื ื-Gentoo ืืืชืจ ืืื ืื.
```{r prop test two samples}
gentoo_weight <- penguins %>%
mutate(is_gentoo = species == "Gentoo") %>%
filter(!is.na(body_mass_g)) %>%
group_by(is_gentoo) %>%
summarize(above_4.5kg = sum(body_mass_g >= 4500),
under_4.5kg = sum(body_mass_g < 4500),
tot = n())
gentoo_weight
twosample_prop <- prop.test(x = c(11, 107), n = c(219, 123))
twosample_prop
```
ืืคื ืฉื ืืชื ืืจืืืช ืขื ืคื ืชืืฆืืืช ืืืืื, ืืฉ ืฉืืขืืจ ืฉื ื-5% ืืืคืื ืืืืื ืื ืฉืืื ื ืืื Gentoo ืฉืืฉ ืืื ืืฉืงื ืืขื 4.5 ืง"ื, ืืขืืืช 87% ืืืคืื ืืืืื ืื ืฉืื ืื ืืื Gentoo ืืืขืื ืืฉืงื ืืขื 4.5 ืง"ื. ืืืื ืื ืืืืืง ืกืืืืกืืืช ืขื p-value \< 2.2e-16 (ืืืืืจ ืงืื ืืืืกืคืจ ืืงืื ืืืืชืจ ืฉืืืืฉื ืืืื ืืืฆืื).
ืจืืื ืืจ ืกืื ืืืคืจืฉ ืืื ืืืืืื ืืื ืขืืื ืขื ืืื 0.747 ืืขื 0.892 (ืืฉืืจื ืืคืื ืื ืืืคืืข ืืกืืื ืฉืืืื ืืฉืื ืฉืืคืงืืื ืืืกืจืช ืืช ืืคืจืืคืืจืฆืื ืืจืืฉืื ื ืืืฉื ืื ืืืืงืจื ืื ืืคืจืืคืืจืฆืื ืืจืืฉืื ื ื ืืืื ืืืฉื ืื - 11 ืืชืื 219 ืืขืืืช 107 ืืชืื 123).
::: callout-tip
# ืืงืฉืจ ืฉืืื ืืืื ื ืคืจืืคืืจืฆืืืช ืืืืื ืื-ืืจืืืืข ืืื-ืชืืืช
ื ืกื ืืืฉืชืืฉ ืืืืื ืื-ืืจืืืืข `chisq.test` ืขื ืื ืช ืืืฆืข ืืช ืืืื ืืคืจืืคืืจืฆืืืช ืืืกืขืืฃ ืืงืืื
ืจืื: ืขืืืื ืืื ืืช ืืืจืืฆื 2\*2 ืืืฉืจ ืืฉืืจืืช ืื ืืขื/ืืชืืช ืืืฉืงื ืฉื ืงืืข ืืืขืืืืืช ืื ืฉื ื ืืกืืืื ืฉื ืืคืื ืืืืื ืื (ืื/ืื ืืกืื Gentoo.
ืืื ืงืืืืชื ืืช ืืืชื ืืชืืฆืื ืืื ืืืืื ืืคืจืืคืืจืฆืืืช? (ืื ืฉืื ื ืืื ืืืื?)
ืืืกืืคื ืืจืืืื ื ืืืืื ืืคืจืืคืืจืฆืืืช: `correct = FALSE`, ืืจืืืื ื ืื ืืืื ืชืืงืื (ืื ืืคืืืฆืื) ืฉืืืฆืขืช ืืคืื ืงืฆืื. ืืื ืืขืช ืืชืืฆืืืช ืืืืช?
:::
## ืืืื ืงืืืืืืืจืื-ืกืืืจื ืื (KS test) ืืืชืคืืืืช
ืืืื ืงืืืืืืืจืื-ืกืืืจื ืื ืืฉืืฉ ืืืฉืืืื ืืื ืฉืชื ืืชืคืืืืืืช, ืืืืื ืืืืื ืื-ืืจืืืืข ืืืื ืืชืืื, ืื ืืื ืืื ื ืืืจืฉ ืืชืคืืืืืืช ืืืืืืช (ืืคื ืฉืืืื ืื-ืืจืืืืข ืืืจืฉ).
ืืคืฉืจ ืืืคืขืื ืืืชื ืขื ืื ืช ืืืฉืืืช ืืื ืฉืชื ืืชืคืืืืืืช ืจืฆืืคืืช ื ืชืื ืืช ืื ืืื ืืชืคืืืืช ืจืฆืืคื ื ืชืื ื ืืืื ืืชืคืืืืช ืจืฆืืคื ืชืืืืจืชืืช. ืืืืืื, ื ืฉืืืื ืืช ืืืจื ืืืงืืจ ืฉื ืคืื ืืืืื ืื ืืื Adelie ืืืชืคืืืืช ืจืฆืืคื ืชืืืืจืชืืช ื ืืจืืืืช ืขื ืชืืืืช `r round(length_mu, 2)`, ืืกืืืืช ืชืงื `r round(length_sd, 2)`:
```{r kolmogorov-smirnov example}
ks_test_output <- ks.test(adelie$bill_length_mm, "pnorm", mean = length_mu, sd = length_sd)
ks_test_output
```
ืชืืฆืืช ืืืืื ืืืงืจื ืื ืืื ื ืฉืื ื ืืชื ืืืืืช ืืช ืืฉืขืจืช ืืืคืก (ืฉืืืชืคืืืืช ืืื ื ืืชืคืืืืช ื ืืจืืืืช ืขื ืชืืืืช ืืกืืืืช ืชืงื ืืคื ืฉืืืฉืื ืืืืืื). ืืืืื ืืืืฆื ืฉืงืืืื ื ืืืืื ืืื ืืืชืืื ืืกืื ืื-ืืจืืืืข.
::: callout-note
# ืืืืขืช ืืืืืจื ืฉื ืคืื ืืืืื `ks.test`
ืืืกืืจืช ืืืืื ืฉืืจืฆื ื ืงืืืื ื ืืืืขืช ืืืืจื:
ties should not be present for the Kolmogorob-Smirnov test.
ืืืื ืงืืืืืืืจืื-ืกืืืจื ืื ืืฉืชืืฉ ืืกืืืืกืื ืืืจ ืืืกืืืืกืืืื ืฉืืฆืื ื ืขื ืื (ืกืืืืกืื t ืืกืืืืกืื ืื-ืืจืืืืข). ืืืกืืจืช ืืืฉืื ืืกืืืืกืื ืฉื ืืืื ืงืืืืืืืจืื-ืกืืืจื ืื ืืกืืืจืื ืืขืจืืื ืฉืืืืื. ืื ืืืืฉืืช ืืืชืคืืืืช ืืืืคืืจืืช ืืืฉืืืช ืืืชืคืืืืช ืืชืืืืจืชืืช. ืืืืขืช ืืืืืจื ืืขืืื ืขื ืื ืฉืืฉ ืขืจืืื ืืืื ืฉืื ื ืืชื ืืกืืจื, ืื ืืืืื ืขืืืื ืขืืื ืืืืืืจ ืืช ืชืืฆืืช ืืืืฉืื. ืืื ืฉืืืชืคืืืืช ืืืืคืืจืืช ืืฉื ื ืืจืื ืขืจืืื ืืืื, ืื ืืืืื ืืื ืืืงืฆืื ืืื ืฉืืืชืคืืืืช ืืื ื ืจืฆืืคื, ืืืืชืื ืฉืืืื ืืื ืืชืืื ืขืฉืื ืืืืืช ืืชืืื ืืืชืจ (ืืืฉืจ ืืฉืืื ืืืชืคืืืืช ืืืืื).
:::
## ืกืืืืจ ืืคืื ืฉื ืืืื ื ืืฉืขืจืืช
ืืื ืืืงืจืื ืฉืืื ื ืืคืจืง ืื ืืื ื ืืืืื ืื ื ืชืื ืื ืืคืืจืื ืืกืืืจ ืฉื ืืืืืืช (ืื ืืคืขืื ื ืืช ืืจืืืื ื ื-`data` ืื-`formula` ืื ืืคืืจืื ืฉื ืืงืืืจืื). ืชืืฆืืืช ืืืืื ืื ืืืฆืื ืืคืื ืืงืกืืืืื, ืื ืืคืืขื ืืื ืจืฉืืื (list) ืขื ืจืืืืื ืฉืื ืื ืฉื ืืชื ืืืคืจืื ืืืชื. ืืืืืื ืืืืื ืืืืจืื ืฉืืจืฆื ื (`ks.test`) ื ืืชื ืืื ืืงืจืื ืจืง ืืขืจืื ืฉื ื-p-value ืขื ืืื ืฉืืืืฉ ืืงืื: `ks_test_output$p.value`. ืืฉื ื ืืืืื ืื ืงืจืืช `broom` ืืื ืคืงืืื ืื ืงืจืืช `tidy` ืฉืืกืืืขืช ืื ื ืืืคืื ืืช ืืคืื ืฉื ืืคืงืืืืช ืืฉืื ืืช ืืืืื (ืคืืืช ืื ืืืชืจ ืืืืื).
ื ืืืื ืืืช ืขื ืืืง ืืืคืืืื ืฉืจืืื ื ืืคืจืง (ืืืื ืกืืืืจ ืฉื ืคืืจืื ืืขืืืืืช ืืืืื ืืืืฆืขืืช ืืืืืช `gt`).
```{r example usage of broom no run}
#| warning: false
#| message: false
#| eval: false
library(broom)
bind_rows(
tidy(adeliettest),
tidy(paired_ttest),
tidy(independent_chisqtest),
tidy(penguin_prop),
tidy(ks_test_output)
) %>%
gt::gt() %>%
gt::fmt_number(columns = c(1:2, 4:6), decimals = 2)
```
::: {style="zoom:80%; direction:ltr;"}
```{r example usage of broom}
#| warning: false
#| message: false
#| eval: true
#| echo: false
library(broom)
bind_rows(
tidy(adeliettest),
tidy(paired_ttest),
tidy(independent_chisqtest),
tidy(penguin_prop),
tidy(ks_test_output)
) %>%
gt::gt() %>%
gt::fmt_number(columns = c(1:2, 4:6), decimals = 2)
```
:::
ืืืฉื ืื ืฉืืืืฉืืช ืืืืืื ืืืฉืจ ืืจืืฆืื ืืจืื ืืืื ืื ืืืื ืขื ืงืืืฆืืช ืฉืื ืืช, ืืคื ืฉื ืืืื ื [ืคืจืง @sec-purrr-explained].
## ืกืืืื
ืืคืจืง ืื ืืื ื ืืืื ืื ืกืืืืกืืืื ืืกืืืื ืฉืื ืื:
ืืชืืื ื ืืืืื ื ืืฉืขืจืืช ืขื ืชืืืืช ืฉื ืืืื ืืืื, ืืืื ื ืืฉืขืจืืช ืขื ืชืืืืช ืขืืืจ ืฉื ื ืืืืืื ืื-ืืืืืืื ืืขืืืจ ืฉื ื ืืืืืื ืืืืืืื.
ืืืื ื ืขื ืืืื ืืฉืืืืืื ืฉืื ืืืืช, ืืืืื ื ืื-ืืจืืืืข ืืืื ืืชืืื ืืืื-ืชืืืช.
ืืืืจ ืืื ืืืื ื ืืืฉืชืืฉ ืืืืื ื ืคืจืืคืืจืฆืืืช (ืืืื ืืืื, ืืฉื ื ืืืืืื), ืืขื ืืืื ืงืืืืืืืจืื-ืกืืืจื ืื ืืืชืคืืืืช.
ืืืกืืฃ ืืืื ื ืืืฆื ื ืืชื ืืืขืืืจ ืืช ืืคืื ืฉื ืืืืื ืื ืืคืื ืืืืื ืืกืืืจ.
::: end-page