|
1 |
| ---- |
2 |
| -title: "Contribution_guidance" |
3 |
| ---- |
4 |
| - |
5 |
| - |
6 |
| -对于可视化教程的示例指导 |
7 |
| - |
8 |
| -## Example |
9 |
| - |
10 |
| -【Figure. 示例图】 |
11 |
| - |
12 |
| -展示以上示例图的标题/图注,并对示例图xy轴或其他标识物的含义解读。 |
13 |
| - |
14 |
| -## 环境配置 |
15 |
| - |
16 |
| -- 系统要求 跨平台(Linux/MacOS/Windows) |
17 |
| - |
18 |
| -- 编程语言: R |
19 |
| - |
20 |
| -- 依赖资源: (填充可视化教程依赖的R包或其他资源) |
21 |
| - |
22 |
| -```{r packages setup, message=FALSE} #代码示例----- # Installing necessary packages if (!requireNamespace("readr", quietly = TRUE)) { install.packages("readr") } # Loading the libraries library(readr) # Read tsv files} |
23 |
| -``` |
24 |
| - |
25 |
| -## 数据准备 |
26 |
| - |
27 |
| -- 需包含R内置的数据集(如iris、penguins)和生物医学相关数据集(如组学数据、生存信息、临床指标等)。 |
28 |
| -- 生物医学相关数据集需上传至Bizard腾讯云以便获取插入教程的链接,来自于公共数据集的数据最佳,若由个人/组织提供需确保数据能够被公开。数据集大小需小于1MB。 |
29 |
| - |
30 |
| -```{r load data, message=FALSE} |
31 |
| -# 数据读入和处理代码可以自由选择是否展示------ |
32 |
| -# 读取 TSV 数据 |
33 |
| -data <- readr::read_tsv("https://bizard-1301043367.cos.ap-guangzhou.myqcloud.com/TCGA-LIHC.htseq_counts.tsv.gz") |
34 |
| -
|
35 |
| -# 筛选并重塑第一个基因 TSPAN6 的数据(Ensembl ID: ENSG00000000003.13) |
36 |
| -data1 <- data %>% |
37 |
| - filter(Ensembl_ID == "ENSG00000000003.13") %>% |
38 |
| - pivot_longer( |
39 |
| - cols = -Ensembl_ID, |
40 |
| - names_to = "sample", |
41 |
| - values_to = "expression" |
42 |
| - ) %>% |
43 |
| - mutate(var = "var1") # 添加一列来区分变量 |
44 |
| -
|
45 |
| -# 筛选和重塑第二个基因 SCYL3 的数据 (Ensembl ID: ENSG00000000457.12) |
46 |
| -data2 <- data %>% |
47 |
| - filter(Ensembl_ID == "ENSG00000000457.12") %>% |
48 |
| - pivot_longer( |
49 |
| - cols = -Ensembl_ID, |
50 |
| - names_to = "sample", |
51 |
| - values_to = "expression" |
52 |
| - ) %>% |
53 |
| - mutate(var = "var2") # 添加一列来区分变量 |
54 |
| -
|
55 |
| -# 合并两个数据集 |
56 |
| -data12 <- bind_rows(data1, data2) |
57 |
| -
|
58 |
| -# 查看最终的合并数据集 |
59 |
| -head(data12) |
60 |
| -``` |
61 |
| - |
62 |
| -## 可视化 |
63 |
| - |
64 |
| -### 1. 基础绘图 |
65 |
| - |
66 |
| -使用基础函数绘制图片的图注和简介。 |
67 |
| - |
68 |
| -例:\@fig-BasicHist 显示了 TSPAN6基因在不同样本中的表达水平分布。 |
69 |
| - |
70 |
| -```{r fig1BasicHist} |
71 |
| -# 基础绘图代码示例----- |
72 |
| -#| label: fig-BasicHist |
73 |
| -#| fig-cap: "Basic Histogram" |
74 |
| -#| out.width: "95%" |
75 |
| -#| warning: false |
76 |
| -
|
77 |
| -# 基础柱状图 |
78 |
| -p1 <- ggplot(data1, aes(x = expression)) + |
79 |
| - geom_histogram() + |
80 |
| - labs(x = "Gene Expression", y = "Count") |
81 |
| -
|
82 |
| -p1 |
83 |
| -``` |
84 |
| - |
85 |
| -补充基础代码可以扩展的重要参数,并提供对应的绘图代码。 |
86 |
| -例: |
87 |
| -::: callout-tip |
88 |
| -**关键参数: `binwidth` / `bins`** |
89 |
| - |
90 |
| -`binwidth` 或 `bin`参数决定了每个分区包含多少数据。修改这些值会极大地影响直方图的外观和传递的信息。 |
91 |
| -::: |
92 |
| - |
93 |
| -```{r fig2binwidth/bins} |
94 |
| -# 代码示例(以补充参数bins为例)----- |
95 |
| -#| label: fig-bins |
96 |
| -#| fig-cap: "Key Parameters: `binwidth` / `bins`" |
97 |
| -#| fig.width: 8 |
98 |
| -#| fig.heright: 2 |
99 |
| -#| out.width: "95%" |
100 |
| -#| warning: false |
101 |
| -
|
102 |
| -p2_1 <- ggplot(data1, aes(x = expression)) + |
103 |
| - geom_histogram(bins = 30, fill = "skyblue", color = "white") + |
104 |
| - ggtitle("Bins = 30") + |
105 |
| - labs(x = "Gene Expression", y = "Count") |
106 |
| -
|
107 |
| -p2_2 <- ggplot(data1, aes(x = expression)) + |
108 |
| - geom_histogram(bins = 50, fill = "skyblue", color = "white") + |
109 |
| - ggtitle("Bins = 50") + |
110 |
| - labs(x = "Gene Expression", y = "Count") |
111 |
| -
|
112 |
| -cowplot::plot_grid(p2_1, p2_2) |
113 |
| -``` |
114 |
| - |
115 |
| -### 2. 更多进阶图表 (例:密度曲线和柱状图结合) |
116 |
| - |
117 |
| -介绍复杂的可视化类型,例如使用包含更多自定义参数的函数、使用多种基础图表叠加、添加统计学检验等。 |
118 |
| -例:密度曲线可以平滑地表示数据分布。直方图依赖于分位数,而密度曲线则不同,它使用核密度估计(KDE)来平滑分布。这样就能更清楚地了解数据的整体趋势和形状。 |
119 |
| - |
120 |
| -```{r fig3w/Density Curve} |
121 |
| -# 进阶绘图代码示例----- |
122 |
| -#| label: fig-DensityCurve |
123 |
| -#| fig-cap: "Histogram with Density Curve" |
124 |
| -#| out.width: "95%" |
125 |
| -#| warning: false |
126 |
| -
|
127 |
| -p1 <- ggplot(data1, aes(x = expression)) + |
128 |
| - geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "skyblue", color = "white") + |
129 |
| - geom_density(alpha = 0.2, fill = "#FF6666") + |
130 |
| - labs(x = "Gene Expression", y = "Density") |
131 |
| -
|
132 |
| -p1 |
133 |
| -``` |
134 |
| - |
135 |
| -如果你有需要的话可以选择使用`callout-tip`添加对参数的详细描述。 |
136 |
| - |
137 |
| -## 应用 |
138 |
| - |
139 |
| -展示可视化图表在生物医学文献中的实际应用,如果基础图表/进阶图表被广泛应用在各类生物医学文献,则可以选择分别展示。 |
140 |
| - |
141 |
| -例: |
142 |
| -### 1. 基础柱状图的应用 |
143 |
| - |
144 |
| -::: {#fig-HistApplications} |
145 |
| -{fig-alt="HistApp1" fig-align="center" width="60%"} |
146 |
| - |
147 |
| -基础柱状图的应用 |
148 |
| -::: |
149 |
| - |
150 |
| -图 9 显示了 n = 6时人类X染色体和人类Y染色体直方图相对频率的差异。 \[1\] |
151 |
| - |
152 |
| -需补充图片图注和来源文献信息。可视作者意愿补充对该图的代码复现。 |
153 |
| - |
154 |
| -## 参考文献 |
155 |
| - |
156 |
| -例: 1. Costa, A. M., Machado, J. T., & Quelhas, M. D. (2011). Histogram-based DNA analysis for the visualization of chromosome, genome, and species information. *Bioinformatics, 27*(9), 1207–1214. <https://doi.org/10.1093/bioinformatics/btr131> |
157 |
| - |
158 |
| -## 共享者 |
159 |
| - |
160 |
| -- **编辑**: 您的姓名。 |
161 |
| -- **审阅**: 审阅者姓名。 |
| 1 | +--- |
| 2 | +title: "Contribution_guidance" |
| 3 | +--- |
| 4 | + |
| 5 | + |
| 6 | +对于可视化教程的示例指导 |
| 7 | + |
| 8 | +## Example |
| 9 | + |
| 10 | +【Figure. 示例图】 |
| 11 | + |
| 12 | +展示以上示例图的标题/图注,并对示例图xy轴或其他标识物的含义解读。 |
| 13 | + |
| 14 | +## 环境配置 |
| 15 | + |
| 16 | +- 系统要求 跨平台(Linux/MacOS/Windows) |
| 17 | + |
| 18 | +- 编程语言: R |
| 19 | + |
| 20 | +- 依赖资源: (填充可视化教程依赖的R包或其他资源) |
| 21 | + |
| 22 | +```{r packages setup, message=FALSE} |
| 23 | +#代码示例----- |
| 24 | +# Installing necessary packages |
| 25 | +if (!requireNamespace("readr", quietly = TRUE)) { |
| 26 | + install.packages("readr") |
| 27 | +} |
| 28 | +if (!requireNamespace("ggplot2", quietly = TRUE)) { |
| 29 | + install.packages("ggplot2") |
| 30 | +} |
| 31 | +if (!requireNamespace("tidyverse", quietly = TRUE)) { |
| 32 | + install.packages("tidyverse") |
| 33 | +} |
| 34 | +
|
| 35 | +# Loading the libraries |
| 36 | +library(readr) |
| 37 | +library(ggplot2) |
| 38 | +library(tidyverse) |
| 39 | +``` |
| 40 | + |
| 41 | +## 数据准备 |
| 42 | + |
| 43 | +- 需包含R内置的数据集(如iris、penguins)和生物医学相关数据集(如组学数据、生存信息、临床指标等)。 |
| 44 | +- 生物医学相关数据集需上传至Bizard腾讯云以便获取插入教程的链接,来自于公共数据集的数据最佳,若由个人/组织提供需确保数据能够被公开。数据集大小需小于1MB。 |
| 45 | + |
| 46 | +```{r load data, message=FALSE} |
| 47 | +# 数据读入和处理代码可以自由选择是否展示------ |
| 48 | +# 读取 TSV 数据 |
| 49 | +data <- readr::read_tsv("https://bizard-1301043367.cos.ap-guangzhou.myqcloud.com/TCGA-LIHC.htseq_counts.tsv.gz") |
| 50 | +
|
| 51 | +# 筛选并重塑第一个基因 TSPAN6 的数据(Ensembl ID: ENSG00000000003.13) |
| 52 | +data1 <- data %>% |
| 53 | + filter(Ensembl_ID == "ENSG00000000003.13") %>% |
| 54 | + pivot_longer( |
| 55 | + cols = -Ensembl_ID, |
| 56 | + names_to = "sample", |
| 57 | + values_to = "expression" |
| 58 | + ) %>% |
| 59 | + mutate(var = "var1") # 添加一列来区分变量 |
| 60 | +
|
| 61 | +# 筛选和重塑第二个基因 SCYL3 的数据 (Ensembl ID: ENSG00000000457.12) |
| 62 | +data2 <- data %>% |
| 63 | + filter(Ensembl_ID == "ENSG00000000457.12") %>% |
| 64 | + pivot_longer( |
| 65 | + cols = -Ensembl_ID, |
| 66 | + names_to = "sample", |
| 67 | + values_to = "expression" |
| 68 | + ) %>% |
| 69 | + mutate(var = "var2") # 添加一列来区分变量 |
| 70 | +
|
| 71 | +# 合并两个数据集 |
| 72 | +data12 <- bind_rows(data1, data2) |
| 73 | +
|
| 74 | +# 查看最终的合并数据集 |
| 75 | +head(data12) |
| 76 | +``` |
| 77 | + |
| 78 | +## 可视化 |
| 79 | + |
| 80 | +### 1. 基础绘图 |
| 81 | + |
| 82 | +使用基础函数绘制图片的图注和简介。 |
| 83 | + |
| 84 | +例:\@fig-BasicHist 显示了 TSPAN6基因在不同样本中的表达水平分布。 |
| 85 | + |
| 86 | +```{r fig1BasicHist} |
| 87 | +# 基础绘图代码示例----- |
| 88 | +#| label: fig-BasicHist |
| 89 | +#| fig-cap: "Basic Histogram" |
| 90 | +#| out.width: "95%" |
| 91 | +#| warning: false |
| 92 | +
|
| 93 | +# 基础柱状图 |
| 94 | +p1 <- ggplot(data1, aes(x = expression)) + |
| 95 | + geom_histogram() + |
| 96 | + labs(x = "Gene Expression", y = "Count") |
| 97 | +
|
| 98 | +p1 |
| 99 | +``` |
| 100 | + |
| 101 | +补充基础代码可以扩展的重要参数,并提供对应的绘图代码。 |
| 102 | +例: |
| 103 | +::: callout-tip |
| 104 | +**关键参数: `binwidth` / `bins`** |
| 105 | + |
| 106 | +`binwidth` 或 `bin`参数决定了每个分区包含多少数据。修改这些值会极大地影响直方图的外观和传递的信息。 |
| 107 | +::: |
| 108 | + |
| 109 | +```{r fig2binwidth/bins} |
| 110 | +# 代码示例(以补充参数bins为例)----- |
| 111 | +#| label: fig-bins |
| 112 | +#| fig-cap: "Key Parameters: `binwidth` / `bins`" |
| 113 | +#| fig.width: 8 |
| 114 | +#| fig.heright: 2 |
| 115 | +#| out.width: "95%" |
| 116 | +#| warning: false |
| 117 | +
|
| 118 | +p2_1 <- ggplot(data1, aes(x = expression)) + |
| 119 | + geom_histogram(bins = 30, fill = "skyblue", color = "white") + |
| 120 | + ggtitle("Bins = 30") + |
| 121 | + labs(x = "Gene Expression", y = "Count") |
| 122 | +
|
| 123 | +p2_2 <- ggplot(data1, aes(x = expression)) + |
| 124 | + geom_histogram(bins = 50, fill = "skyblue", color = "white") + |
| 125 | + ggtitle("Bins = 50") + |
| 126 | + labs(x = "Gene Expression", y = "Count") |
| 127 | +
|
| 128 | +cowplot::plot_grid(p2_1, p2_2) |
| 129 | +``` |
| 130 | + |
| 131 | +### 2. 更多进阶图表 (例:密度曲线和柱状图结合) |
| 132 | + |
| 133 | +介绍复杂的可视化类型,例如使用包含更多自定义参数的函数、使用多种基础图表叠加、添加统计学检验等。 |
| 134 | +例:密度曲线可以平滑地表示数据分布。直方图依赖于分位数,而密度曲线则不同,它使用核密度估计(KDE)来平滑分布。这样就能更清楚地了解数据的整体趋势和形状。 |
| 135 | + |
| 136 | +```{r fig3w/Density Curve} |
| 137 | +# 进阶绘图代码示例----- |
| 138 | +#| label: fig-DensityCurve |
| 139 | +#| fig-cap: "Histogram with Density Curve" |
| 140 | +#| out.width: "95%" |
| 141 | +#| warning: false |
| 142 | +
|
| 143 | +p1 <- ggplot(data1, aes(x = expression)) + |
| 144 | + geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "skyblue", color = "white") + |
| 145 | + geom_density(alpha = 0.2, fill = "#FF6666") + |
| 146 | + labs(x = "Gene Expression", y = "Density") |
| 147 | +
|
| 148 | +p1 |
| 149 | +``` |
| 150 | + |
| 151 | +如果你有需要的话可以选择使用`callout-tip`添加对参数的详细描述。 |
| 152 | + |
| 153 | +## 应用 |
| 154 | + |
| 155 | +展示可视化图表在生物医学文献中的实际应用,如果基础图表/进阶图表被广泛应用在各类生物医学文献,则可以选择分别展示。 |
| 156 | + |
| 157 | +例: |
| 158 | +### 1. 基础柱状图的应用 |
| 159 | + |
| 160 | +::: {#fig-HistApplications} |
| 161 | +{fig-alt="HistApp1" fig-align="center" width="60%"} |
| 162 | + |
| 163 | +基础柱状图的应用 |
| 164 | +::: |
| 165 | + |
| 166 | +图 9 显示了 n = 6时人类X染色体和人类Y染色体直方图相对频率的差异。 \[1\] |
| 167 | + |
| 168 | +需补充图片图注和来源文献信息。可视作者意愿补充对该图的代码复现。 |
| 169 | + |
| 170 | +## 参考文献 |
| 171 | + |
| 172 | +例: 1. Costa, A. M., Machado, J. T., & Quelhas, M. D. (2011). Histogram-based DNA analysis for the visualization of chromosome, genome, and species information. *Bioinformatics, 27*(9), 1207–1214. <https://doi.org/10.1093/bioinformatics/btr131> |
| 173 | + |
| 174 | +## 共享者 |
| 175 | + |
| 176 | +- **编辑**: 您的姓名。 |
| 177 | +- **审阅**: 审阅者姓名。 |
0 commit comments