Skip to content

Commit 0787bc6

Browse files
committed
debug template qmd
- add library packages - update figure path
1 parent 47f1f53 commit 0787bc6

File tree

2 files changed

+353
-329
lines changed

2 files changed

+353
-329
lines changed
Lines changed: 177 additions & 161 deletions
Original file line numberDiff line numberDiff line change
@@ -1,161 +1,177 @@
1-
---
2-
title: "Contribution_guidance"
3-
---
4-
5-
6-
对于可视化教程的示例指导
7-
8-
## Example
9-
10-
【Figure. 示例图】
11-
12-
展示以上示例图的标题/图注,并对示例图xy轴或其他标识物的含义解读。
13-
14-
## 环境配置
15-
16-
- 系统要求 跨平台(Linux/MacOS/Windows)
17-
18-
- 编程语言: R
19-
20-
- 依赖资源: (填充可视化教程依赖的R包或其他资源)
21-
22-
```{r packages setup, message=FALSE} #代码示例----- # Installing necessary packages if (!requireNamespace("readr", quietly = TRUE)) { install.packages("readr") } # Loading the libraries library(readr) # Read tsv files}
23-
```
24-
25-
## 数据准备
26-
27-
- 需包含R内置的数据集(如iris、penguins)和生物医学相关数据集(如组学数据、生存信息、临床指标等)。
28-
- 生物医学相关数据集需上传至Bizard腾讯云以便获取插入教程的链接,来自于公共数据集的数据最佳,若由个人/组织提供需确保数据能够被公开。数据集大小需小于1MB。
29-
30-
```{r load data, message=FALSE}
31-
# 数据读入和处理代码可以自由选择是否展示------
32-
# 读取 TSV 数据
33-
data <- readr::read_tsv("https://bizard-1301043367.cos.ap-guangzhou.myqcloud.com/TCGA-LIHC.htseq_counts.tsv.gz")
34-
35-
# 筛选并重塑第一个基因 TSPAN6 的数据(Ensembl ID: ENSG00000000003.13)
36-
data1 <- data %>%
37-
filter(Ensembl_ID == "ENSG00000000003.13") %>%
38-
pivot_longer(
39-
cols = -Ensembl_ID,
40-
names_to = "sample",
41-
values_to = "expression"
42-
) %>%
43-
mutate(var = "var1") # 添加一列来区分变量
44-
45-
# 筛选和重塑第二个基因 SCYL3 的数据 (Ensembl ID: ENSG00000000457.12)
46-
data2 <- data %>%
47-
filter(Ensembl_ID == "ENSG00000000457.12") %>%
48-
pivot_longer(
49-
cols = -Ensembl_ID,
50-
names_to = "sample",
51-
values_to = "expression"
52-
) %>%
53-
mutate(var = "var2") # 添加一列来区分变量
54-
55-
# 合并两个数据集
56-
data12 <- bind_rows(data1, data2)
57-
58-
# 查看最终的合并数据集
59-
head(data12)
60-
```
61-
62-
## 可视化
63-
64-
### 1. 基础绘图
65-
66-
使用基础函数绘制图片的图注和简介。
67-
68-
例:\@fig-BasicHist 显示了 TSPAN6基因在不同样本中的表达水平分布。
69-
70-
```{r fig1BasicHist}
71-
# 基础绘图代码示例-----
72-
#| label: fig-BasicHist
73-
#| fig-cap: "Basic Histogram"
74-
#| out.width: "95%"
75-
#| warning: false
76-
77-
# 基础柱状图
78-
p1 <- ggplot(data1, aes(x = expression)) +
79-
geom_histogram() +
80-
labs(x = "Gene Expression", y = "Count")
81-
82-
p1
83-
```
84-
85-
补充基础代码可以扩展的重要参数,并提供对应的绘图代码。
86-
例:
87-
::: callout-tip
88-
**关键参数: `binwidth` / `bins`**
89-
90-
`binwidth``bin`参数决定了每个分区包含多少数据。修改这些值会极大地影响直方图的外观和传递的信息。
91-
:::
92-
93-
```{r fig2binwidth/bins}
94-
# 代码示例(以补充参数bins为例)-----
95-
#| label: fig-bins
96-
#| fig-cap: "Key Parameters: `binwidth` / `bins`"
97-
#| fig.width: 8
98-
#| fig.heright: 2
99-
#| out.width: "95%"
100-
#| warning: false
101-
102-
p2_1 <- ggplot(data1, aes(x = expression)) +
103-
geom_histogram(bins = 30, fill = "skyblue", color = "white") +
104-
ggtitle("Bins = 30") +
105-
labs(x = "Gene Expression", y = "Count")
106-
107-
p2_2 <- ggplot(data1, aes(x = expression)) +
108-
geom_histogram(bins = 50, fill = "skyblue", color = "white") +
109-
ggtitle("Bins = 50") +
110-
labs(x = "Gene Expression", y = "Count")
111-
112-
cowplot::plot_grid(p2_1, p2_2)
113-
```
114-
115-
### 2. 更多进阶图表 (例:密度曲线和柱状图结合)
116-
117-
介绍复杂的可视化类型,例如使用包含更多自定义参数的函数、使用多种基础图表叠加、添加统计学检验等。
118-
例:密度曲线可以平滑地表示数据分布。直方图依赖于分位数,而密度曲线则不同,它使用核密度估计(KDE)来平滑分布。这样就能更清楚地了解数据的整体趋势和形状。
119-
120-
```{r fig3w/Density Curve}
121-
# 进阶绘图代码示例-----
122-
#| label: fig-DensityCurve
123-
#| fig-cap: "Histogram with Density Curve"
124-
#| out.width: "95%"
125-
#| warning: false
126-
127-
p1 <- ggplot(data1, aes(x = expression)) +
128-
geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "skyblue", color = "white") +
129-
geom_density(alpha = 0.2, fill = "#FF6666") +
130-
labs(x = "Gene Expression", y = "Density")
131-
132-
p1
133-
```
134-
135-
如果你有需要的话可以选择使用`callout-tip`添加对参数的详细描述。
136-
137-
## 应用
138-
139-
展示可视化图表在生物医学文献中的实际应用,如果基础图表/进阶图表被广泛应用在各类生物医学文献,则可以选择分别展示。
140-
141-
例:
142-
### 1. 基础柱状图的应用
143-
144-
::: {#fig-HistApplications}
145-
![](images/Hist_app1.jpeg){fig-alt="HistApp1" fig-align="center" width="60%"}
146-
147-
基础柱状图的应用
148-
:::
149-
150-
图 9 显示了 n = 6时人类X染色体和人类Y染色体直方图相对频率的差异。 \[1\]
151-
152-
需补充图片图注和来源文献信息。可视作者意愿补充对该图的代码复现。
153-
154-
## 参考文献
155-
156-
例: 1. Costa, A. M., Machado, J. T., & Quelhas, M. D. (2011). Histogram-based DNA analysis for the visualization of chromosome, genome, and species information. *Bioinformatics, 27*(9), 1207–1214. <https://doi.org/10.1093/bioinformatics/btr131>
157-
158-
## 共享者
159-
160-
- **编辑**: 您的姓名。
161-
- **审阅**: 审阅者姓名。
1+
---
2+
title: "Contribution_guidance"
3+
---
4+
5+
6+
对于可视化教程的示例指导
7+
8+
## Example
9+
10+
【Figure. 示例图】
11+
12+
展示以上示例图的标题/图注,并对示例图xy轴或其他标识物的含义解读。
13+
14+
## 环境配置
15+
16+
- 系统要求 跨平台(Linux/MacOS/Windows)
17+
18+
- 编程语言: R
19+
20+
- 依赖资源: (填充可视化教程依赖的R包或其他资源)
21+
22+
```{r packages setup, message=FALSE}
23+
#代码示例-----
24+
# Installing necessary packages
25+
if (!requireNamespace("readr", quietly = TRUE)) {
26+
install.packages("readr")
27+
}
28+
if (!requireNamespace("ggplot2", quietly = TRUE)) {
29+
install.packages("ggplot2")
30+
}
31+
if (!requireNamespace("tidyverse", quietly = TRUE)) {
32+
install.packages("tidyverse")
33+
}
34+
35+
# Loading the libraries
36+
library(readr)
37+
library(ggplot2)
38+
library(tidyverse)
39+
```
40+
41+
## 数据准备
42+
43+
- 需包含R内置的数据集(如iris、penguins)和生物医学相关数据集(如组学数据、生存信息、临床指标等)。
44+
- 生物医学相关数据集需上传至Bizard腾讯云以便获取插入教程的链接,来自于公共数据集的数据最佳,若由个人/组织提供需确保数据能够被公开。数据集大小需小于1MB。
45+
46+
```{r load data, message=FALSE}
47+
# 数据读入和处理代码可以自由选择是否展示------
48+
# 读取 TSV 数据
49+
data <- readr::read_tsv("https://bizard-1301043367.cos.ap-guangzhou.myqcloud.com/TCGA-LIHC.htseq_counts.tsv.gz")
50+
51+
# 筛选并重塑第一个基因 TSPAN6 的数据(Ensembl ID: ENSG00000000003.13)
52+
data1 <- data %>%
53+
filter(Ensembl_ID == "ENSG00000000003.13") %>%
54+
pivot_longer(
55+
cols = -Ensembl_ID,
56+
names_to = "sample",
57+
values_to = "expression"
58+
) %>%
59+
mutate(var = "var1") # 添加一列来区分变量
60+
61+
# 筛选和重塑第二个基因 SCYL3 的数据 (Ensembl ID: ENSG00000000457.12)
62+
data2 <- data %>%
63+
filter(Ensembl_ID == "ENSG00000000457.12") %>%
64+
pivot_longer(
65+
cols = -Ensembl_ID,
66+
names_to = "sample",
67+
values_to = "expression"
68+
) %>%
69+
mutate(var = "var2") # 添加一列来区分变量
70+
71+
# 合并两个数据集
72+
data12 <- bind_rows(data1, data2)
73+
74+
# 查看最终的合并数据集
75+
head(data12)
76+
```
77+
78+
## 可视化
79+
80+
### 1. 基础绘图
81+
82+
使用基础函数绘制图片的图注和简介。
83+
84+
例:\@fig-BasicHist 显示了 TSPAN6基因在不同样本中的表达水平分布。
85+
86+
```{r fig1BasicHist}
87+
# 基础绘图代码示例-----
88+
#| label: fig-BasicHist
89+
#| fig-cap: "Basic Histogram"
90+
#| out.width: "95%"
91+
#| warning: false
92+
93+
# 基础柱状图
94+
p1 <- ggplot(data1, aes(x = expression)) +
95+
geom_histogram() +
96+
labs(x = "Gene Expression", y = "Count")
97+
98+
p1
99+
```
100+
101+
补充基础代码可以扩展的重要参数,并提供对应的绘图代码。
102+
例:
103+
::: callout-tip
104+
**关键参数: `binwidth` / `bins`**
105+
106+
`binwidth``bin`参数决定了每个分区包含多少数据。修改这些值会极大地影响直方图的外观和传递的信息。
107+
:::
108+
109+
```{r fig2binwidth/bins}
110+
# 代码示例(以补充参数bins为例)-----
111+
#| label: fig-bins
112+
#| fig-cap: "Key Parameters: `binwidth` / `bins`"
113+
#| fig.width: 8
114+
#| fig.heright: 2
115+
#| out.width: "95%"
116+
#| warning: false
117+
118+
p2_1 <- ggplot(data1, aes(x = expression)) +
119+
geom_histogram(bins = 30, fill = "skyblue", color = "white") +
120+
ggtitle("Bins = 30") +
121+
labs(x = "Gene Expression", y = "Count")
122+
123+
p2_2 <- ggplot(data1, aes(x = expression)) +
124+
geom_histogram(bins = 50, fill = "skyblue", color = "white") +
125+
ggtitle("Bins = 50") +
126+
labs(x = "Gene Expression", y = "Count")
127+
128+
cowplot::plot_grid(p2_1, p2_2)
129+
```
130+
131+
### 2. 更多进阶图表 (例:密度曲线和柱状图结合)
132+
133+
介绍复杂的可视化类型,例如使用包含更多自定义参数的函数、使用多种基础图表叠加、添加统计学检验等。
134+
例:密度曲线可以平滑地表示数据分布。直方图依赖于分位数,而密度曲线则不同,它使用核密度估计(KDE)来平滑分布。这样就能更清楚地了解数据的整体趋势和形状。
135+
136+
```{r fig3w/Density Curve}
137+
# 进阶绘图代码示例-----
138+
#| label: fig-DensityCurve
139+
#| fig-cap: "Histogram with Density Curve"
140+
#| out.width: "95%"
141+
#| warning: false
142+
143+
p1 <- ggplot(data1, aes(x = expression)) +
144+
geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "skyblue", color = "white") +
145+
geom_density(alpha = 0.2, fill = "#FF6666") +
146+
labs(x = "Gene Expression", y = "Density")
147+
148+
p1
149+
```
150+
151+
如果你有需要的话可以选择使用`callout-tip`添加对参数的详细描述。
152+
153+
## 应用
154+
155+
展示可视化图表在生物医学文献中的实际应用,如果基础图表/进阶图表被广泛应用在各类生物医学文献,则可以选择分别展示。
156+
157+
例:
158+
### 1. 基础柱状图的应用
159+
160+
::: {#fig-HistApplications}
161+
![](../images/Histogram_app1.jpeg){fig-alt="HistApp1" fig-align="center" width="60%"}
162+
163+
基础柱状图的应用
164+
:::
165+
166+
图 9 显示了 n = 6时人类X染色体和人类Y染色体直方图相对频率的差异。 \[1\]
167+
168+
需补充图片图注和来源文献信息。可视作者意愿补充对该图的代码复现。
169+
170+
## 参考文献
171+
172+
例: 1. Costa, A. M., Machado, J. T., & Quelhas, M. D. (2011). Histogram-based DNA analysis for the visualization of chromosome, genome, and species information. *Bioinformatics, 27*(9), 1207–1214. <https://doi.org/10.1093/bioinformatics/btr131>
173+
174+
## 共享者
175+
176+
- **编辑**: 您的姓名。
177+
- **审阅**: 审阅者姓名。

0 commit comments

Comments
 (0)