Skip to content

testaibot/CellPi

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

91 Commits
 
 
 
 
 
 

Repository files navigation

CellPi

Under development, not ready for a general use, seem to perform well on gold-standard datasets English description and license will be uploaded with the first release

The main idea of this pipeline is to take best-practice scRNA-seq data preprocessind tools and integrate them in a fully unsupervised pipeline "from GSE id to cluster's markers"

GSE_id->read counts step will be based on the mixture of https://github.com/hms-dbmi/dropEst and https://github.com/CGATOxford/UMI-tools

Инструкция:
1) Установить пакеты через installer.Rmd
2) Загрузить все необходимые функции из Counts2Exprs.Pmd
3) Загрузить данные ориентируясь на примеры из Load_data.Rmd
4) Запустить основной анализ по примерам из Simple_Analyse.md
5) Если функция seur_find_multiplication выдаёт NULL, значит разбить кластер на суб-кластеры не удалось

Аннотация исходной матрицы клеток должна иметь формат: <тип_клетки>.<номер_клетки> 
( "d7.122" "d0.484" "d2.39"  "d2.213")
Для расстановки номеров можно воспользоваться функцией types2names, 
пример использования которой можно найти в модуле Load_data.Rds в функции load_sce

Исходная аннотация клеток не используется при кластеризации но может быть полезна 
для оценки качества итогового разбиения

Переменная окружения "R_MAX_NUM_DLLS 255" может понадобиться при запуске в Windows, если возникает ошибка 
"превышение максимального числа загруженных библиотек"