制作这本学习笔记的初衷是归纳整理在医学科研领域利用R语言进行基本数据分析的技巧。计划涵盖包括数据清洗、基本统计分析、高级统计分析在内的内容。并进一步对涉及生物信息学的内容进行总结,汇总Gene Expression Omnibus(GEO)、The Cancer Genome Atlas Program(TCGA)数据库挖掘的代码,并扩展到以Seurat包为基础的单细胞分析流程。此外,也会对Quarto文档——由Posit开发的面相多编程语言的下一代R Markdown——的编写和发布进行简单总结。目前该项目处于最开始的阶段,这本书也处于刚刚搭建好框架的阶段,后续会不断更新和完善,最终实现上述的目标。敬请批评指正!
由于GitHub对文件大小的限制,本书涉及的原始数据文件(data)可通过此链接获取。
R学习资源推荐
在线书籍:
R Graphics Cookbook, 2nd edition:https://r-graphics.org
R for Data Science (2e):https://r4ds.hadley.nz
Quarto Guide:https://quarto.org/docs/guide/
Happy Git and GitHub for the useR:https://happygitwithr.com
Bookdown:https://bookdown.org
论坛/网站:
交互式R语言学习网站:https://www.codecademy.com/learn/learn-r
R CODER:https://r-coder.com
Stack Overflow:https://stackoverflow.com
R-Bloggers:https://www.r-bloggers.com
Posit Cheatsheets:https://posit.co/resources/cheatsheets/
The R Graph Gallery:https://r-graph-gallery.com
Posit Community:https://community.rstudio.com
Citation
@online{2024,
author = {, 杜俊宏},
title = {R语言学习笔记:从数据清洗到高级统计学和生物信息学},
date = {2024-03-10},
url = {https://djhcod.github.io/r-notes/},
langid = {en}
}