StatQuest——生物信息相关原理的入门系列(一)

想学生信原理但是数学不好?不想看一串串公式也想明白各种分析的原理?StatQuest会是一个非常不错的选择!

StatQuest: 该系列视频是北卡罗来纳大学教堂山分校制作的(相当牛的学校了)。视频长度不长,基本上都是十几分钟,而且语速也不快,如果还是觉得有困难可以调整语速或打开字幕,一般6级过了的人基本上都没什么问题。视频链接都是youtube上的(可能需要fq?)。这是我看过的最好的视频系列(没有之一),主要是因为他把非常难懂的东西,用很简单的例子让你明白。这是很不容易的(说“人话”,适合初学者看)。有的视频看一遍就可以完全理解了,有的视频(比如某个算法的例子)看两遍也能理解个90%以上了。之前因为对于生信的原理没有关注,这个系列的视频可以作为很好的入门教程来看。
“墙裂”推荐!!

这个系列的笔记我不打算用截屏+翻译这样的方式来记录了,因为视频里展示的PPT很多都是动画,如果截屏的话要上百张的图片,有点本末倒置了。我认为如果想学,就要自己亲自去看一遍视频(视频又不长,十几分钟就当消遣了,还练习了英语)。

推荐视频:

以下推荐的视频都是我亲自看过的,而且最好按顺序观看,因为都是在前一个视频的基础上进行讲解的:
(1)初学者不理解RNA-seq测序到底是怎么测的?看文献也找不到头绪?读综述太抽象?这个视频讲解的非常简单明了:
StatQuest: A gentle introduction to RNA-seq
(2)是不是不太理解为什么RNA-seq里生物学重复比技术重复更重要?你知道生物学重复/技术重复/mix重复对结果的影响吗?下面这个视频用了很简单的例子来解释了这个困惑:
StatQuest: RNA-seq - the problem with technical replicates
(3)你也许知道RPKM, FPKM, TPM都是什么,但是你知道其中的计算过程吗?也许你知道哪一个方法更好,但是你知道背后的原因么?这里你只需10分钟的时间就可以弄明白:
StatQuest: RPKM, FPKM and TPM, Clearly Explained!!!
(4)edgeR是一个很常用的RNA-seq分析软件,但是你知道它是怎么进行normalization的吗?你知道edgeR是如何计算scaling factor的吗?可能很多教程里会用一大堆公式来说明,但是如果你数学不好(像我一样),估计看都看不下去。可是你又想了解一下怎么办?看视频:
StatQuest: edgeR, part 1, Library Normalization
(5)同样的,DESeq2你肯定不陌生,但是你知道它是怎么normalize你的counts吗?不用看很多很长的公式,你也可以理解其中的原理(这个视频看一遍可能会跟不上,看个两三遍就能明白了~):
StatQuest: DESeq2, part 1, Library Normalization
(6)在我们分析RNA-seq或其他的测序数据过程里,经常会看到p-value这个值。我们通常还会利用p-value挑选变化显著的基因,比如p-value<0.05或者p-value<0.01。但是当你说p<0.05/p<0.01代表变化很显著的时候,你知道它真正的意思是什么吗?一个10分钟的小视频为你解释p-value到底是什么:
StatQuest: p-values: What they are and how to interpret them
(7)知道了p-value代表的真正含义以后,你知道p-value分几种吗?它是怎么被计算出来的呢?你知道p-value由哪几个部分组成吗?
StatQuest: How to calculate p-values
(8)学习了p-value以后,这有一个新名词(不新了,只是我不知道而已。。。),叫p-hacking。你了解什么是p-hacking吗?知道它是怎么产生的吗?p-hacking在我们的实验分析中是很不好的,那么如何避免它?
StatQuest: p-hacking: What it is and how to avoid it!
(9)上面学习了p-hacking以后,如何能减少假阳性的存在呢(事实不显著,但是p<0.05)?FDR可以帮助我们做这件事情。
StatQuest: False Discovery Rates, FDR, clearly explained

以上的视频笔记,我是用OneNote记录的,以下就是笔记内容,有的视频我只记录了一两句话,有的视频我就记录的多一些。想系统学习的同学还需要自己去看视频。毕竟每人的知识点掌握的不一样,我的查漏补缺不一定适合每个人。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容

  • 刘小泽写于19.4.27聚类分析的基础就是PCA,掌握这个对以后那么这次就先跟着statquest来学习一下,视频...
    刘小泽阅读 1,784评论 1 10
  • 前言 ROC和AUC,作为一个重要的分类器的评价指标,起初是为了增进军事雷达的敌我侦测能力而发展的。举例而言:雷达...
    安哥生个信阅读 1,262评论 0 1
  • Go 语言教程 Go 是一个开源的编程语言,它能让构造简单、可靠且高效的软件变得容易。 Go是从2007年末由Ro...
    雪域迷影阅读 350评论 0 0
  • 前言 K-Means 是聚类算法中的最常用的一种,算法最大的特点是简单,好理解,运算速度快,但是只能应用于连续型的...
    安哥生个信阅读 2,275评论 2 8
  • 本文翻译自原文地址:Animation deep dive[https://medium.com/flutter/...
    whqfor阅读 1,021评论 0 1