Toggle navigation
Home
Genomics
Python
Linux
Visualization
Statistics
MachineLearning
Reading
Other
About
Home
>
Statistics
> Main text
Think Stats: probability
Tag:
reading
,
statistics
2018-07-15
概率:
被赋予概率的“事情”称为事件(event)。如果E表示一个事件,那么P(E)就表示该事件发生的概率。检测E发生情况的过程就叫做试验(trial)。
频率论(frequentism):用频率来定义概率。如果没有一系列相同的试验,那就不存在概率。
贝叶斯认识论(bayesianism):将概率定义为事件发生的可信度,适用范围更广,但是更主观。
概率法则:1)P(AB)=P(A)P(B),A/B需要相互独立;2)条件概率P(A\∣B)=P(A|B)P(A∣B),A/B不相互独立时;3)由前面归纳一个公式:P(AB)=P(A)P(B∣A),不论A/B独立与否都适用。
蒙提霍尔问题:假设你正在参加一个游戏节目,你被要求在三扇门中选择一扇:其中一扇后面有一辆车;其余两扇后面则是山羊。你选择了一道门,假设是一号门,然后知道门后面有什么的主持人,开启了另一扇后面有山羊的门,假设是三号门。他然后问你:“你想选择二号门吗?”转换你的选择对你来说是一种优势吗? 答案是:转换选择能够提升获胜概率。
二项分布:n是试验总次数,p是成功的概率,k是成功的次数。
连胜:不存在连胜或者连败。
聚类错觉(clustering illusion):指看上去好像有某种特点的聚类实际上是随机的。可通过蒙特卡洛模拟,看随机情况产生类似聚类的概率。
贝叶斯定理(Bayes’s theorem)描述的是两个事件的条件概率之间的关系。条件概率通常写成P(A|B),表示的是在事件B已发生的情况下事件A发生的概率。P(H\∣E)=P(H)P(E\∣H)/P(E):在看到E之后H的概率P(H|E),等于看到该证据前H的概率P(H),乘以假设H为真的情况下看到该证据的概率P(E|H)与在任何情况下看到该证据的概率P(E)的比值P(E|H)/P(E)。
术语:
贝叶斯认识论(Bayesianism) 一种对概率更泛化的解释,用概率表示可信的程度。
变异系数(coefficient of variation) 度量数据分散程度的统计量,按集中趋势归一化,用于比较不同均值的分布。
事件(event) 按一定概率发生的事情。
失败(failure) 事件没有发生的试验。
频率论(frequentism) 对概率的一种严格解读,认为概率只能用于一系列完全相同的试验。
独立(independent) 若两个事件之间相互没有影响,就称这两个事件是独立的。
证据的似然值(likelihood of the evidence) 贝叶斯定理中的一个概念,表示假设成立的情况下看到该证据的概率。
蒙特卡罗模拟(Monte Carlo simulation) 通过模拟随机过程计算概率的方法(详见http://wikipedia.org/wiki/Monte_Carlo_method)。
归一化常量(normalizing constant) 贝叶斯定理中的分母,用于将计算结果归一化为概率。
后验(posterior) 贝叶斯更新后计算出的概率。
先验(prior) 贝叶斯更新前计算出的概率。
成功(success) 事件发生了的试验。
试验(trial) 对一系列事件是否可能发生的尝试。
更新(update)** 用数据修改概率的过程。
If you link this blog, please refer to this page, thanks!
Post link:
https://tsinghua-gongjing.github.io/posts/ThinkStats_probability.html
Previous:
kaggle
Next:
聚类算法
Please enable JavaScript to view the
comments powered by Disqus.
Category
Genomics
Python
Linux
Visualization
Statistics
MachineLearning
Reading
Other
Tags
Latest articles
AI在乳腺癌检测中的应用
基于三代测序数据预测m6A修饰位点
使用迁移学习对scRNA数据降噪
深度学习助力RNA可变剪切的预测
Excel常见用法
Word常见用法
Basic operations on matrix
LSTM
Run jobs on GPU server
稀疏编码
Links
ZhangLab
,
RISE database
,
THU life
,
THU info
Data analysis:
pandas
,
numpy
,
scipy
ML/DL:
sklearn
,
sklearn(中文)
,
pytorch
Visualization:
seaborn
,
matplotlib
,
gallery
Github:
me