网上有很多使用Postfix搭建邮件服务器的文章,但是没有一个能够顺利搭建的,经过多次摧毁重建终于完成了邮件系统,并且可以顺利收发邮件。本文将介绍在Debian系统中使用Postfix+Dovecot+MySQL+roundcube搭建邮件服务器。……
阅读全文
SomaticSignatures包于2015年发表在bioinformatcis杂志上,该杂志为专业的生物信息学杂志,该包旨在通过对肿瘤的single-nucleotide variants(SNP)数据进行分析,找到肿瘤发生发展,演化机制。本文将介绍如何使用snv数据分析得到该肿瘤的特征snp。……
阅读全文
对于站长来说,通过网站seo提高搜索引擎权重,吸引更多的自然用户,对于持续提升网站访问量相当重要,除了提高自身网站的内容质量外,通过模拟搜索并点击搜索引擎不失为一种补充手段……
阅读全文
为了应用R版本更新带来的效率提升和bug消除,我将服务器上的R升级到了最新版本(当前为4.1),然后在使用一些包的时候就会出现……
阅读全文
在做探索性分析时,条形图、箱线图是很好的方法,他可以很好地展示大概的数据结构与分布,由于最近看到有人使用使用雨云图展示数据,图形看起来很美观,有趣,因此这里也就进行了梳理并使用python实现雨云图的绘制。……
阅读全文
在处理单个高维数据时,通过可以通过LDA,PCA,等等方法进行降维处理,但是如果某两个数据来自同一个样本,但是数据类型不同,差距巨大时,怎么办呢……
阅读全文
置信区间(confidence interval,ci)是总体数值在特定可信度下的区间。 它是根据原始观测样本估计的,通常定义为 95%.即通常所说的95%置信区间.……
阅读全文
很多机器学习的方法都要求数据近似正态分布并尽可能接近,而python中用于机器学习的包便是sklearn,其提供包括MinMaxScaler,RobustScaler,StandardScaler和Normalizer在内的多种函数用于机器学习的预处理……
阅读全文
一致性指数(concordance index)或者说c-index是用于评估算法预测效果的参数.定义上是指素有时间点上一致性对的比例……
阅读全文
在python中存储集合数据可以选择多种原生数据类型,包括list,array,tuple,dictionary四种类型.其中list可变性强,可存储任意内容并且可变,应用范围广泛.而在进行科学运算,存储纯数字时,numpy被广泛应用……
阅读全文
聚类分析允许我们找到相似样本或者feature的组,这些对象之间的相关性更强。 常见的用途有包括按照不同的基因表达情况对样本进行分组,或者根据不同样本的分类对基因进行分组等……
阅读全文
在可视化数据时,通常需要在单个图形中绘制多个图形。 例如,如果您想从不同的角度可视化相同的变量(例如>,数字变量的并排直方图和箱线图),则多个图形很有用……
阅读全文