分类 技术 中的文章

使用PYQT6设计带GUI的百度seo点击软件

对于站长来说,通过网站seo提高搜索引擎权重,吸引更多的自然用户,对于持续提升网站访问量相当重要,除了提高自身网站的内容欧冠你质量外,通过模拟搜索并点击搜索引擎不失为一种补充手段,通过对比现有的各种百度,搜狗 点击软件后,设计一款自己的能够自由配置的seo点击软件显得非常有挑战且有……

阅读全文

R如何安装老版本R的包

为什么要安装老版本的包 为了应用R版本更新带来的效率提升和bug消除,我将服务器上的R升级到了最新版本(当前为4.1),然后在使用一些包的时候就会出现 Warning message: “package ‘clusterProfiler’ is not available for this version of R 或者 Warning message: “package ‘EnrichmentBrowser’……

阅读全文

python绘制雨云图(Raincloud)

在做探索性分析时,条形图、箱线图是很好的方法,他可以很好地展示大概的数据结构与分布,由于最近看到有人使用使用雨云图展示数据,图形看起来很美观,有趣,因此这里也就进行了梳理并使用python实现雨云图的绘制。 介绍 雨云图其实是一种混合图,由四部分组成,它们分别是 violin plot(云)、bo……

阅读全文

典型相关分析介绍及python实现

在处理单个高维数据时,通过可以通过LDA,PCA,等等方法进行降维处理,但是如果某两个数据来自同一个样本,但是数据类型不同,差距巨大时,怎么办呢?这个时候就是典型相关性分析(Canonical Correlation Analysis,CCA)的应用场景.CCA允许我们同时从两套数据分析.典型的应用场景……

阅读全文

matplotlib画图时进行颜色填充

在python中matplotlib进行绘图时,有时为了图形的美观,需要在其上方或者下方进行颜色填充,这时需要采用的函数是fill_between,其中参数y2决定第二条线,如果是向上还是向下填充,下面具体展示: 数据生成 我们这里以正弦函数为例 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns n = 1024……

阅读全文

使用bootstrapping计算置信区间

概念 置信区间(confidence interval,ci)是总体数值在特定可信度下的区间。 它是根据原始观测样本估计的,通常定义为 95%.即通常所说的95%置信区间. 为何使用置信区间 一般情况下,获得的样本都是抽样得到的,总体是未知的,这样从样本中获得的数据没法直接反映总体情况,为了……

阅读全文

预处理方法Scale,Standardize,Normalize的选择

很多机器学习的方法都要求数据近似正态分布并尽可能接近,而python中用于机器学习的包便是sklearn,其提供包括MinMaxScaler,RobustScaler,StandardScaler和Normalizer在内的多种函数用于机器学习的预处理,那么这些方法应该如何选择呢……

阅读全文

c-index及其在生存分析中的应用

一致性指数(concordance index)或者说c-index是用于评估算法预测效果的参数.定义上是指素有时间点上一致性对的比例.该参数在生物学上比如癌症预测上具有重要意义,可以用来评估癌症生存期预测的好坏.在python中可以使用lifelines包下的工具的concord……

阅读全文