可以使用Python中的相关系数计算函数来衡量不同类型变量之间的相关性。其中,最常用的是Pearson相关系数和Spearman等级相关系数。比如:
import numpy as np
from scipy.stats import pearsonr, spearmanr
# 生成两个不同类型的变量
x = np.random.normal(size=100)
y = np.random.choice(['a', 'b', 'c'], size=100)
# 计算Pearson相关系数
corr_pearson, pval_pearson = pearsonr(x, y)
print("Pearson correlation coefficient:", corr_pearson)
# 计算Spearman等级相关系数
corr_spearman, pval_spearman = spearmanr(x, y)
print("Spearman rank correlation coefficient:", corr_spearman)
其中,pearsonr
函数计算Pearson相关系数,并返回相关系数和p值,spearmanr
函数计算Spearman等级相关系数,并返回相关系数和p值。这两个函数的第一个参数为一维数组,第二个参数为另一个一维数组,两个数组的长度必须相等。在这个例子中,我们生成了一个正态分布的数列和一个随机的字符类型的数列,然后使用pearsonr
和spearmanr
计算了两个数列之间的相关系数。
上一篇:不同类型变量的函数
下一篇:不同类型不写入文件。