- Python教程
- Python 简介
- Python3 下载安装
- python基础语法
- Python基本数据类型
- Python数据类型转换
- Python解释器
- Python 注释
- Python运算符
- Python数字(Number)
- Python字符串
- Python列表
- Python元组
- Python3 字典
- Python集合
- Python条件控制
- Python循环语句
- Python编程第一步
- Python 推导式
- Python3 迭代器与生成器
- Python函数
- Python lambda(匿名函数)
- Python 装饰器
- Python数据结构
- Python3 模块
- Python __name__ 与 __main__
- Python输入和输出
- Python3 File(文件) 方法
- Python3 OS 文件/目录方法
- Python3 错误和异常
- Python3 面向对象
- Python3 命名空间和作用域
- Python3 标准库概览
- -----高级教程----------
- Python3 正则表达式
- Python CGI编程
- Python MySQL - mysql-connector 驱动
- Python3 MySQL 数据库连接 - PyMySQL 驱动
- Python3 网络编程
- Python3 SMTP发送邮件
- Python3 多线程
- Python3 XML 解析
- Python3 JSON 数据解析
- Python3 日期和时间
- Python MongoDB
- **Python Mongodb 插入文档
- **Python Mongodb 查询文档
- **Python Mongodb 修改文档
- **Python Mongodb 排序
- **Python Mongodb 删除数据
- Python urllib
- Python uWSGI 安装配置
- Python3 pip
- Anaconda 教程
- Python3 operator 模块
- Python math 模块
- Python requests 模块
- Python random 模块
- Python AI 绘画
- Python statistics 模块
- Python hashlib 模块
- Python 量化
- Python pyecharts 模块
- Python selenium 库
- Python 爬虫 - BeautifulSoup
- Python Scrapy 库
- Python Markdown 生成 HTML
- Python sys 模块
- Python Pickle 模块
- Python subprocess 模块
- Python queue 模块
- Python StringIO 模块
- Python logging 模块
- Python datetime 模块
- Python re 模块
- Python csv 模块
- Python threading 模块
- Python asyncio 模块
- Python PyQt
- **Python PyQt 常用组件
- **Python PyQt 布局管理
- **Python PyQt 信号与槽机制
在数据分析和科学计算中,统计学是一个非常重要的工具。
Python 提供了一个内置的 statistics
模块,专门用于处理基本的统计计算。本文将详细介绍 statistics
模块的功能和使用方法,帮助初学者快速掌握如何使用这个模块进行基本的统计分析。
statistics
模块提供了许多常用的统计函数,如均值、中位数、方差、标准差等。
要使用 statistics 函数必须先导入:
查看 statistics 模块中的内容:
>>> import statistics
>>> dir(statistics)
['Counter', 'Decimal', 'Fraction', 'NormalDist', 'StatisticsError', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '_coerce', '_convert', '_exact_ratio', '_fail_neg', '_find_lteq', '_find_rteq', '_isfinite', '_normal_dist_inv_cdf', '_ss', '_sum', 'bisect_left', 'bisect_right', 'erf', 'exp', 'fabs', 'fmean', 'fsum', 'geometric_mean', 'groupby', 'harmonic_mean', 'hypot', 'itemgetter', 'log', 'math', 'mean', 'median', 'median_grouped', 'median_high', 'median_low', 'mode', 'multimode', 'numbers', 'pstdev', 'pvariance', 'quantiles', 'random', 'sqrt', 'stdev', 'tau', 'variance']
常用的统计函数
均值(Mean)
均值是数据集中所有数值的平均值。statistics
模块提供了 mean()
函数来计算均值。
实例
data = [1, 2, 3, 4, 5] mean_value = statistics.mean(data) print("均值:", mean_value)
输出:
中位数(Median)
中位数是将数据集按大小顺序排列后位于中间位置的数值。statistics
模块提供了 median()
函数来计算中位数。
实例
data = [1, 2, 3, 4, 5] median_value = statistics.median(data) print("中位数:", median_value)
输出:
如果数据集的长度为偶数,median()
函数会自动计算中间两个数的平均值。
实例
data = [1, 2, 3, 4] median_value = statistics.median(data) print("中位数:", median_value)
输出:
众数(Mode)
众数是数据集中出现频率最高的数值。statistics
模块提供了 mode()
函数来计算众数。
实例
data = [1, 2, 2, 3, 4] mode_value = statistics.mode(data) print("众数:", mode_value)
输出:
如果数据集中没有重复的数值,mode()
函数会抛出 StatisticsError
异常。
方差(Variance)
方差是衡量数据集中数值离散程度的指标。statistics
模块提供了 variance()
函数来计算方差。
实例
data = [1, 2, 3, 4, 5] variance_value = statistics.variance(data) print("方差:", variance_value)
输出:
标准差(Standard Deviation)
标准差是方差的平方根,用于衡量数据集的离散程度。statistics
模块提供了 stdev()
函数来计算标准差。
实例
data = [1, 2, 3, 4, 5] stdev_value = statistics.stdev(data) print("标准差:", stdev_value)
输出:
调和平均数(Harmonic Mean)
调和平均数是一种特殊的平均数,适用于计算速率等场景。statistics
模块提供了 harmonic_mean()
函数来计算调和平均数。
实例
data = [1, 2, 4] harmonic_mean_value = statistics.harmonic_mean(data) print("调和平均数:", harmonic_mean_value)
输出:
几何平均数(Geometric Mean)
几何平均数是一种用于计算增长率或比例的平均数。statistics
模块提供了 geometric_mean()
函数来计算几何平均数。
实例
data = [1, 2, 4] geometric_mean_value = statistics.geometric_mean(data) print("几何平均数:", geometric_mean_value)
输出:
其他常用函数
中位数低(Median Low)和中位数高(Median High)
statistics
模块还提供了 median_low()
和 median_high()
函数,分别用于计算数据集的中位数低和中位数高。
实例
data = [1, 2, 3, 4] median_low_value = statistics.median_low(data) median_high_value = statistics.median_high(data) print("中位数低:", median_low_value) print("中位数高:", median_high_value)
输出:
分位数(Quantiles)
分位数是将数据集分成若干等份的数值。statistics
模块提供了 quantiles()
函数来计算分位数。
实例
data = [1, 2, 3, 4, 5] quantiles_value = statistics.quantiles(data, n=4) print("四分位数:", quantiles_value)
输出:
math 模块方法
方法 | 描述 |
---|---|
statistics.harmonic_mean() | 计算给定数据集的调和平均值。 |
statistics.mean() | 计算数据集的平均值 |
statistics.median() | 计算数据集的中位数 |
statistics.median_grouped() | 计算给定分组数据集的分组中位数 |
statistics.median_high() | 计算给定数据集的高位中位数 |
statistics.median_low() | 计算给定数据集的低位中位数。 |
statistics.mode() | 算数据集的众数(出现频率最高的值) |
statistics.pstdev() | 计算给定数据集的样本标准偏差 |
statistics.stdev() | 计算数据集的标准差 |
statistics.pvariance() | 计算给定数据集的样本方差 |
statistics.variance() | 计算数据集的方差 |
statistics.quantiles() | 计算数据集的分位数,可指定分位数的数量(默认为四分位数) |