day02-统计数据

numpy统计学

1.求平均值[数组名.mean()/np.mean(数组名)]

m1 = np.arange(20).reshape((4,5))

m1.mean()
#9.5

若想要求某一维的平均值,设置axis参数,多维数组元素指定:

在这里插入图片描述

  • axis = 0,将从上往下计算。
  • axis = 1,将从左往右计算
  • 无axis参数,默认将所有元素相加除以个数。
m1 = np.arange(20).reshape((4,5))

m1.mean(axis = 0)  #得到每列的平均值的一维数组
#array([7.5,8.5,9.5,10.5,11.5])



m1.mean(axis = 1)  #得到每行的平均值的一维数组
#array([ 2.,  7., 12., 17.])

2.中位数[np.median(数组名)]

又称中位数、中值

是按顺序排列后的一组数组中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值

  • 平均数:是一个‘虚拟’的数,是通过计算得到的它不是数据中的原始数据。.

  • 中位数:是一个不完全"虚拟"的数。

  • 平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”

  • 中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的"中等水平"

ar1 = np.array([1,3,5,6,8])
np.median(ar1)

out: 5.0

ar1 = np.array([1,3,5,6,8,9])
np.median(ar1)

out: 5.5

3.求标准差[np.std(数组名)]

在概率统计中最常使用作为统计分布程度上的测量,是反映一组数据离散程度最常用的一种量化形式,是表示精确度的重要指标

  • 标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。

简单来说,标准差是一组数据平均值分散程度的一种度量。

  • 一个较大的标准差,代表大部分数值和其平均值之间差异较大;
  • 一个较小的标准差,代表这些数值较接近平均值。`
a = np.array([95,85,75,65,55,45])
b = np.array([73,72,71,69,68,67])

np.std(a)
np.std(b)

#17.07825127659933
#2.160246899469287

标准差的计算公式:

import math
# 按步骤计算下标准差
(a - np.mean(a))**2)
math.sqrt(np.sum(((a - np.mean(a))**2)/a.size))

标准差应用于投资上,可作为量度回报稳定性的指标。

标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。

相反,标准差数值越小,代表回报较为稳定,风险亦较小。

4.方差[数组名.var()]

衡量随机变量或一组数据时离散程度的度量

a = np.array([95,85,75,65,55,45])
b = np.array([73,72,71,69,68,67])
print('A组的方差为:',a.var())
print('B组的方差为:',b.var())
A组的方差为: 291.6666666666667
B组的方差为: 4.666666666666667

5.求最大值[数组名.max()/np.max(数组名)]

m1 = np.array(
 [[ 0  1  2  3  4]
  [ 5  6  7  8  9]
  [10 11 12 13 14]
  [15 16 17 18 19]]
)

m1.max()
np.max(m1)

m1.max(axis=1)
np.max(m1,axis=1)

#axis=0,从上往下查找: [15 16 17 18 19]
#axis=1,从左往右查找 [ 4  9 14 19]

6.求最小值[数组名.min()/np.min(数组名)]

m1.min()
print('axis=0,从上往下查找:',m1.min(axis=0))
print('axis=1,从左往右查找',m1.min(axis=1))
0
axis=0,从上往下查找: [0 1 2 3 4]
axis=1,从左往右查找 [ 0  5 10 15]

7.求和[数组名.sum()/np.sum(数组名)]

print(m1)
print(np.sum(m1))
print('axis=0,从上往下查找:',np.sum(m1,axis=0))
print('axis=1,从左往右查找',np.sum(m1,axis=1))
190
axis=0,从上往下查找: [30 34 38 42 46]
axis=1,从左往右查找 [10 35 60 85]

8.加权平均值[np.average(数组名)]

即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数

格式:

numpy.average(a, axis=None, weights=None, returned=False)

weights: 数组,可选

与 a 中的值关联的权重数组。 a 中的每个值都根据其关联的权重对平均值做出贡献。权重数组可以是一维的(在这种情况下,它的长度必须是沿给定轴的 a 的大小)或与 a 具有相同的形状。如果 weights=None,则假定 a 中的所有数据的权重等于 1。一维计算是:

avg = sum(a * weights) / sum(weights)

对权重的唯一限制是 sum(weights) 不能为 0. `

average_a1 = [20,30,50]

print(np.average(average_a1))
print(np.mean(average_a1))

实列:计算学科综合成绩

使用“示例—权重已知”中的数据,我们对比两位学生的考试成绩

姓名平时测验期中考试期末考试
小明809095
小刚959080

学校规定的学科综合成绩的计算方式是:

平时测验占比期中考试占比期末考试占比
20%30%50%

要求 :比较谁的综合成绩更好

xiaoming = np.array([80,90,95])
xiaogang = np.array([95,90,80])
# 权重:

weights = np.array([0.2,0.3,0.5])
# 分别计算小明和小刚的平均值
print(np.mean(xiaoming))
print(np.mean(xiaogang))

# 分别计算小明和小刚的加权平均值
print(np.average(xiaoming,weights=weights))
print(np.average(xiaogang,weights=weights))
# 对比得到结果
88.33333333333333
88.33333333333333
90.5
86.0

变异系数:原始数据标准差与原始数据平均数的比

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/771780.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VIM介绍

VIM(Vi IMproved)是一种高度可配置的文本编辑器,用于有效地创建和更改任何类型的文本。它是从 vi 编辑器发展而来的,后者最初是 UNIX 系统上的一个文本编辑器。VIM 以其键盘驱动的界面和强大的文本处理能力而闻名,是许…

拼接各列内容再分组统计

某个表格的第1列是人名,后面多列是此人某次采购的产品,一个人一次可以采购多个同样的产品,也可以多次采购。 ABCD1JohnAppleAppleOrange2PaulGrape3JohnPear4SteveLycheeGrape5JessicaApple 需要整理成交叉表,上表头是产品&…

透过 Go 语言探索 Linux 网络通信的本质

大家好,我是码农先森。 前言 各种编程语言百花齐放、百家争鸣,但是 “万变不离其中”。对于网络通信而言,每一种编程语言的实现方式都不一样;但其实,调用的底层逻辑都是一样的。linux 系统底层向上提供了统一的 Sock…

openlayers中区域掩膜的实现

概述 在前文完成了mapboxGL中区域掩膜的实现。近日有人问到说在openlayers中如何实现,本文就带大家看看如何在openlayers中实现区域掩膜。 实现效果 实现 1. 实现思路 在地图容器中添加一个canvas,设置其在map之上;监听map的postrender事…

Vue2-Vue Router前端路由实现思路

1.路由是什么? Router路由器:数据包转发设备,路由器通过转发数据包(数据分组)来实现网络互连 Route路由:数据分组从源到目的地时,决定端到端路径的网络范围的进程 | - 网络层 Distribute分发…

时空预测+特征分解!高性能!EMD-Transformer和Transformer多变量交通流量时空预测对比

时空预测特征分解!高性能!EMD-Transformer和Transformer多变量交通流量时空预测对比 目录 时空预测特征分解!高性能!EMD-Transformer和Transformer多变量交通流量时空预测对比效果一览基本介绍程序设计参考资料 效果一览 基本介绍…

顶级10大AI测试工具

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

Oracle Database 23ai新特性:DB_DEVELOPER_ROLE角色

角色介绍 从 Oracle Database 23ai 开始,新角色“DB_DEVELOPER_ROLE”允许管理员快速分配开发人员为 Oracle 数据库设计、构建和部署应用程序所需的所有必要权限。(包括构建数据模型所需的系统权限以及监视和调试应用程序所需的对象权限)。通…

【数据结构】02.顺序表

一、顺序表的概念与结构 1.1线性表 线性表(linear list)是n个具有相同特性的数据元素的有限序列。线性表是⼀种在实际中广泛使用的数据结构,常见的线性表:顺序表、链表、栈、队列、字符串… 线性表在逻辑上是线性结构&#xff0…

上位机图像处理和嵌入式模块部署(mcu项目1:实现协议)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 这种mcu的嵌入式模块理论上都是私有协议,因为上位机和下位机都是自己开发的,所以只需要自己保证上、下位机可以通讯上&…

ELK 企业实战7

ELKkafkafilebeat企业内部日志分析系统 1、组件介绍 1、Elasticsearch: 是一个基于Lucene的搜索服务器。提供搜集、分析、存储数据三大功能。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的&#xff…

[数据集][目标检测]刀具匕首持刀检测数据集VOC+YOLO格式8810张1类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):8810 标注数量(xml文件个数):8810 标注数量(txt文件个数):8810 标注…

sql查询练习

1.表的结构 课程表:课程编号cid,课程名称canme,老师tid, 教师表:教师tid,教师姓名tname 分数表:学生student_sid,课程 cours_id,,分数score 学生表&#xff…

阶段三:项目开发---大数据系统基础环境准备:任务1:准备系统运行的先决条件

任务描述 知识点: 大数据基础环境准备 重 点: SSH免密码连接 安装配置JDK 安装配置Scala 难 点: 无 内 容: 项目开发测试环境为分布式集群环境,在当前项目中使用多台基于CentOS 64bit 的虚拟机来模拟生产…

在Ubuntu中使用ROS搭建PX4 Gazebo 模拟飞行 四旋翼 固定翼

综合了网上很多教程以及踩了很多坑总结下来的教程 Ubuntu安装 此处不在详细说明,网上可随处搜到 ROS安装 感谢鱼香ROS大佬提供一键安装脚本 wget http://fishros.com/install -O fishros && sudo bash fishros 接下来按顺序按 1 1 2 3 1 再次运行 w…

关于 lvds 屏幕的一些知识

网上的截图: lvds的 通道。 lvds 的协议 关于 sync 模式与 de 模式: ------------------------------------------------------------------------------------------------------------------ 芯片的数据手册的看法。 这个手册 ,就指明了…

鸿蒙开发设备管理:【@ohos.update (升级)】

升级 说明: 本模块首批接口从API version 6开始支持。后续版本的新增接口,采用上角标单独标记接口的起始版本。开发前请熟悉鸿蒙开发指导文档:gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 升级范围&…

协程调度模块

什么是协程和协程调度? 基本概念 协程 协程是一种比线程更轻量级的并发编程结构,它允许在函数执行过程中暂停和恢复执行状态,从而实现非阻塞式编程。协程又被称为用户级线程,这是由于协程包括上下文切换在内的全部执行逻辑都是…

二分查找及其变种

一、概念 二分查找算法(Binary Search Algorithm)是一种在有序数组中查找特定元素的高效搜索方法。 其基本思想是将目标值与数组中间的元素进行比较,如果目标值等于中间元素,则查找成功;如果目标值小于中间元素&…

Apache SeaTunnel社区首位学生Committer诞生!

采访对象 | 陈炳烨 采访人&编辑 | Debra Chen Apache SeaTunnel社区第一位学生Committer就此诞生!这位来自西安交通大学软件工程专业的同学从较为简单的文档修改工作,逐步深入到代码层面,到最后独立负责开发模块,为Apache S…