必赢亚洲手机app下载


奇虎360解决勒索蠕虫病毒

下三个编制程序五年

用python绘制直方图

事实上,学习数据解析,excel能够完成绝超越50%的做事,只是科目中@tiger是用python做的,而且近期和好也在学习编制程序,所以就挑衅一下新东西,学学用python做作业,多谢@余欣
的学科,让自个儿三个python小白也能上手做作业,那些作业是在那两篇教程的功底上完结的:

  1. 致Python初学者们 –
    Anaconda入门使用指南
  2. 左边程序员,右手诗人:你必须会的Jupyter
    Notebook

上边开始做作业

1. 下载数据集到地面

总括三个文件,weight.txt 和 AirPassengers.csv

weight.txt
中富含了一批体重数据,AirPassengers.csv中涵盖了日期和对应的司乘职员人数,两列数据。本次的任务便是求那两组数据的均值和方差,并画出直方图。

2. 建立Jupyter Notebook

把Jupyter Notebook安装好后,在巅峰内运营

jupyter notebook

浏览器会活动打开一个页面

图片 1

那边能够看来电脑的地头文件,在里面找到放置上一步数据文件的文件夹,并在这一个目录下,点击右上角的“New”,建立1个新的notebook

图片 2

3. 导入数据,总括和输出
#在输入窗口下输入:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
weight_data = pd.read_table('weight.txt')
weight_data.shape

#按Shift+Enter,就会出现结果

#求均值

weight_data['weight'].mean()

50.7

#求方差

weight_data['weight'].var()

39.27594936708859

fig = plt.figure()
x = weight_data['weight']
ax = fig.add_subplot(111)
numBins = 20
ax.hist(x,numBins,color='blue',alpha=0.8,rwidth=0,9)
plt.grid(true)#
plt.title(u'weight')
plt.show()

图片 3

#另一组数据,由于是csv格式,所以导入数据的代码略有不同

Passengers_data = pd.read_csv('AirPassengers.csv')

Passengers_data.shape

(144, 2)

Passengers_data['NumPassengers'].mean()

280.2986111111111

Passengers_data['NumPassengers'].var()

14391.917200854701

fig = plt.figure()
x = Passengers_data['NumPassengers']
ax = fig.add_subplot(111)
numBins = 20
ax.hist(x,numBins,color='blue',alpha=0.8,rwidth=0.9)
plt.title(u'Passengers')
plt.show()

图片 4

4. 试着讲述数据集的表征

此地首先个数据集是体重,超越二分一都在45-55以内,而有八个八九不离十70,全部上,数据量十分的小,可是依旧接近正态分布的。

其次个有点挠头,是从49年 到
60年各种月的乘客数量,那么些数据若是用直方图体现,表明的新闻正是旅客数量的分布。能够看出来,从大气聚齐在350-400中间,400之上的数量很少,而11年来,唯有三个月的司乘人士数量超越了600。

对于那组数据,因为有时光维度,所以遵照月份做三个叠加的柱状图,或许以时日为横轴,以人口为纵轴做一个曲线,仿佛更能见到变化的规律所在。可是本次的功课是直方图,如何是好柱状图和二维曲线,留给下二次再说吧。

相关文章

No Comments, Be The First!
近期评论
    功能
    网站地图xml地图