全网最全pandas资源整理(基础易错题)

举报
yk 坤帝 发表于 2021/07/15 00:35:00 2021/07/15
【摘要】 个人公众号 yk 坤帝 需要答案的可以私聊 # (1)读取酒店数据_2021_04_09.xlsx # (2)查看“评分”的格式,并分别进行升序和降序排序 # (3)对酒店按照价格进行排名,计算“油尖旺”地区的均价。 # (4)对酒店数据进行描述性统计,并求所有价格的均值方差,最大最小值,中值。 # (5)计算评分和价格之间的的相关系数,协方差 # (6)按照评分降序...

个人公众号 yk 坤帝
需要答案的可以私聊

# (1)读取酒店数据_2021_04_09.xlsx
# (2)查看“评分”的格式,并分别进行升序和降序排序
# (3)对酒店按照价格进行排名,计算“油尖旺”地区的均价。
# (4)对酒店数据进行描述性统计,并求所有价格的均值方差,最大最小值,中值。
# (5)计算评分和价格之间的的相关系数,协方差
# (6)按照评分降序排序,评分相同时按价格升序排序。
# (7)计算一下,评分小于3分的酒店数量和占比。
# (8)计算一下,酒店评分大于等于4分的酒店的价格均值。
# (9)计算出每个地区的酒店占总酒店数量的比例。
# (10)找出酒店评分人数排名前20的酒店,并计算他们的价格均值。
# (11)查看酒店分布的类型数量和地区数量,并统计各个类型和地区包含的酒店数量。
# (12)用数据透视表,计算每个类型的酒店的评分人数总数量。
# (13)用数据透视表,计算每个类型的酒店价格的均值和标准差
# (14)用数据透视表,计算每个地区酒店价格和评分的最大值和最小值
# (15)用数据透视表,计算每个地区和类型的酒店的评分的均值和标准差
# (16)选取上述题目中的五个题目(或部分相关数据),进行绘图可视化操作。

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

1.pandas查看某列字段类型

df[''].dtype

  
 
  • 1

2.pandas的数据按照升序排序

df.sort_values(by ='')

  
 
  • 1

3.pandas的数据按照降序排序

df.sort_values(by ='',ascending = False)

  
 
  • 1

4.pandas两列数据的相关系数,协方差

相关系数 df[['','']].corr()
协方差 df[['','']].cov()

  
 
  • 1
  • 2

5.按照某一列降序排序,数据相同时按另一列升序排序

df.sort_values(by = ['',''],ascending = (False,True))

  
 
  • 1

6.Pandas透视表(pivot_table)

pd.pivot_table(df,index='',values = '',aggfunc = '')

  
 
  • 1

数据在资源里,应该可以免费下载
答案可以现在评论区讨论,答案不唯一

个人公众号 yk 坤帝
需要答案的可以私聊

文章来源: blog.csdn.net,作者:yk 坤帝,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/qq_45803923/article/details/116206517

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。