图 a | 图 b |
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_excel("PM2.5.xlsx")
# cities 保存所有地区名称,这里仅演示部分数据
cities = ["安吉县", "淳安县", "慈溪市", "杭州市", "湖州市"]
for city in cities:
dfc = ①
dfc.to_excel(city + ".xlsx", index=False) # 输出文件结果示例如图b所示
那么划线部分语句可以是 ;
df = pd.read_excel("PM2.5.xlsx")
# 删除“地区编码”、“指标名称”、“计量单位”数据列
df = df.drop(["指标名称", "地区编码", "计量单位"], axis= ② )
# 同一个地市取 PM2.5 浓度最高的值
dfg = ③
# 按 PM2.5 的值升序排序
dfg = dfg.sort_values("PM2.5", ascending=True)
# 输出排序后的最后五行结果
print(dfg.tail())
图 c | 图 d |
df2 = pd.concat([dfg.head(5), dfg.tail(5)]) # 合并两个对象成为新的 DataFrame 对象
plt.rcParams['font.sans-serif']=['KaiTi','SimHei','FangSong'] # 设置图表字体
plt.figure(figsize=(8,4))
plt.title("部分县市 PM2.5 浓度对比")
plt.xlabel("PM2.5 浓度值")
plt.bar( , df2["PM2.5"], color="orange")
for i in range(len(df2)):
x = df2.index[i]
y =
# text()方法可以绘制数据标签,语法:text(横坐标,纵坐标,显示内容)
plt.text(x, y, '%d' % y)
姓名 | 性别 | 身高(m) | 体重(kg) | 视力 |
王明 | 男 | 1.82 | 70 | 1.2 |
张南 | 女 | 1.72 | 57 | 2.0 |
苏洪涛 | 男 | 1.71 | 68 | 0.8 |
刘婷 | 女 | 1.63 | 51 | 1.2 |