充值活动已开启,快来参与吧 关闭充值活动
当前位置:手动组卷 /高中信息技术 /按知识点
选择知识点
最新上传 最多使用
  • 1. (2023高一下·仙游期中) 下图为统计局网站公布的中国创新指数变化情况图表。这种呈现数据的形式称为(   )

    A . 虚拟化形式 B . 可视化形式 C . 多样化形式 D . 文字化形式
  • 1. (2023高一下·海安期中) 气象部门想绘制某地区近十年来降雨量随时间逐年变化的图表,以推测未来若干年降雨量的变化趋势,下列最适合选用的图表类型是(    )
    A . 柱形图 B . 饼图 C . 散点图 D . 折线图
  • 1. (2023高二下·浙江月考) 小吴收集了2020年之前历届世界杯数据并进行汇总,制作了“历年世界杯各国数据.xlsx文件,具体内容结构如图a(部分数据)所示。

    图 a

    1. (1) 从图a中可看到土耳其的比赛场数为“20”,与胜、平、负场数之和不相等,该问题属于     
    2. (2) 现要找出非洲总进球数前 3 名的国家(不考虑并列情况),核心代码如下:

      df = pd.read_excel("历年世界杯各国数据.xlsx")

      print(df)

      则方框处可选代码是 (按数据处理先后顺序填序号)。

      ①df = df.groupby("所属大洲")

      ②df = df[:3]

      ③df = df.sort_values("进球数", ascending=False)

      ④df = df[df["所属大洲"]=="非洲"]

      ⑤df = df["非洲"]

    3. (3) 小吴收集了英格兰在2022年世界杯中的5场比赛的数据并存储在文件“英格兰.xlsx”中,结构如图b所示。现编写程序,将数据处理后合并到“历年世界杯各国数据.xlsx”文件中,核代码如下,请在划线处填写合适的代码。

      图 b

      df1 = pd.read_excel("历年世界杯各国数据.xlsx")

      df2 = pd.read_excel("英格兰.xlsx")

      for i in range(len(df1)):

      if df1.at[i, "球队"]=="英格兰":

      break

      for line in df2.values:

          goal = line[2]; lost = line[3]

          if goal>lost:

              df1.at[index, "胜"] += 1

          elif

              goal<lost:

              df1.at[index, "负"] += 1

          else:

              df1.at[index, "平"] += 1

             

      df1.at[index, "进球数"] += goal

      df1.at[index, "失球数"] += lost

      df1.at[index, "净胜球"] += goal - lost

      df1.to_excel("(new)历年世界杯各国数据.xlsx", index=False) #去除索引保存文件

    4. (4) 读入文件“(new)历年世界杯各国数据.xlsx”并制作了如图c所示的柱形图,核心代码如下。若要更换图表类型,则应修改 (单选,填序号) 处的代码

      图 c

      df1 = pd.read_excel("(new)历年世界杯各国数据.xlsx")

      df1 = df1.sort_values("进球数",ascending=False)      #①

      df1 = df1[df1["所属大洲"]=="南美洲"]

      df1 = df1[["球队", "进球数"]]                                       #②

      df1.plot.bar(x="球队", y="进球数")                             #③

      plt.show()                                                                         #④

  • 1. (2023·嘉兴模拟) 某同学收集了部分城市2022年4月每天24小时空气质量数据,按日分别保存在CSV文件中,部分文件如图a所示。数据格式如图b所示。请回答下列问题:

    1. (1) 定义函数avg,功能是读取某天的数据文件,计算该天空气质量指数(AQI)的平均值并返回,代码如下。请在划线①处应填入的合适的代码

      def avg(filename):

          df=pd.read_csv(filename)

          df1=df[df.columns[2:]] #    取类型及其后的所有列

          g=df1.groupby(   ①   ,as_index=False).mean()

          return    ②  

      划线②处应填入的代码为(单选,填字母)。

      A.df[df.类型=='AQI']     B.df1.AQI      C.g.AQI D.g[g.类型=='AQI']

    2. (2) 统计本月各城市空气质量最长连续优、良的天数(按照环境空气质量标准,空气污染指数AQI≤50为优级,AQI≤100为良好),代码如下,绘制的图表如图c所示。请在划线处填入合适的代码。

      import pandas as pd

      import matplotlib.pyplot as plt

      n=10 #城市个数

      count=[0]*n

      daymax=[0]*n

      for i in range(1,31):

          day=str(i)

          if len(day)<2:

              day='0'+str(i)

          daydata='202204'+day+'.csv'

          dayaqi=avg(daydata)

          city=dayaqi.columns[1:n+1]

          for j in range(n):

              t=city[j]

              if dayaqi.at[0,t] <= 100:

                 

              else:

                  if count[j]>daymax[j]:

                      daymax[j]=count[j]

                  count[j]=0

          for k in range(n):

              if count[k]>daymax[k]:

                 

      print(daymax)

      plt.figure(figsize=(12,4))

      x=

      y=daymax

      plt.bar(x,y)

      plt.show()

  • 1. (2023高三下·湖州、衢州、丽水月考) 某学院投票评选学生会优秀干事,候选人共10人,选出3人,每张选票最多可勾选5人,超过5人则选票无效。经一轮投票后,若得票数前三的候选人超过3人,则需对得票数前三的候选人进行下一轮投票,直至投出结果。

    小洪用Python编写投票系统,第一轮投票数据经处理后,保存在"vote2023.xlsx"文件中,部分数据如图a所示,请回答下列问题。

    图 a

    1. (1) 定义 check 函数,功能为:读取 Excel 文件返回有效票数据。函数代码如下:

      def check(datafile):

          df=pd.read_excel(datafile)

          df["票数"]=df.sum(axis=1)-df["序号"]    # 统计每张选票的票选数

          df1=df[    ]

          return df1

      划线处应填入的代码为       (单选,填字母)。

    2. (2) 统计票数前三的候选人,若有并列也统计在内,并绘制的柱形图如图 b 所 示。部分 Python 程序如下,请在划线处填入合适的代码。

      df=check("vote2023.xlsx")

      df2=df.drop(["序号","票数"],axis=1)   # 删除序号列、票数列

      s=[];st=[]

      for i in df2.columns:

          s.append([i,int(df2[i].sum())])

          #统计每人选票数,格式如['李彤',377]

      for i in range(len(s)):

          num=1

          for j in range(len(s)):

              if  :

                  num+=1

              if :

                  st.append(s[i])     # 存储前三名数据

      for i in range(len(st)):

          plt.bar(st[i][0], )     # 绘制柱形图

      # 设置图表的标题及图例数据并显示图表,代码略

      图 b

    3. (3) 若对图b中5人采用投票系统进行第二轮投票,最多可投3人,5人的票数结果分别为600,211,211,589,589,则投票结果的图表中显示的候选人有个。
  • 1. (2023·模拟) 为研究某项疾病与年龄的关系,某医院对以前的诊断记录进行整理和分析,整理部分数据如图a所示。

    1. (1) 观察图a所示数据,发现年龄列数据格式不一致,为了便于数据分析,下列操作合适的是(   )(单选,填字母)。
    2. (2) 将数据整理好后,为了统计0-18、19-35、36-60、61以上(含61)四个年龄段的某疾病患病人数占该疾病总患病人数的比例,并绘制如图b所示图表,编写如下Python程序,请在划线处填入合适代码。

      import pandas as pd

      import matplotlib.pyplot as plt

      df = pd.read_excel('data.xlsx')

      tp = input('请输入疾病类型:')

      df1 =       # 筛选 tp 疾病的数据

      count = [0] * 4

      for i in range(len(df1)):

          age = df.at[i, "年龄"]

          if:

              count[0] += 1

          elif age <= 35:

              count[1] += 1

          elif age <= 60:

              count[2] += 1

          else:

              count[3] += 1

      x = ['0-18', '19-35', '36-60', '61 以上']

      y = []

      for i in range(4):

          y.append

      plt.bar(x, y)      # 显示不同年龄段患该病的人数百分比

      # 设置图表其他参数,代码略

      plt.show()

    3. (3) 观察图b,“疾病A”患病比例最大的年龄段为
    4. (4) 若想获取61岁及以上的人群中,患病率最高的10种疾病,编写如下程序。

      def get_head10(df, age):

         

          return df.疾病.head(10)

      print(get_head10(df, 61))

      上述程序段中方框处可选代码为:

      ①df = df.sort_values("年龄", ascending=False)

      ②df = df[df.年龄 >= age]

      ③df = df.groupby("疾病", as_index=False).count()

      则加框处应填代码的顺序依次为(   )(单选,填字母)

  • 1. (2023高二下·温州期中) 小明学校每期都会对学生的青年大学习数据进行统计,确保人人都参与,图 a是某期学习数据:

    图 a

    1. (1) 小明发现“xm”列数据是混杂数据,他就利用Python语言编程将此列数据的姓名和班级分别提取,再存储到新的Excel文件进行数据整理,下列说法正确的是_________(单选题)
    2. (2) 在 Excel 软件中统计各班学习人数,小明选择单元格 H3 输入公式,然后通过 H3 对 H4:H16 进行 自动填充,但发现计算结果有误。请输入正确的公式

      图b

    3. (3) 小明利用Pandas模块读取数据,统计出各班学习人数,并获取学习人数最少的10个班级,结果如图c,最后进行可视化处理,结果如图d,请在划线处补充代码:

      import pandas as pd

      import matplotlib.pyplot as plt

      plt.rcParams['font.sans-serif'] = ['SimHei']

      plt.rcParams['axes.unicode_minus'] = False

      df = pd.read_excel("qndxx.xlsx")

      dfl = df.①

      #按班级列进行分组

      df2=df1.学校.count( )

      #统计各班级学习人数

      df2=df2.rename(columns= {"学校":"人数"})

      df3=df2.sort_values ("人数",ascending=True).head(10) print(df3)

      #筛选前 10 名

      #绘制柱形图

      plt.title("学习人数最少的 10 个班级")

      #设置图表标题

      plt.show ()

  • 1. (2023高二下·浙江期中) 某地气象站每3小时记录一次数据,现收集了该地区2022年全年的天气数据,数据按时间日期顺序存储在“weather.xlsx”文件中,部分数据如图a所示。

    图 a

    图 b

    统计全年每月降水天数(当日总降水量大于 0 即计入降水天数),编写 Python 程序,回答下列问题:

    1. (1) 求每日总降水量并输出,结果如图b所示,部分程序代码如下,则划线处可行的是         (单选,填字母) 。

      import pandas as pd

      df=pd.read_excel ("weather.xlsx")

      df1=                    

      print(df1)

    2. (2) 统计每月降水天数,绘制柱形图如图 c 所示。程序代码如下,请在划线处填入合适的代码。

      import matplotlib.pyplot as plt

      plt.rcParams['font.family']='SimHei'  #设置图表中的中文字体

      days=[31,28,31,30,31,30,31,31,30,31,30,31]   #2022 年每月天数

      rain_days=[0]*12

      begin=0

      for m in range(12):

      for d in range(begin, ):

      if df1.at[d,"降水量"]>0:

      begin+=days[m]

      x=[i+1 for i in range(12)]

      y=rain_days

      plt.bar ( , label="降水天数") plt.xticks(x)    #设置横坐标刻度

      plt.legend()

      plt.show ()

    3. (3) 已知全国月均降水天数约为11天,则超过全国月均降水天数的月份共有 个。

      图 c

  • 1. (2023高二下·浙江期中) 如图所示为小吴老师将学校某次模考的成绩文件另存储为"cj.xlsx":

    1. (1) 小明收集的数据存在一些问题, 需要进行数据整理,下列说法不合理的是          (单选,填字母)
    2. (2) 编写了如下python 程序,对数据做出了进一步分析,请完成程序填空。

      import pandas as pd                 #引入pandas 模块

      import matplotlib.pyplot as plt     #引入matplotlib 的pyplot 子库

      df=pd. ('cj.xlsx')    #读取"cj.xlsx"文件中的数据,创建DataFrame 对象df

      # 若要筛选本次考试数学分数超过120分且技术分数到达88分及以上的学生并输出他们的考试情况 (df1中保存筛选结果,提示: 多条件筛选时,与(and) 关系用“&”连接, 或(or) 关系用“|”连接)

      df1 =  (单选, 填字母)

      print (df1)

      A.df[(df["数学"] >= 120 )&(df["技术取高"] >= 88)]

      B.df[(df["数学"] > 120 )&(df["技术取高"] >= 88)]

      C.df[(df["数学"] > 120 ) | (df["技术取高"] >= 88)]

      D.df[(df["数学"] >= 120 ) | (df["技术取高"] > 88)]

      # 若要了解该校参加该次考试选考各科的选课人数,请完善下面的代码。

      for km in df.columns[6:13]:

          renshu = ;

          print("选",km,"的人数为:",renshu)

      # 想要了解该校技术班级数学科的平均分,并绘制一个图表, 针对各班数学平均分进行比较分析 df2 = df.groupby("班级",as_index = False).mean()

      df3 = df2.sort_values("数学",  ) # 通过排序使得按平均分降序排序并存储在 df3 中 plt.bar (df3.班级, df3.数学 )

      plt.title("班级数学平均分比较")

      plt.xlabel("班级")

      plt.ylabel("数学平均分")

      plt.show ()

    3. (3) 绘制的图表类型是         (单选, 填字母)。
  • 1. (2023高一下·余姚期中) 小明将两份不同来源的“每小时空气质量数据”进行合并后存入“空气质量.xlsx”文件中,部分界面图a所示。他先对数据进行了整理,然后运用Pandas模块筛选出11月第1周的数据进行分析,并制作图表,如图b所示。请回答下列问题。

    图 a

    图 b

    1. (1) 在对数据进行整理的过程中,下列说法正确的有         (多选,填字母)
    2. (2) 经数据整理后,每日都有 24 条数据,为直观显示该周“日平均 AQI”的对比情况, 小明编写如下程序,请在划线处填入合适的代码。

      import pandas as pd

      import matplotlib.pyplot as plt

      plt.rcParams["font.sans-serif"] = ["Simhei"]

      df=pd.read_excel ("空气质量.xlsx")

      df=df.head(24*7)

      df_ave=df.groupby("日期",as_index=False).        #日平均 AQI df_sort=df_ave.sort_values("AQI",ascending= ) 

      plt.bar( ,df_sort["AQI"],label="日均空气质量指数")  

      plt.legend( )

      plt.xlabel("日期")

      plt.ylabel("AQI 值")

      plt.title("湖州市 11 月第 1 周日均空气质量指数对比")

      plt.show ()

上一页 2 3 4 5 6 下一页 共27页