数据时代的推断陷阱(上海财经大学)超星尔雅学习通网课章节测试答案

1.1
1
(图)下图统计了2019年中国消费者购买食品时看重的因素,其中对品质因素的关注度百分比为()。B
1.1-1.png
A、0.557
B、0.493
C、0.372
D、0.365
2
(图)社交电商的高效获客和裂变能力吸引了众多企业加入,2018年社交电商成为资本的宠儿,拼多多、云集、蘑菇街等社交电商的上市更是将社交电商推上风口。行业规模快速增长,2018年中国社交电商行业规模达6268.5亿元,同比增长255.8%,成为网络购物市场的一匹黑马。下图统计并预测了2015-2021年中国社交电商行业规模及增速,其中增速最快的一年为()。B
1.1-2.png
A、2016年
B、2017年
C、2018年
D、2019年
3
(图)一项调查显示, “95后”喜欢通过网络渠道获取品牌的相关信息,具体统计结果如下图所示,其中,95后最青睐于()渠道获取相关信息。D
1.1-3.png
A、互联网广告
B、电视节目和广告
C、电商
D、微博微信
4根据2019年4月发布的相关报告,抖音小镇90后女吃货的美食打卡的视频数量在以下哪个餐饮场景中所占份额最大l C
A、快餐厅
B、糕饼店
C、中餐厅
D、咖啡厅
52018年中国晚睡党睡眠时长分布占比最多的时间是C
A、5H
B、6H
C、7H
D、8H
6
(图)下图统计了2010年-2019年上半年中国年诊疗人次及人均诊疗次数,从图中可以看出,我国每年诊疗人次与人均诊疗次数均在逐年提升。()√
1.1-4.png
7
(图)下图统计了2012-2019年中国移动阅读市场规模,从图中可以看出,2012-2019年中国移动阅读市场规模稳步上升,增速也在逐年增加。()x
1.2
1
日本科学家越水重臣和他的团队运用压力传感器测量(),并用0-256的数值范围对其进行量化。A
A、人对椅子施加压力的方式
B、人的体重
C、人的血压
D、人的握力
2下列选项中属于贵金属期货的是()。AB
A、纽约黄金
B、东京白银
C、现货黄金
D、现货白银
3日本科学家越水重臣和他的团队对驾驶员坐姿的量化研究,不仅可以运用于汽车防盗系统,还可以用于检测司机是否疲劳驾驶。()√
1.3
1
1936年,乔治·盖洛普开创性的将抽样调查运用于民意调查,仅运用()份调查问卷就成功预测出了罗斯福的胜利。C
A、5000
B、4000
C、3000
D、2000
2根据2018年福布斯全美400富豪榜显示,美国最富有的前400位名人中,人数最多的年龄区间为()C
A、(60,66)
B、(66,72]
C、(72,78]
D、(78,85]
3在福布斯全美400富豪榜中,以下组合分别为数值型变量和分类型变量的是()B
A、净资产、年龄
B、年龄、所属行业
C、所属行业、国籍
D、所属行业、年龄
4据《哈佛深红报》相关调查显示:因资本惊人,资源过人,见识超人,精英的孩子被哈佛录取的概率非常高。()√
51936年美国大选前夕,《文学文摘》发放出海量的调查问卷,成功预测出罗斯福获胜。()x
1.4
1
为了规避数据分析中可能存在的陷阱,首先需要学习正确的数据分析方法,了解陷阱的种类;其次不能完全依赖数据,需要将()有机结合,只有这样才能正确地进行数据分析并制定可靠的商业决策。ABCD
A、数据分析方法
B、业务知识
C、商业逻辑
D、数据本身
2“大数据”的“大”是一种相对概念,可以与“完整数据”相提并论。()x
3大数据和完整数据的混淆以及相关关系和因果关系的误判都可能产生数据分析陷阱。()√
4在银行致电满意度分析案例中,星期一是导致客户不满意的主要原因,可作为输入变量进行分析。()x
5在制定商业决策时可以完全依赖问卷调研数据。()x
2.1
1
(图)这是一个治疗肾结石的例子,下表展示了A疗法和B疗法两种疗法的康复率:单独看治疗效果方面的数据,A疗法对治疗两种大小的肾结石的效果都更好,但是将数据合并后发现,B疗法针对所有情况的疗效更优。我们通常称此现象为()。B
2.1-1.png
A、区群谬误
B、辛普森悖论
C、罗杰斯现象
D、罗素悖论
2
(图)英国统计学家辛普森提出了著名的辛普森悖论,下面这个案例可以让我们感受这个悖论:假设有甲乙两名法官,他们都在民事庭和行政庭主持审理案件,审理的部分案件被提出上诉,记录这些被上诉案件的终审结果如下图所示:(单位:件)记法官甲在民事庭、行政庭以及所有审理的案件维持原判的比率分别为x1、x2和x,记法官乙在民事庭、行政庭以及所有审理的案件维持原判的比率分别为y1、y2和y,则下列说法正确的是()。D
2.1-2.png
A、x1 y
B、x1
C、x1>y1,x2>y2,x>y
D、x1>y1,x2>y2,x
3下面对辛普森悖论的描述正确的是()ABCD
A、爱德华·辛普森在1951年的论文中首次提出该悖论
B、辛普森悖论是一种统计现象
C、当数据组合并时,原来出现在不同分组中的趋势可能会消失
D、我们需要斟酌各分组的权重,并乘以一定的系数,来减少辛普森悖论的影响
4现实中的图表经常利用一些视觉(维度、刻度等)误导我们对数据的判断。()√
5缺乏相对基准的图表是一种坏图表。√
2.2
1
(图)某种商品在7个月内销售量增长率的变化情况如图所示,从图上看,以下结论不正确的是()。D
2.2-1.png
A、2~6月该商品的销售量增长率逐渐变小
B、7月该商品销售量增长率开始回升
C、七个月内该商品每月销售量不断上涨
D、七个月内该商品销售量有涨有跌
2单个饼图的主要用途是()A
A、用于总体中各组成部分所占比重的研究
B、比较多个总体的构成
C、反映一组数据的分布
D、比较多个样本的相似性
3饼图中各组比例的总和应该()B
A、小于100%
B、等于100%
C、大于100%
D、不等于100%
4条形图用来表示数值型数据分组频率分布,相邻竖条之间没有间隔()x
5直方图通常被用来描述分类型数据。()x
2.3
1
可以分区间表示一定数量的数值型数据的图形为()C
A、条形图
B、散点图
C、直方图
D、饼图
2对于时间序列数据,用于描述其变化趋势的图形通常是()D
A、直方图
B、条形图
C、箱线图
D、折线图
3为了描述身高与体重之间是否有某种关系,适合采用的图形是()C
A、条形图
B、对比条形图
C、散点图
D、箱线图
4气泡图主要用于描述三个变量之间的相关关系。()√
5与直方图相比,茎叶图没有保留原始数据的信息 。()x
2.4
1下列图表中最适合描述2011年1月-2018年12月我国月度CPI(居民消费价格指数)的是()C
A、条形图
B、散点图
C、折线图
D、饼图
2下列最适合展示并比较2个班级同学的语文、数学、外语、物理、化学、生物平均分(满分皆为100)的图表是()D
A、饼图
B、条形图
C、散点图
D、雷达图
3假设100位同学参加了某一心理学测试,结果分为A、B、C、D四种情况,则下列图表中能最直观地描述每种结果所占比例的是()C
A、直方图
B、雷达图
C、饼图
D、折线图
4散点图适合用于描述某大学大一新生中所有男生的体重与身高之间的关系。()√
5甲校女生占全校总人数的50%,乙校男生占全校总人数的50%,则两校的女生人数不能确定。()√
2.5
1
(图)下图表示同一时间段两个家庭在某一领域的消费支出(千元),错误的是()。A
2.5-1(1).png2.5-1(2).png
A、A家庭每年在该领域的消费支出与B家庭相比更加平稳
B、A家庭每年在该领域的消费支出在2万元左右
C、B家庭每年在该领域的消费支出总体呈上升趋势
D、B家庭每年在该领域的消费支出与A家庭相比更加平稳
2
(图)下图描述了佛罗里达州各年死于枪击的人数,下列选项中正确的是()。C
2.5-2.png
A、1999年死于枪击人数明显大于2007年
B、2010年之后死于枪击的人数在逐渐下降
C、1990-1999年内,每年死于枪击的人数总体呈下降趋势
D、2006年死于枪击的人数与2005年相比有了显著减少
3
(图)下面这张图表是一张反映各国人均寿命与财富的世界地图,纵轴反映该国家的人均寿命,人均寿命较长的国家在上面,人均寿命较短的国家在下面;横轴反映收入状况,较富裕的国家在右边,较贫穷的国家在左边。每一个气泡代表一个国家,气泡的大小表示每个国家的人口数量。下图呈现每个国家2017年的平均预期寿命和平均收入。下列选项中错误的是()( China为中国,Japan为日本,India为印度,Indonesia为印度尼西亚) B
2.5-3.png
A、日本的人均寿命处于较高的状态
B、从图中可以大致看出,国家的人口多少与抚育情况有着正相关的关系
C、从图中可以大致看出,国家越富裕,其人均寿命就越长
D、与印度相比,印度尼西亚更加富裕
4有时会出现比例之和超过100%的饼图,这可能是因为允许一个人选多个选项造成的。√
5茎叶图适合描述分类数据。()x
6
图)下列图形非常好地展示了表格内的数据。()。x
3.1
1《小镇消息》案例中采用的调查方法是()。D
A、简单随机抽样
B、分层抽样
C、整群抽样
D、以上都不是
2抽样调查相比全面普查,具有的特点有()。ABC
A、更节省时间
B、更节省成本
C、更加易操作
D、结果更准确
31936年美国总统大选前,《文学文摘》放出海量调查问卷,调查结果却没能指向罗斯福获胜,说明被调查者的数量大小不是决定结果准确性的唯一因素。()√
4抽样调查根据样本得出结论,结果并不可靠。()x
3.2
1
调查者根据自身或者事先选定专家的主观意见抽取样本,这种抽样方法被称为()。B
A、便利抽样
B、判断抽样
C、系统抽样
D、分层抽样
2非概率抽样一般用于()。D
A、探索性分析
B、预备性研究
C、总体边界不清,难以实施概率抽样的研究
D、以上都是
3下列属于概率抽样的有()。BCD
A、判断抽样
B、系统抽样
C、分层抽样
D、整群抽样
4非概率抽样操作简单、成本低、省时间,所抽取的样本可以推断总体的性质。()x
5确定抽样框是整个抽样过程的开始,假如抽样框没有覆盖总体的某个部分,则抽样所得的样本可能导致有偏差的结果。()√
3.3
1分层抽样最重要的特点为?()C
A、操作简单易行
B、抽样的有效性低
C、总体各个部分在样本中都有代表
D、调查成本易控制
2为进行选举后的民意调查,调查人员通常使用哪种抽样方法?()D
A、简单随机抽样
B、方便抽样
C、分层抽样
D、整群抽样
3下面哪些属于常见的概率抽样方法?()AB
A、简单随机抽样
B、整群抽样
C、方便抽样
D、判断抽样
4概率抽样的一个重要特点在于使用与人为因素无关的随机方式来抽取样本。()√
5简单随机抽样过程必须是有放回的。()x
3.4
1
(图)以下哪幅图示意大偏差、小变异性?()A
A、图13.4-1A.png
B、图23.4-1B.png
C、图33.4-1C.png
D、图43.4-4D.png
2下列几种抽样方法中,哪种是最优的?()C
A、偏差小,变异性大
B、偏差大,变异性大
C、偏差小,变异性小
D、偏差大,变异性小
3非抽样误差产生的原因多种多样,主要可以分为哪几类?()ABC
A、抽样框误差
B、计量误差
C、回应误差
D、代表性误差
4调查中涉及敏感性问题,如“你考试作过弊吗?”可能会产生回应误差。()√
5因抽样框中包含异质单位或者缺失目标单位,都可以成为计量误差的来源。()x
3.5
1
在2016年美国大选民调预测案例中,“隐形选民“(不公开支持,但仍会投票)的出现会产生以下哪种误差?()B
A、抽样框误差
B、回应误差
C、时间误差
D、处理误差
2在2016年美国大选民调预测案例中,下列哪些行为可能会产生抽样误差?()AB
A、对蓝领阶层的取样不足
B、多通过座机电话进行民调
C、选民在民调时刻意隐藏自己的观点
D、选民在选举期内的观点发生变化
3在2016年美国大选民调预测案例中,由时间推移对结果所造成的影响可忽略不计。()x
4.1
1假设A国2018年死于意外交通事故的人数分别为:汽车1200人,火车200人,轮船50人。现以单位里程死亡率作为评价出行方式安全性的标准,可以得出结论:()D
A、汽车是A国最安全的出行方式
B、火车是A国最安全的出行方式
C、轮船是A国最安全的出行方式
D、以上说法都是错误的
2通常我们要研究一个数据分析问题,首先要考虑选择什么作为我们的研究变量,其中的思考主要涉及到的几点包括()ABC
A、变量是如何定义的
B、该变量能否有效描述它所要度量的人或物的性质
C、度量结果有多精确
D、变量是否符合正态分布
3为实现对变量定义正确的度量,以下哪些做法是正确的()ABCD
A、了解变量的具体含义
B、注意度量单位
C、选择有效度量
D、尽量减小度量偏差
4度量同一个客观物体,在分析不同问题时可能会采用不同的变量。()√
5美元指数有许多种,其中有两种美元指数:(1)DXY指数:由老牌发达国家的六种货币来衡量,其中欧元占比57.6%,最早产生并广泛使用至今,但由于老牌发达国家在对美贸易份额中的下降,合理性被受到质疑;(2)TWEXB指数:调整货币种类为26种,增加了新兴市场货币,但权重仅由贸易量决定,未考虑金融市场因素以及货币市场流动性,仍受到质疑。然而,大部分市场参与者仍在采用有缺陷的 TWEXB 和 DXY指数作为主要指标。由此可以看出:很多情况下没有一个所谓完美的指数,都取决于应用的场景与目标,并不断改进发展。()√
4.2
1一组数据中出现频数最多的数值称为()A
A、众数
B、中位数
C、四分位数
D、均值
2下列关于众数的叙述,不正确的是()C
A、一组数据可能存在多个众数
B、众数适用于分类数据,也适用于数值数据
C、一组数据的众数一定是唯一的
D、众数不受极端值的影响
3按顺序排列的一组数据中居于中间位置的数称为()B
A、众数
B、中位数
C、四分位数
D、均值
4某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调査,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是()A
A、赞成
B、69
C、中立
D、22
5人均国内生产总值的计算方法是:一个国家核算期内(通常是一年)实现的国内生产总值除以这个国家的常住人口(或户籍人口)。由此得出,人均国内生产总值是一种均值。()√
6均值在任何情况下描述数据集中趋势的效果都比中位数好。()x
4.3
1一组数据的最大值与最小值之差称为()C
A、平均差
B、标准差
C、极差
D、四分位间距
2标准差的平方是()C
A、极差
B、平均差
C、方差
D、标准差
3如果一个数据的Z-得分是-2,表明该数据()B
A、比均值高出2个标准差
B、比均值低2个标准差
C、等于2倍的均值
D、等于2倍的标准差
4比较两组数据的离散程度最适合的统计量是()D
A、极差
B、平均差
C、标准差
D、变异系数
5对某个高速路段驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时,下列哪个车速可以看作异常值。()D
A、78公里/小时
B、82公里/小时
C、91公里/小时
D、98公里/小时
6数据值减去均值后再除以标准差后得到的值称为Z-得分。()√
7变异系数的主要用途是比较多组数据的平均水平。()x

4.4
1【单选题】经验法则表明,对于钟形分布的数据,落在距离均值1倍标准差内的数据大约有()A
A、0.68
B、0.95
C、0.99
D、1
2【单选题】经验法则表明,对于钟形分布的数据,落在距离均值2倍标准差内的数据大约有()B
A、0.68
B、0.95
C、0.99
D、1
3【单选题】
(图)对于如下的右偏分布,均值、中位数和众数之间的关系是()。A
4.4.png
A、均值>中位数>众数
B、中位数>均值>众数
C、众数>中位数>均值
D、众数>均值>中位数
4【单选题】关于正态分布,下面哪个说法不正确。()C
A、正态分布具有对称性
B、正态分布的均值和方差能够决定分布的位置和形态
C、正态分布的方差越小,密度函数的形状越扁平
D、标准正态分布的均值为0,方差为1
5【判断题】对称分布的均值和中位数必然相等。()√
6【判断题】假设将大量独立的随机变量相加,不论原来的随机变量是多少,它们的和会趋向于正态分布。 ()√
4.5
1【单选题】把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值称为()C
A、众数
B、中位数
C、四分位数
D、平均数
2【单选题】四分位间距的值为()B
A、Q1减Q3
B、Q3减Q1
C、Q3加Q1
D、Q3与Q1的中间值
3【单选题】某班共有25名学生,期末商务口语课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数的下四分位数和上四分位数分别是()A
A、64.5和78.5
B、67.5和71.5
C、64.5和71.5
D、64.5和67.5
4【单选题】假定一个样本由5个数据组成:3,7,8,9,13。该样本的方差为()B
A、8
B、13
C、9.7
D、10.4
5【单选题】在离散程度的测度中,最容易受极端值影响的是 ()A
A、极差
B、四分位间距
C、标准差
D、平均差
6【多选题】下列统计量中,稳健性度量包括()BC
A、均值
B、四分位间距
C、中位数
D、极差
7【判断题】如果一个数据小于下四分位数1.5倍的四分位数间距或大于上四分位数1.5倍的四分位数间距,则该数据可被认为是数据集中的异常值。()√
8【判断题】
(图)下列盒型图说明该分布是右偏分布。 ()x
4.6
1【单选题】在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分。假设行员工得分的分布是简单的偏态分布,则分布形状最有可能是()B
A、对称的
B、左偏的
C、右偏的
D、无法确定
2【单选题】对于偏态分布,以下说法正确的是()A
A、均值通常不等于中位数
B、均值一定大于中位数
C、均值一定小于中位数
D、均值一定等于中位数
3【多选题】正态分布具有以下哪些性质:()ACD
A、对称性
B、单调性
C、中位数等于均值
D、众数等于均值
4【判断题】正态分布的应用十分广泛,在实际情况中偏态分布也十分常见。()√
5【判断题】正态分布的应用十分广泛,但在运用正态分布解决实际问题前,需要考虑实际情况是否符合运用正态分布的条件。()√
5.1
1【单选题】一个随机现象的任一结果的出现概率不可能是:D
A、0.314
B、π/4
C、0.5
D、-0.5
2【单选题】假如我们将一枚硬币抛10次,以下哪个结果更有可能发生?()D
A、正反正反反正正反反正
B、反反反反反正正正正正
C、.正正正正正正正正正正
D、以上三种机会均等
3【单选题】“______随机现象无法预测,但是_____下来,会呈现出有规则且可预测的模式”,填入空中的词语依次为:()B
A、短期,短期
B、短期,长期
C、长期,短期
D、长期,长期
4【单选题】下列四种关于概率的说法中,错误的是:()D
A、0:这件事不可能,它永远不会发生
B、1:这是一件必定会发生的事,每次尝试它都会发生
C、0.01:这个事件发生的机会很小,不过在重复多次的实验中偶尔会发生。
D、0.5:这个事件发生的机会比不发生的机会大。
5【单选题】同时抛掷两枚质地均匀的正方体骰子(骰子每个面上的点数分别为1,2,3,4,5,6)。下列事件中概率为1的事件的是:()B
A、两枚骰子朝上一面的点数和为6
B、两枚骰子朝上一面的点数和不小于2
C、两枚骰子朝上一面的点数均为偶数
D、两枚骰子朝上一面的点数均为奇数
6【多选题】假如我们将一枚硬币抛10次,结果为“正正正正正正正正正正”,则下列说法正确的是:()CD
A、下一次抛硬币结果为“负”的概率大于50%
B、下一次抛硬币结果为“正”的概率大于50%
C、下一次抛硬币结果为“负”的概率等于50%
D、下一次抛硬币结果为“正”的概率等于50%
7【多选题】下列有关“个人概率”和“重复多次的比例”的说法中,正确的是:()BD
A、“个人概率”是错误的概率
B、“个人概率”只代表个人观点,无所谓对错
C、“重复多次的比例”与“个人概率”一定不同
D、决策者本人也可能会根据自己对于已经出现的“重复多次的比例”的观察不断调整个人概率
8【判断题】10只产品中有2只次品,按顺序不放回抽两次,每次抽1个产品。由于第一次有可能抽出次品,所以第二次抽出产品是次品的概率小于第一次。()x
9【判断题】小王有5把钥匙,但是不知道哪一把是开门的钥匙,现将钥匙随机依次试验开门,恰好第三次打开门锁的概率比恰好第四次打开门锁的概率大。()x
5.2
1【单选题】根据一个具体的样本求出的总体均值的95%置信区间,()。D
A、以95%的概率包含其它样本的样本均值
B、有5%的可能性包含总体均值
C、一定包含总体均值
D、要么包含总体均值,要么不包含总体均值
2【单选题】总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信区间的临界值乘以()A
A、样本均值的标准差
B、样本标准差
C、样本方差
D、总体标准差
3【单选题】当置信水平和总体标准差不变时,置信区间的宽度()A
A、随着样本量的增大而减小
B、随着样本量的增大而增大
C、与样本量的大小无关
D、与样本量的平方根成正比
4【单选题】95%的置信区间是指()B
A、一个特定的样本落在总体参数所构造的区间内的概率为95%
B、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%
C、总体参数未落在一个特定的样本所构造的区间内的概率为5%
D、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%
5【单选题】置信系数1-α表达了置信区间的()D
A、准确性
B、精确性
C、显著性
D、可靠性
6【单选题】在置信水平和总体标准差不变的条件下,想要缩小置信区间,则需要()A
A、增加样本量
B、减少样本量
C、保持样本量不变
D、无法通过改变样本量实现
7【单选题】抽取一个样本量为100的随机样本,其均值为12,标准差为12,则总体均值的95%置信区间为()B
A、(10.03,13.97)
B、(9.65,14.35)
C、(8.90,15.10)
D、(8.48,15.52)
8【判断题】当样本量和总体标准差不变时,置信区间的宽度随着置信系数的增大而减少。()x
9【判断题】在其它条件相同的情况下,95%的置信区间比90%的置信区间宽。()√
5.3
1【单选题】下列假设检验步骤符合的顺序为:()B
A、设定备择假设—设定原假设—明确概率分布—确定拒绝原假设的标准—确认统计量是否在拒绝域内。
B、设定原假设—设定备择假设—明确概率分布—确定拒绝原假设的标准—确认统计量是否在拒绝域内。
C、设定原假设—设定备择假设—明确概率分布—确认统计量是否在拒绝域内—确定拒绝原假设的标准。
D、设定原假设—设定备择假设—确认统计量是否在拒绝域内—确定拒绝原假设的标准—明确概率分布。
2【单选题】进行假设检验时,如果样本统计量取值不在拒绝域内,那么:()B
A、不能拒绝原假设,原假设一定是正确的
B、不能拒绝原假设,不能确认原假设是否正确
C、可以拒绝原假设,原假设一定是错误的
D、可以拒绝原假设,但是原假设仍然可能是正确的
3【多选题】下列关于原假设的说法中错误的是:()BCD
A、原假设是关于总体未知参数的描述
B、原假设是关于总体已知参数的描述
C、原假设是关于样本统计量的描述
D、原假设是既可以是关于总体参数的描述,也可以是关于样本统计量的描述
4【多选题】下列关于显著性水平的说法中,正确的是:()CD
A、显著性水平只能是5%
B、显著性水平只能是1%
C、显著性水平既可以是5%,也可以是1%
D、显著性水平影响拒绝域的确定
5【多选题】在女士品茶的案例中,原假设为“这位女士根本辨别不出来冲泡的顺序,完全靠猜测”。假设这位女士最终成功判别了九杯及以上的茶的冲泡顺序。如果女士完全靠猜测,出现这种情况的概率约为1%,那么()AD
A、若显著性水平为5%,则我们可以拒绝原假设。
B、若显著性水平为5%,则我们不能拒绝原假设。
C、若显著性水平为5‰,则我们可以拒绝原假设。
D、若显著性水平为5‰,则我们不能拒绝原假设。
6【判断题】小概率事件是指在多次实验中实际上是不会发生的或发生概率很小的随机事件。()x
7【判断题】原假设不一定含有等号。()x
8【判断题】关于假设检验显著性水平:“显著”在统计学上的意义并不是“重要”,而是表示“仅凭随机性不易发生”。()√
5.4
1【单选题】连续随机抛掷一枚硬币两次,若第一次出现正面,则第二次出现正面的概率为()B
A、小于1/2
B、等于1/2
C、大于1/2
D、不确定
2【单选题】由3张一元的人民币,3张五元的人民币,2张十元的人民币,在无法找零的情况下,可以恰好支付()种不同的金额。A
A、31
B、32
C、47
D、48
3【单选题】有三个外观完全一致的袋子,其中一个袋子里面是一块金币和一块银币、一个袋子里面是两块金币、一个袋子里面是两块银币。任选一个袋子后,从中摸出了一枚钱币,发现是金币。那么袋子中另一枚钱币也是金币的概率是多少?()C
A、0.5
B、0.3333333333
C、0.6666666667
D、0.4
4【单选题】某生物学家在培育一种昆虫,该种昆虫每次繁殖会生出一只雌性幼虫或者一只雄性幼虫。某天,该生物学家发现雌性昆虫数量太多了,希望可以多繁殖出一些雄性幼虫,于是他决定:对于每一只雌性昆虫,假如生了一只雄性昆虫,那么它还可以再繁殖;假如生了一只雌性昆虫,就会被禁止繁殖。假如该生物学家严格按照这项要求,那么在接下来出生的幼虫中()C
A、雄性远远多于雌性
B、雄性远远少于雌性
C、雄性和雌性的数量接近相同
D、不确定
5【多选题】随机抛掷一枚硬币,关于“出现正面的概率为1/2”的理解中不正确的是()ABCD
A、抛掷多次,恰好有一半的次数正面朝上
B、抛掷多次,恰好有一半的次数正面朝下
C、抛掷多次,超过一半的次数正面朝上
D、抛掷一次硬币,恰好正面朝上
6【判断题】在电影《天空之眼》中,“附带杀伤概率为45%”意味着无人机轰炸一次,小女孩不会遭受致命伤害。()x
7【判断题】已知随机事件A发生的概率为1%,则A在每一次实验中都偏向于不发生。即使重复试验n次实验(n趋向于无穷大),事件A也趋向于一次都不发生。()x
8【判断题】随机抛掷两枚骰子,正面向上的点数之和为12的概率为1/18。()x
6.1
1【单选题】在比恩看来,决定一名棒球选手能否走向成功的最大因素是()D
A、安打率(击球率)
B、守备技能
C、身体素质
D、控制好球区的能力
2【多选题】以下关于德波戴斯塔对棒球比赛的研究中正确的是()。AB
A、棒球比赛中最重要的数据只有两项:上垒率和长打率
B、上垒率比长打率更重要
C、长打率比上垒率更重要
D、长打率和上垒率一样重要
3【判断题】比利•比恩认为,以往的棒球球队经营者都过于夸大了选手安打率(击球率)、奔跑速度、守备技能及身体素质的重要性,而上垒率和球队得分高度相关的数据分析结果更应引起重视()。√
4【判断题】比恩将运动家队打造成了一支低成本、高水准的优良球队背后的重要因素就是他从数据分析中得出了一直没有被其他人重视的隐藏标准。()√
5【判断题】
(图)始祖鸟是一种已灭绝的动物,有鸟类一样的羽毛,也有牙齿和骨骼的长尾巴。对于已经发现的5件始祖鸟化石,测量其中股骨(一种腿骨)和肱骨(一种上臂的骨头)的化石骨头长度,作散点图如下图,由此可以判断这两种骨头的长度具有较强的正相关性。 ()√
6.2
1【单选题】一般来说,初学电脑打字时,随着练习次数增多,错误就越少,这属于()。A
A、负相关
B、正相关
C、完全相关
D、零相关
2【多选题】相关系数的取值可以是()。ABC
A、0
B、-1
C、0.5
D、3
3【多选题】以下关于安斯库姆四重奏的说法正确的是()。ABCD
A、四组数据中x与y的均值都相同
B、四组数据中x与y的方差都相同
C、四组数据中x与y的相关系数都相同
D、安斯库姆设计构造此数据组的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大
4【判断题】在体检时,学生的体重与肺活量之间存在因果关系。()x
5【判断题】数据表明,北卡罗莱纳州的律师数量与该州上吊、窒息死亡的人数之间的相关系数为0.9937。可认为律师数量对于上吊、窒息死亡人数产生显著的影响。()x
6【判断题】数据显示,美国铀金属出口量与移居美国的英国人数量显著相关,相关系数为0.8279。可认为英国人移居美国是由于看中了美国的铀出口。()x
6.3
1【单选题】下列两个变量之间不具有相关关系的是()。B
A、某居民家庭的支出与收入
B、某居民家庭用电量与水价之间的关系
C、单位圆中扇形的度数与其所对弧长
D、正方形的边长与其周长
2【单选题】一般来说,下面哪些变量是相关关系,而不是因果关系()。C
A、行驶的里程与出租车费用
B、商品房面积与销售总价
C、成年人的身高与年龄
D、铁块的大小与质量
3【判断题】一个国家诺贝尔奖获奖人数多是因为巧克力消耗量大。()x
4【判断题】有人认为:“事故现场的救护人员人数和该事故造成的伤亡程度之间有很强的正相关性,所以派一大堆救护人员只会造成更多的伤亡。”这种说法是正确的。()x
5【判断题】经常饮用低脂牛奶的人,通常体重比饮用普通牛奶的人要高。因此,“食用低脂牛奶会导致体重增加”是个正确的论述。()x
6.4
1【单选题】由于篮球运动员很高,所以人们常说“打篮球可以让人变高”,现在假设篮球运动员是因为长得高才去打篮球。那么“打篮球可以让人变高”这个说法在判断因果关系上犯的错误是()C
A、两者“纯属巧合”
B、两者存在“第三变量”
C、两者存在“逆向因果关系”
D、两者完全没有因果关系
2【单选题】有人发现在一段时期内,美国迈阿密的温度越高,中国某小学一年级的同学们某门课程考试平均成绩就越高。由此得出结论,“迈阿密的气温升高会导致该小学一年级同学们某门课程考试的平均成绩提高”,这个结论犯的错误是()A
A、两者“纯属巧合”
B、两者存在“第三变量”
C、两者存在“逆向因果关系”
D、两者完全没有因果关系
3【单选题】某市的家庭调查得出结论:有烤箱的家庭住房面积越大。这个关于因果关系的结论最有可能犯的错误是()B
A、两者“纯属巧合”
B、两者存在“第三变量”
C、两者存在“逆向因果关系”
D、两者完全没有因果关系
4【判断题】人们早期在关于阅读的科学研究中发现阅读能力较差的人的眼动轨迹是不规则的。因此,一些人假设,眼球运动技能的缺失是造成阅读问题的原因,这导致许多“眼球运动训练计划”在学生中展开和实施。后来,人们弄清了其中的原理,不规则的眼动并不会导致阅读障碍,而缓慢的单词识别和理解困难会导致不规则的眼动。这个例子中,早期人们错误地将因果颠倒了,从而得到了错误的因果关系。()√
5【判断题】如果两个事件中,前一个事件是后一个事件的原因,后一个事件是前一个事件的结果,则两个事件之间存在“相关关系”。()x
6.5
1【多选题】进行好的预测需要具备一定的前提条件,这些前提条件包括( )。ABCD
A、预测对象必须具有相对的稳定性
B、要有系统、准确的资料
C、预测者掌握科学的预测方法
D、预测者要具备一定的理论知识
2【多选题】选择预测方法时应考虑的因素有( )。ABCD
A、预测精度、成本
B、预测方法复杂性
C、预测环境
D、预测时期长短
3【多选题】决策的基本因素包括( )。ABCD
A、决策主体
B、决策环境
C、决策对象
D、决策目标
4【判断题】总统委员会将挑战者号的失事原因归结为:寒冷的天气、糟糕的决策、不现实的飞行计划。()√
5【判断题】我国自从实施机动车排放测试标准以来,一直采用欧洲的NEDC工况。NEDC是按照欧洲的道路状况制定的机动车排放测试标准,在我国的实际运用中与我国情况不完全符合,机动车在实际行驶中的油耗等指标与测试时差异较大。这说明任何标准或者模型都有其适用范围,在范围之外使用时就有可能产生错误。()√
6【判断题】在胰岛素实验中,通常将小白鼠分为实验组和对照组,在控制其它条件相同的情况下,实验组的小白鼠被注射适量胰岛素,对照组的小白鼠被注射等量的生理盐水,观测两组小白鼠的血糖浓度变化。设置对照组是为了排除胰岛素以外其他因素的影响。()√
7.1
1【单选题】在巴比奇看来,“从大量观察数据中仅选取符合预期值的实验结果数据,从而对自身的观点进行论证”,这种做法属于科学欺诈中的()D
A、愚弄
B、捏造
C、拼凑
D、炮制
2【单选题】某人未进行实验,直接凭空编造出自己需要的数据,从未发表根据这些数据所得的结论。这在科学欺诈中属于 ()B
A、愚弄
B、捏造
C、拼凑
D、炮制
3【多选题】巴比奇认为在科学中存在着几种类型的欺诈,这些欺诈包含( )。ABCD
A、愚弄
B、捏造
C、拼凑
D、炮制
4【判断题】准备发表的数据必须是真实有效的()。√
5【判断题】在现代科学研究中,捏造数据是完全不符合学术道德的行为。()√
7.2
1【单选题】2015年,旅美韩国科研人员韩东杓(音译)因学术造假,获刑57个月。据了解,韩东杓于2008年在美国俄亥俄州克利夫兰市凯斯西保留地大学参与教授迈克尔·赵领导的艾滋病疫苗研究项目。研究小组发现,兔子体内产生艾滋病病毒抗体,被学术界认为是重大成果。实际上,这一发现是韩东杓造假的结果。他供述,起初误把含有抗体的人血与兔子血混合,从而导致实验结果看似兔子体内产生抗体。在实验的过程中,韩东杓发现了错误,但隐瞒不报,继续造假,理由是不想让导师迈克尔·赵“失望”。这一行为在造假中属于()B
A、愚弄
B、捏造
C、拼凑
D、炮制
2【单选题】从那些总体偏高的观测结果中挑出一些数据来,添加到那些总体偏低的观测结果中,或者是相反方向的。这种做法属于科学欺诈中的()C
A、愚弄
B、捏造
C、拼凑
D、炮制
3【多选题】数据收集与使用的基本规范是什么? ( )。ABCD
A、应当努力使收集到的数据有意义。应当选择适当的数据收集方法,遵守实验室操作规程和数据采集规范,采用正确的统计分析方法和手段。
B、应当保证数据的原始性、真实性和完整性。应当在有连续页码的实验或调查记录本上记录研究过程和相关数据,不得涂改数据或撕掉记录本中的任何一页。严禁编造、改动原始数据,或有选择地记录数据以获得特定的结果。
C、使用他人未正式发表的数据,必须事先征得数据所有者的同意,并明确说明数据来源。
D、如果在研究中需要收集人类受试者的可辨别的私人信息,包括声音、图像数据等,需要事先征得相关人员或其监护人的知情同意。
4【判断题】伯特通过对孪生子的研究得出结论:智力(用智商分数测定)有着很强的遗传因素。()√
5【判断题】科研人员可以把别人的工作当成自己的工作那样来报告,不构成剽窃l。()x
7.3
1【单选题】密立根实验中的行为在科学欺诈中属于 ()D
A、愚弄
B、捏造
C、拼凑
D、炮制
2【单选题】数据伦理思考中最重要的部分是()D
A、对数据本身的思考
B、对数据运用精度的思考
C、对数据运用准确度的思考
D、对数据使用目标以及利益指向的思考
3【多选题】对已有学术成果的介绍、评论、引用和注释,应力求( )。ABC
A、客观
B、公正
C、准确
D、以上都不对
4【多选题】一般而言,数据保存与共享的基本规范是什么?( )。ABCD
A、应当保存所有实验或调查数据的记录
B、应适当整理、保存所获得的数据并进行必要的备份、归档,防止数据的损毁、灭失或被篡改
C、了解并遵守所在机构关于实验数据和材料所有权的规定,未经允许不得擅自将实验记录本或其他材料带离实验室
D、遵守各学科领域关于科学数据保存期限的规定
5【判断题】涉及人类受试者的研究伦理原则中,尊重原则是指在科研活动中必须尊重人的尊严、自主性、知情权和隐私权。()√
6【判断题】在数据的收集和使用方面,科研机构对于在科学研究中获得的可能对公众健康或公共卫生等有重要影响的数据及分析结果,应当规定适当的公布或发布程序。在公布或发布这样的数据或结果时,应当保持客观性,避免有意强调或忽略某些内容。()√
8.1
1【单选题】“好”和“坏”是一类形容词,它们所描述的特征永远是相对的。在对特征数据的样本好坏进行标定时,最关键的因素为()。C
A、数据的来源
B、数据的展示
C、数据的目标
D、数据的伦理
2【判断题】人类感知数据的方式和能力,基本决定了数据存在及利用的有效性。()√
3【判断题】大数据时代中信息技术的发展和各类人工智能算法的出现极大地拓展了感知数据的方式和能力,从而在方方面面挖掘出大量的数据。()√
4【判断题】人类容易接受的最直观的信息模式就是图表。()√
5【判断题】“好”图表只要求正确地表现数据,与是否符合展现数据的具体目标无关。()x
6【判断题】数据的“好”与“坏”是相对的,需要结合使用者的具体目标才可以做出判断。()√
7【判断题】数据的使用是否符合集团利益在当前使用模式下的最佳体现,以及集团利益与个体利益之间是否为最佳平衡,是最重要的数据伦理决策问题。()√
8【判断题】在数据的获取、拥有、使用等各个环节中都应当注意数据伦理方面的问题。()√