一、单项选择题(每小题 2 分, 共16分)
1.某研究部门准备在全市100万个家庭中抽取1000个家庭,推断该城市所有职工家庭的年人均消费。这项研究的总体是、样本是、样本量是( C)。
A.100万个家庭、100万个家庭的人均消费、1000 B.100万个家庭的人均消费、100万个家庭、1000 C.100万个家庭、1000个家庭、1000
D.100万个家庭的人均消费、1000个家庭、100万
2. 参数是指( D)。 A.参与个体数 B.研究个体数 C.总体的统计指标 D.样本的统计指标
3.下列图形中,适合描述数值型数据的是(C )。 A.饼图 B.环形图 C.散点图 D.条形图
4. 下列数据中,属于分类变量的有(D )。 A.年龄 B.身高 C.产品产量
D.性别(男、女)
5.相关关系按变量之间的相关程度划分为(B )。 A.单相关、复相关和偏相关
B.完全相关、不完全相关和不相关 C.线性相关和非线性相关 D.正相关和负相关
6.描述一组对称(或正态)分布数据的离散趋势时,最适宜选择的指标是(B )。 A.极差 B.标准差 C.均数 D.变异系数
7.下面那一项分布的数据,均数等于中位数(D )。 A.对数正态 B.左偏态 C.右偏态 D.正态
8. 当数据分布形状呈对称时,则约有(D )的观测值落在距均值三个标准差的区间范围内。
A. 68% B. 90% C. 95% D. 99%
表1 不同地区家庭收入和支出情况表 NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RNO 2 2 1 2 2 2 2 1 1 1 2 1 1 1 2 INCOME 1794 1716 3410 1765 2184 2050 2460 1976 2850 4275 2010 2236 3305 2400 2250 OUTGO 1550 1365 2730 1530 1900 2050 2184 1170 2496 2760 1275 1810 2820 1976 1970 NO 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 RNO 2 1 1 1 1 2 1 2 2 2 1 2 2 1 2 INCOME 2200 2730 2496 1760 2820 2250 3170 1200 1776 1980 2455 1080 1986 3369 1530 OUTGO 2060 2236 1455 1040 2366 1966 2400 1250 1350 1794 2550 1380 1200 2305 1316 表1为2个地区30个家庭的收入和支出情况表,其中NO为家庭编号,RNO为地区编号,INCOME为家庭总收入,OUTGO为家庭总支出。
二、数据集的建立(每空 1 分, 第2小题15分,共20分)
1. SAS的逻辑库可分为_____永久库____和____临时库_____两种,临时库名为___work______。 2. 编写程序创建逻辑库aa与D盘文件夹test的关联,在逻辑库aa中建立数据集sryzc。使用format过程定义地区编号RNO的输出格式FRNO:1显示为“一号地区”,2显示为“二号地区”。在output窗口输出数据集中的NO、RNO和 INCOME列,以标签“家庭编号”、“地区编号”和“家庭总收入”显示,并应用FRNO格式显示地区编号的值。(15’)
3.在windows环境下该数据集全名为_________,在SAS的环境下,数据集名字为_________。
三、基本统计分析和正态性检验(每空 1 分, 第1小题6分,第3小题4分,共15分)
1.使用means过程编写程序,按地区编号分组计算家庭总收入的均值、极差、中位数、四分位数。(6’)
2. 计算结果如下:
统计数据表明:一号地区有一半的家庭总收入低于___2775.00______,一号地区家庭总收入的最大值和最小值相差___2515.00______;二号地区家庭总收入的四分之三分位点为__2192.00______,表示二号地区有____25_____%的家庭总收入超过它。
3.编写程序对家庭总收入的数据分布进行正态性检验。(4’) 4. 正态性检验结果如下:
结论是_____正态____。
四、假设检验(每空 1 分, 第1、4小题6分,共 22分)
1. 简述假设检验的基本思想。 (6’)
2. 在假设检验中,显著性水平α是衡量_____小概率事件发生____的标准,常取值为__0.05_______,若____p>a_____则不能拒绝原假设H0。
3.比较这2个地区的家庭总收入有无显著差异,用____总体均值____的两_________样本t检验分析方法,其原假设H0是___无显著性差异______,备择假设H1是_________。
4. 编写程序用过程ttest进行假设检验。(6’) 5. 结果如下:
方差齐性检验的p值为___0.0412______,t统计量的p值为_________,结论是_________。
五、相关分析(每空1分, 第2小题8分,共15分)
1.相关分析是分析测定变量间相互依存关系的密切程度的统计方法。一般可以借助求得相关系数、____散点图_____、___置信椭圆______来进行相关分析。
2.编写程序按地区编号分组绘制家庭总收入对家庭总支出的散点图,两个地区的符号分别用红
色星号和蓝色点表示。(8’)
3.对家庭总收入与家庭总支出作相关分析,结果如下:
变量OUTGO和INCOME的相关系数为___0,。84356______,表明两变量具有______高___(高/中/低)度的___正______(正/负)线性相关关系。相关系数的检验概率为___0.001______,表明OUTGO和INCOME的相关系数显著______不为零___(为零/不为零)。
六、回归分析(每空1分,共12分)
1.对家庭总收入和家庭总支出作回归分析,以INCOME为自变量,OUTGO为因变量,在线性回归对话框中“Dependent”按钮下填入变量____outgo_____,“Explanatory”按钮下填入变量____income_____。
回归分析结果如下:
2. 得到的线性回归方程为_________=_________+_________。截距的检验概率为_________,因此截距项_________(应该/不应该)保留。
3.在方差统计表中F统计量为_________,F检验的P值为_________,表示模型_________(显著/不显著)。回归方程的判定系数为_________,说明家庭总支出的变异有_________%可以归因于家庭总收入。