统计描述的Stata实现Word文档下载推荐.docx
- 文档编号:7863406
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:17
- 大小:32.52KB
统计描述的Stata实现Word文档下载推荐.docx
《统计描述的Stata实现Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计描述的Stata实现Word文档下载推荐.docx(17页珍藏版)》请在冰点文库上搜索。
164.7
172.2
172.8
178.6
182.5
176.4
168.4
171.0
169.1
166.9
181.1
170.4
168.0
172.4
164.3
164.2
177.2
168.3
177.8
173.0
167.4
173.2
169.9
172.1
174.8
170.5
175.8
171.1
169.4
178.2
174.1
170.0
177.1
172.5
175.1
174.4
162.3
171.3
177.0
163.5
177.6
175.2
171.5
179.1
172.6
184.8
182.8
167.5
171.2
178.5
164.1
169.5
173.4
数据格式如下:
x
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
180
29
30
171
31
32
33
34
35
36
37
175
38
39
40
41
172
42
43
44
45
46
47
48
49
165
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
174
88
89
90
91
173
92
93
94
95
96
97
98
99
169
100
101
102
168
103
104
105
170
106
177
107
108
109
110
111
112
113
114
115
116
117
118
119
120
为制作频数表,键入Stata命令:
.genf=int((x-160)/2)*2+160
产生用以作频数表的新变量“f”
.tabf
对变量“f”作频数表
“gen”命令产生新变量“f”,将各观察值转换成相应该组的下限值。
int为取整函数,结果为括号内函数值的整数部分,如int(3.24)=3。
“160”为第一组的下限,“2”为组距。
以第一例观察值160.1cm为例,f=int((160.1-160)/2)*2+160=160,则它应归入“160~”组。
结果如下:
f|Freq.PercentCum.
------------+-----------------------------------
160|10.830.83
162|32.503.33
164|108.3311.67
166|119.1720.83
168|1613.3334.17
170|2218.3352.50
172|2218.3370.83
174|1411.6782.50
176|108.3390.83
178|54.1795.00
180|32.5097.50
182|21.6799.17
184|10.83100.00
Total|120100.00
histf,start(160)width
(2)
作频数图
例2-2某医生测定230名正常成年男子的空腹血清胰岛素样生长因子-1(IGF-1F)水平,整理后编制为频数分布表(表2-2),请根据该频数分布表作频数图。
表2-2230名正常人空腹血清胰岛素样生长因子-1水平中位数的计算
IGF-1F
(1)
人数
(2)
频率(%)
(3)
累计频数
(4)
累计频率(%)
(5)=(4)/
50~
30
13.04
13.0
150~
71
30.87
43.9
250~
49
21.30
150
65.2
350~
28
12.17
178
77.4
450~
14
6.09
192
83.5
550~
12
5.22
204
88.7
650~
10
4.35
214
93.0
750~
8
3.48
222
96.5
850~
5
2.17
227
98.7
950~1050
3
1.30
230
100.0
合计
100.00
—
Stata数据格式如下:
x
f
250
350
450
550
650
750
850
950
tabx[weight=f]
制作汇总表的频数表
在本例中,x的取值为各组的下限,而f是各组的频数,所以需要用Stata的频数选项[weight=]。
结果:
x|Freq.PercentCum.
50|3013.0413.04
150|7130.8743.91
250|4921.3065.22
350|2812.1777.39
450|146.0983.48
550|125.2288.70
650|104.3593.04
750|83.4896.52
850|52.1798.70
950|31.30100.00
Total|230100.00
histx[weight=f],start(50)width(100)
制作频数图
例2-3随机测量某地10名20~30岁健康男性居民血清铁含量(
),测量值分别为6.58,7.42,15.32,15.78,17.60,17.98,15.21,17.53,20.11,22.64,试求其平均血清铁含量。
Stata数据为
6.58
7.42
15.32
15.78
17.6
17.98
15.21
17.53
20.11
22.64
sux
计算均数标准差
Variable|ObsMeanStd.Dev.MinMax
-------------+--------------------------------------------------------
x|1015.6175.0752546.5822.64
所以平均平均血清铁含量为15.617。
例2-4计算例2-1的频数表(表2-3)中120名男子的平均身高
显然,如果用Stata,对于例2-1的资料不需要事先转化为频数表,然后再计算均数。
不妨用例2-2作为例子展示Stata计算频数表资料的均数。
sux[weight=f]
计算频数表资料的均数
Variable|ObsWeightMeanStd.Dev.MinMax
-------------+-----------------------------------------------------------------
x|10230290223.412350950
例2-58名麻疹易感儿接种麻疹疫苗3周后,其血凝抑制抗体滴度分别为1:
4,1:
8,1:
16,1:
32,1:
64,1:
128,1:
256,1:
512。
试求其平均抗体滴度。
数据格式:
128
256
512
genlogx=log(x)
计算x的自然对数
sulogx
计算自然对数的均数,得到3.81231
dispexp(3.81231)
计算均数的反对数,即指数得到几何均数为45.254857
另外,Stata还有一个直接计算几何均数的命令:
meansx
结果为:
Variable|TypeObsMean[95%Conf.Interval]
-------------+----------------------------------------------------------
x|Arithmetic8127.5-20.53203275.532
|Geometric845.2548310.94481187.1206
|Harmonic816.06275..
------------------------------------------------------------------------
Missingvaluesinconfidenceinterval(s)forharmonicmeanindicate
thatconfidenceintervalisundefinedforcorrespondingvariable(s).
ConsultReferenceManualfordetails.
Means命令计算算术均数、几何均数以及调和均数,其中几何均数为45.25483,和前面的结果相同。
例2-6某地区50名麻疹易感儿童接种麻疹疫苗3周后,测其血凝抑制抗体滴度,如表2-4中第
(1)栏和第
(2)栏,求平均抗体滴度。
表2-450名麻疹易感儿童平均抗体滴度计算表
抗体滴度
滴度倒数
(3)
(5)=
(2)×
1:
1
4
0.6021
0.6021
2
0.9031
1.8062
6
16
1.2041
7.2246
32
1.5051
15.0510
64
1.8062
28.8992
2.1072
16.8576
2.4082
12.0410
2.7093
5.4186
合计
87.9003
数据如下:
sulogx〔weight=f〕
计算自然对数的均数,得到4.04798
dispexp(4.04798)
计算均数的反对数,即指数得到几何均数为57.281631
也可以用
meansx[weight=f]
(analyticweightsassumed)
x|Arithmetic895.76-2.30755193.8275
|Geometric857.281622.59723145.2029
|Harmonic832.82051..
例2-75名成年男子的体重(kg)为60,70,75,80,90,求中位数。
例2-8某医生测定了6名正常成年男子的空腹血清胰岛素样生长因子-1(IGF-1F)水平为150,170,185,245,265,280,求中位数。
注:
这两个例子用软件算实在是浪费,可以用sux,detail来处理。
对于summary,加上detail后可以输出百分位数,其中的P50就是中位数。
-------------------------------------------------------------
PercentilesSmallest
1%6060
5%6070
10%6075Obs5
25%7080SumofWgt.5
50%75Mean75
LargestStd.Dev.11.18034
75%8070
90%9075Variance125
95%9080Skewness0
99%9090Kurtosis2.05
例2-98名7岁男孩的身高(cm)分别为116,118,119,120,121,123,125,126。
请计算这8名7岁男孩身高的第25百分位数和第90百分位数。
Stata数据为:
121
123
125
126
Stata命令为:
sux,d
1%116116
5%116118
10%116119Obs8
25%118.5120SumofWgt.8
50%120.5Mean121
LargestStd.Dev.3.464102
75%124121
90%126123Variance12
95%126125Skewness.13226
99%126126Kurtosis1.836735
第25百分位数和第90百分位数分别是118.5和126。
例2-10分别依据例2-1中身高的原始资料和频数表(表2-3)资料计算标准差。
x|120171.60254.690084160.1184.8
标准差为4.69。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 描述 Stata 实现