通话数据分析.docx
- 文档编号:593610
- 上传时间:2023-04-29
- 格式:DOCX
- 页数:37
- 大小:820.24KB
通话数据分析.docx
《通话数据分析.docx》由会员分享,可在线阅读,更多相关《通话数据分析.docx(37页珍藏版)》请在冰点文库上搜索。
通话数据分析
通话数据分析
刘星-陈周-汤泽宇
摘要
本课题来源于通信公司的需求,主要研究大量客户数据的处理分析问题,解决从不同的角度对移动企业的收益情况进行分析。
利用不同方法对客户呼叫的特性分析和品牌业务的预测。
基于数学模型的建立,我们针对客户通话量、基站各户量、客户活动量等方面对客户通话数据进行分析。
从而对企业高层决策人员提供辅助决策支持。
问题一要对客户进行分类,可以从多方面进行分类,客户的总通话时间按时间段分类,客户的主叫总时间按时间段分类,客户的归属基地数按个数分类等等。
现我们以时差(时差=被叫时长-主叫时间)与通话总时长分类,共分为六类,分别为主叫多高值用户、主叫多中值用户、主叫多低值用户、被叫多高值用户、被叫多中值用户、被叫多低值用户。
以excel的数据筛选和分类汇总为模型进行分析。
随着移动通信产业的发展,数据业务为移动通信市场创造的巨大市场价值空间,其重要程度将促使移动通信产业链而做出相应调整。
一个新通信业务的推广人群的选择是非常重要的,推广人群应具备以下条件:
1.通话较多。
2.人际关系较好。
3.适合此业务。
通信基地的改善应考虑各地区的人数、各地区总通话量等因素。
用户多和通话次数多的地方尽量多建站,以此达到对客服满意的服务。
关键字:
数据筛选分类汇总价值度时差通话总时长
一、问题的重述
通信技术的不断发展拉近了人与人之间的距离。
电话作为主要的通讯工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。
这个巨大的社交网络对当前的通讯设备和业务提出了更高的要求。
如何利用现有的通话记录数据进行,以便做出合理的决策,进而改善通信设施、拓展新的通信业务,依然是很多通信公司所面临的一个难题。
附件给出了一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试完成以下问题。
1.请根据这些通话记录信息建立数学模型以对用户分类。
2.如果需要推出一款新的通信业务,如何选择部分用户作为首选推广人群。
说明你的理由,并撰写一份不超过两页的给公司经理的建议。
3.该地现有的通信设施(如基站等)建设情况是否合理。
如需改进,请给出合理的建议。
二、问题的分析
首先对所有的通话记录利用EXCEL进行统计分析,分别对各用户在十天内的总主叫时间、总被叫时间、总通话时间(主叫时间+被叫时间)以及时差(主叫时间+被叫时间)进行汇总,然后以时差为评判标准分为两类,再以总通话时间为评判标准把之前的两类再各分三类:
高值用户、中值用户、低值用户。
它们是以对公司的价值度命名的,价值度高者为高值用户,以此类推。
分类流程如下:
图
(一)
此过程中主要用到EXCEL中的数据筛选和分类汇总两个数据分析工具,把300个用户细分为六类:
主叫多高值用户、主叫多中值用户、主叫多低值用户、被叫多高值用户、被叫多中值用户、被叫多低值用户。
如果要推出一款新的通信业务,应根据通信业务的性质选择推广人群,首选的推广人群必须适合这一业务。
例如漫游打折业务主要针对经常出差的人群,主叫号码显示主要针对被叫量多的人群。
按这一想法,通过模型一的求解结果,可列举一新的通信业务进行分析。
问题三中假设通信设施的建设合理性只由各区域用户打电话的次数决定。
对于给出的基站位置图,可得出各基站的经纬度,分别以经、纬度为横、纵坐标建立直角坐标系,则可得到各基站的坐标,假设每个基站能服务的区域为图中一个小方格。
由图可知陆地部分共有27个小方格。
每个小方格里的通话次数可由EXCEL数据处理得出。
再根据各方格通话次数建立模型分配基站,则可知道该地通信设施的建立是否合理。
三、模型的假设
1.假设三百个用户是从所有用户当中按比例抽取的。
2.假设用户的价值度只由用户的总通话时间决定。
3.假设新的通信业务只与用户通话费用有关。
4.假设通信设施的建设合理性只由各区域用户在一定时间内打电话的次数决定。
5.假设基站的总数量为30个不能改变。
6.假设每个基站能服务到的地域足够大。
7.假设基站的建设不受地质等环境影响。
四、模型的建立与求解
4.1关于问题1的模型建立与求解
首先把每个用户的主叫总时间、被叫总时间、通话总时间、总时差进行汇总,将300个用户按时差(各用户总被叫时间-各用户总主叫时间)分为两类:
主叫多用户(时差小于零)、被叫多用户(时差大于零)。
附表
(一)为300个用户的分类表格。
表中主叫时长为每个用户十天内主叫的总时长,被叫时长为每个用户十天内被叫的总时长,总通话时长=主叫时长+被叫时长,时差=被叫时长-主叫时长。
蓝色部分为主叫多用户(199人)、绿色部分为被叫多用户(101人)。
其图形分析如下:
图
(二)
接下来分别把主叫多用户和被叫多用户针对总通话时长分类:
主叫多高值用户、主叫多中值用户、主叫多低值用户、被叫多高值用户、被叫多中值用户、被叫多低值用户。
筛选出主叫多用户,通过通话时长的多少可划分为高值(大于8000)、中值(4000-8000)、低值(0-4000)三类。
分类表格见附表
(二)。
表中橙色部分表示为主叫多低值用户(44人),浅绿色部分表示为主叫多中值用户(127人),黄色部分表示为主叫多高值用户(125人)。
其数据分析图如下:
图(三)
筛选出被叫多用户,通过通话时长的多少可划分为高值(大于10000)、中值(5000-10000)、低值(0-5000)三类。
分类表格见附表(三)。
表中粉红色部分表示为被叫多低值用户(12人),蓝色部分表示为被叫多中值用户(39人),绿色部分表示为被叫多高值用户(50人)。
其数据分析图如下:
图(四)
最后,我们可得出用户分类结果如下图:
图(五)
4.2关于问题2的模型建立与求解
在模型一的基础上,可针对时差推出两种通信业务:
主叫便宜(相对的)与被叫便宜(相对的)两种。
主叫便宜业务的推广人群应为主叫多用户中的主叫时长多用户。
被叫便宜业务的推广人群应为被叫多用户中的被叫时长多用户。
从模型一的结果中可得到主叫多用户和被叫多用户。
从中分别筛选出主叫时长大于5000的用户和被叫时长大于8000的用户,筛选结果见附表(四),附表(五)。
表(四)中的的用户被选为被叫便宜业务推广人群,表(五)中的用户被选为主叫便宜业务推广人群。
给公司经理的建议
移动通信是目前全球电信业中最活跃、最具发展潜力的业务之一,以移动通信为主体的电信业已成为国民经济重要支柱产业。
移动通信技术飞速发展,当前移动通信业务市场竞争激烈,外资将逐步进入我国移动通信业务市场,3G牌照即将发放,移动通信业务市场的竞争格局将更加复杂,市场竞争将更加激烈。
因此,特向公司提出如下建议:
公司应在通信业务方面不断创新,因此吸引更多的客户。
公司在话费方面应妥善处理,注重用户量是当前公司最应该重视的。
多推出一些为用户节省话费的业务很有必要,同时又使用户个人的通话量和用户量大幅度增加,这样双方得利,是万全之策。
经过我们的建模分析,公司可针对被叫多用户和主叫多用户推出被叫便宜业务和主叫便宜业务,其最适合的推广人群已在表(四)、表(五)中给出。
这些用户都是通话量多并且在时差方面比较大的用户,把他们作为推广人群是最适合的。
希望公司能认真分析并接受我们的建议。
4.3关于问题三的模型建立与求解
将每个基站十天的总通话次数用Excel进行汇总计数,求得每个基站十天内的通话总次数如下表:
表(四)
由表1可知一个基站至少可以在十天承受761(29号基站)次通话。
30个基站共打了6221次电话。
假如把这6221次平均分配给30个基站,则每个基站分得的通话次数为:
现假设此公司设立30个基站不变,每个基站在十天承受200到240次通话比较合理,通过观察表1知各基站总通话次数的波动很大,有的基站甚至没有通话,可知基站位置不合理。
把陆地划分为30个小格,以小格面积与通话次数建立模型:
图(六)
图中标出了每个基站原有的总通话次数,现在对通话次数重新总合,以200到240为标准对基站进行改进,由图可看出2、3、4、5、6号基站总通话次数之和为275,此地区只建一个基站最为妥当。
留下6号,其他四个基站均可拆除。
6、7号基站总通话次数为137次,可拆除其中一站。
11、28、29号基站总通话次数之和为2027,若按220.7次为标准,则需建9.18个,即9个最为妥当。
现已有三个,应在此区域再建六个基站。
14号基站仅有61次,可适当移至11号基站区域。
18,19号基站通话次数共202,可拆除一站。
26号基站仅有29次通话,可拆除。
22号基站通话次数为445,应再建一站于此。
20、21、23、24、25基站建设基本合理,考虑到经费问题,无需改动。
经分析可得到如下建议。
建议:
把2号基站站移至30旁边,撤除3、4、5、7、14、19号基站,均重建于11、28、29号基站所属小方格中,26号移至22号基站所属小方格中。
基站改进图如下:
图(七)
五、模型的评价与应用
优点:
我们对每一类数据都进行了详细的处理与分析,我们得到了清晰的客户通话信息,为新通信业务的推出和基站的建设合理性提供了可靠的保证。
问题一中把用户分为六类,分类明确详细。
问题二以打电话便宜、接电话贵(都为相对而言)以及打电话贵、接电话便宜两种新业务进行分析,其推广人群可直接在问题一的结果中选择。
问题三的数学模型简单,使基站的改进方式简单可靠。
缺点与改进:
问题一的分类不够全面,比如说可以按每天的主叫时间段进行分类。
问题二中可考虑长途漫游、晚场电话包等业务进行分析。
问题三中由于考虑到经费问题没有对基站做大的改变。
如不考虑经费,则可做总体调整,使每个基站分配通话次数相同。
六、参考文献
1.巴卡斯,努休斯,范德沃姆《确定基站位置的方法及应用》,1996.10.02;
2.苏宁军《采用分类分析的数据挖掘技术进行电信市场客户分群》,2006.05;
3.陈同明《数据挖掘技术及其应用》国防工业出版社,2001;
4.曾婷婷《基于OLAP和数据挖掘的客户通话数据分析》,2005。
附表:
用户
用户编号
被叫时长
主叫时长
总通话
时差
1
230
766
6791
7557
-6025
2
104
1265
6796
8061
-5531
3
108
555
5873
6428
-5318
4
176
1141
6427
7568
-5286
5
228
619
5817
6436
-5198
6
263
212
5277
5489
-5065
7
59
1698
6757
8455
-5059
8
259
1291
6228
7519
-4937
9
255
1789
6653
8442
-4864
10
124
383
5224
5607
-4841
11
82
1208
6020
7228
-4812
12
286
1156
5833
6989
-4677
13
88
1216
5824
7040
-4608
14
128
1146
5749
6895
-4603
15
116
141
4631
4772
-4490
16
39
1012
5328
6340
-4316
17
121
625
4922
5547
-4297
18
297
1617
5908
7525
-4291
19
193
902
5179
6081
-4277
20
180
639
4903
5542
-4264
21
125
1119
5266
6385
-4147
22
187
1154
5276
6430
-4122
23
246
985
5089
6074
-4104
24
284
900
4983
5883
-4083
25
294
442
4499
4941
-4057
26
278
689
4737
5426
-4048
27
282
1178
5098
6276
-3920
28
159
1687
5587
7274
-3900
29
224
933
4771
5704
-3838
30
212
860
4685
5545
-3825
31
76
1218
4936
6154
-3718
32
182
593
4298
4891
-3705
33
58
3294
6980
10274
-3686
34
262
525
4176
4701
-3651
35
111
1825
5452
7277
-3627
36
177
1149
4612
5761
-3463
37
67
2402
5824
8226
-3422
38
77
1227
4591
5818
-3364
39
149
2396
5748
8144
-3352
40
194
1952
5287
7239
-3335
41
63
1103
4425
5528
-3322
42
122
1878
5198
7076
-3320
43
36
1321
4631
5952
-3310
44
236
2342
5646
7988
-3304
45
161
2844
6118
8962
-3274
46
100
535
3790
4325
-3255
47
256
760
4014
4774
-3254
48
258
1891
5124
7015
-3233
49
277
2084
5301
7385
-3217
50
290
1335
4552
5887
-3217
51
72
1714
4930
6644
-3216
52
201
648
3849
4497
-3201
53
74
1445
4637
6082
-3192
54
252
1114
4273
5387
-3159
55
155
314
3391
3705
-3077
56
107
0
3058
3058
-3058
57
114
422
3479
3901
-3057
58
183
400
3435
3835
-3035
59
64
0
2962
2962
-2962
60
157
225
3124
3349
-2899
61
216
797
3674
4471
-2877
62
265
542
3416
3958
-2874
63
238
1414
4277
5691
-2863
64
99
320
3171
3491
-2851
65
181
717
3562
4279
-2845
66
241
1146
3944
5090
-2798
67
81
1554
4340
5894
-2786
68
295
250
3029
3279
-2779
69
254
1633
4376
6009
-2743
70
139
575
3315
3890
-2740
71
299
852
3545
4397
-2693
72
143
1392
4045
5437
-2653
73
184
472
3119
3591
-2647
74
89
176
2809
2985
-2633
75
237
1277
3875
5152
-2598
76
225
422
3019
3441
-2597
77
173
1254
3827
5081
-2573
78
147
830
3380
4210
-2550
79
152
677
3203
3880
-2526
80
57
925
3428
4353
-2503
81
127
2832
5330
8162
-2498
82
171
958
3442
4400
-2484
83
232
941
3406
4347
-2465
84
169
1638
4097
5735
-2459
85
269
854
3295
4149
-2441
86
90
1863
4289
6152
-2426
87
195
1716
4096
5812
-2380
88
267
1479
3850
5329
-2371
89
288
1119
3468
4587
-2349
90
102
1097
3437
4534
-2340
91
234
2218
4531
6749
-2313
92
133
2253
4554
6807
-2301
93
281
1567
3836
5403
-2269
94
214
1352
3615
4967
-2263
95
164
2184
4367
6551
-2183
96
126
2122
4303
6425
-2181
97
106
417
2569
2986
-2152
98
166
2068
4219
6287
-2151
99
235
2487
4631
7118
-2144
100
150
1606
3740
5346
-2134
101
233
2191
4323
6514
-2132
102
242
804
2917
3721
-2113
103
135
762
2851
3613
-2089
104
249
2986
5056
8042
-2070
105
209
2948
5012
7960
-2064
106
197
255
2296
2551
-2041
107
131
1758
3782
5540
-2024
108
203
3045
5047
8092
-2002
109
292
1044
3022
4066
-1978
110
188
2393
4358
6751
-1965
111
270
1195
3111
4306
-1916
112
84
229
2144
2373
-1915
113
65
1948
3834
5782
-1886
114
266
2162
4037
6199
-1875
115
28
2265
4107
6372
-1842
116
273
502
2317
2819
-1815
117
222
1296
3097
4393
-1801
118
153
1494
3247
4741
-1753
119
289
1526
3267
4793
-1741
120
191
2779
4508
7287
-1729
121
274
1875
3574
5449
-1699
122
43
3747
5416
9163
-1669
123
279
2379
4042
6421
-1663
124
31
769
2373
3142
-1604
125
130
2627
4215
6842
-1588
126
25
1668
3221
4889
-1553
127
45
2872
4351
7223
-1479
128
50
2631
4095
6726
-1464
129
287
3503
4956
8459
-1453
130
118
3378
4828
8206
-1450
131
253
2165
3558
5723
-1393
132
210
1040
2417
3457
-1377
133
163
1052
2393
3445
-1341
134
48
1986
3319
5305
-1333
135
178
3683
5015
8698
-1332
136
73
4466
5786
10252
-1320
137
196
1065
2371
3436
-1306
138
85
2720
4008
6728
-1288
139
268
1922
3207
5129
-1285
140
217
3989
5245
9234
-1256
141
283
1653
2901
4554
-1248
142
145
148
1378
1526
-1230
143
248
574
1800
2374
-1226
144
257
1999
3199
5198
-1200
145
298
1655
2846
4501
-1191
146
276
804
1987
2791
-1183
147
175
351
1514
1865
-1163
148
215
3171
4329
7500
-1158
149
29
4449
5590
10039
-1141
150
174
3236
4367
7603
-1131
151
119
3885
5011
8896
-1126
152
250
721
1840
2561
-1119
153
243
744
1842
2586
-1098
154
129
2427
3522
5949
-1095
155
293
1236
2326
3562
-1090
156
151
2491
3569
6060
-1078
157
146
3551
4613
8164
-1062
158
264
2892
3952
6844
-1060
159
296
3358
4416
7774
-1058
160
226
1520
2570
4090
-1050
161
211
946
1967
2913
-1021
162
98
1385
2399
3784
-1014
163
244
3229
4223
7452
-994
164
223
2630
3612
6242
-982
165
105
661
1607
2268
-946
166
227
3753
4697
8450
-944
167
167
4892
5811
10703
-919
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通话 数据 分析