欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    本科毕业设计网络优化中的空间大数据挖掘说明书.docx

    • 资源ID:14715160       资源大小:1.23MB        全文页数:32页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    本科毕业设计网络优化中的空间大数据挖掘说明书.docx

    1、本科毕业设计网络优化中的空间大数据挖掘说明书河 北 工 业 大 学 毕业设计说明书作 者: 李芸 学 号: 112479 学 院: 计算机科学与软件学院 系: 网络工程 题 目: 网络优化中的空间大数据挖掘 技术研究及其应用 指导者: 侯向丹 副教授 评阅者: 2014年 6 月 8日毕业设计(论文)中文摘要网络优化中的空间大数据挖掘技术研究及其应用摘要: 大数据环境下的数据挖掘技术就是一种典型面向现代信息智能应用的技术,首先他可以处理海量的信息,并且还能处理和分析这些数据而且从中找到这些数据中的必然联系,从中发现其联系并且发现对我们研究有用的规律,提取出一些对我们有用的信息,来帮助我们分析数

    2、据。本项目通过讨论数据挖掘技术在移动网络优化中的应用的案例,尝试与数据挖掘算中典型算法相结合,最终达到网络优化的目的。项目主要通过对昆明和惠州经纬度及话务数据分析,提出具体的应用方案,首先根据经纬度利用复杂的社区挖掘算法对基站小区进行分簇,然后使用聚类算法对分好簇的小区进行优化,通过结合两种算法最后将所得的最优分簇以项目实验室的工具BTSVGraph系统结合MapXtreme地理信息系统的形式显示出来,最后通过把不同的簇用不同的颜色进行标注来表示分簇的结果。 利用科学的预测和科学的计算来对移动网络进行优化,不仅可以大幅度地提升网络的整体质量,而且还可以支持网络运行的生产维护管理部门和市场营销部

    3、门所制定的决策,为运营商带来良好的经济效益。关键词:数据挖掘 网络优化 聚类算法 复杂社区挖掘毕业设计(论文)外文摘要Title Spatial Data Mining Technology and Its Application in Network Optimization Abstract Data mining technology in the data environment is a typical oriented modern information intelligent application of technology, first of all, he can dea

    4、l with massive information, and but also the processing and analysis of these data and find the data in the inevitable contact, from found the contact and found that for us to study the useful rules and extract the information that is useful to us, to help us analyze the data.The project by discussi

    5、ng the application of data mining technology in the mobile network optimization case, try to data mining algorithm is a classic algorithm in combination, and ultimately to achieve the ultimate goal of network optimization. Mainly adopts the combination of Kunming and Huizhou latitude and longitude,

    6、and traffic data, two concrete application scheme are proposed, one is according to the latitude and longitude of the complex community mining algorithm of base station cell cluster, another is using clustering algorithm for binary group cell is optimized, combined with two kinds of algorithm finall

    7、y obtained the optimal grouping displayed in map form, finally, through the different clusters with different color mark to represent the result of clustering.The scientific prediction and calculation is used to optimize the mobile network, not only can greatly enhance the overall quality of the net

    8、work, but also can support network to run production maintenance management department and marketing department made the decision, for operators to bring good economic benefits.Data mining technology in large data environment is a typical technology for modern information intelligence application.Ke

    9、ywords:Data mining Network optimization Clustering algorithm for complex Community mining1 引言移动网络的结构、用户数据、话务数据在移动网络中都具有带有很强的地理分布的属性,并且在国内的三大运营商之前的竞争也十分激烈,通过这些分布在移动网络中的数据来分析其空间分布的特征和地理分布属性,并且能够为我们的移动网络优化工作来提供强大的数据方面的服务。我们可以根据这些大量的数据得到其分布的规律,从而为我们的用户来提供好得服务1。然而目前的网络优化工作仅仅依赖熟练的技术工程师的个人经验来完成时显然不能满足实施工程中

    10、巨大的工作量的。因此面对如此庞大的数据分析,我们必需采用数据挖掘技术来减少技术工程师的工作量,我们可以通过空间聚类和关联分析等方法,来分析在广大的移动网络中的各个网络结构的地理分布特点,完成相关性质的聚类,实现其网络质量的优化,为此需要通过实现相应的分区和社区聚类算法来模拟真实网络环境的分布特点2。1.1 研究背景与意义众所周知,中国在移动网络上的发展已经远远超过世界一些其他的国家,并且其发展速度也是非常惊人,作为人口大国,我们拥有着世界上最大的包含GSM和CDMA网的移动通信网,经过长时间的发展,网络运营商的工作模式已经不单单指向网络建设,在网络的长期高速地变化更新的过程中,网络建设越来越成

    11、熟,我们越来越依赖网络的维护服务,而不是网络建设4。运营商也在把工作重点转向网络管理,越来越多的人对移动网络的要求不断提高,这就使得网络维护网络管理成为运营商的一项工作重点了3。在移动网络中,它的一个非常显著的特点就是具有非常多的未知的不确定因素,这些会对移动通信网络在一定程度上有非常巨大的影响。在网络建设日益成熟的现在,我们单单只依靠建设,把建设放在重点的位置显然不能满足高速发展的网络优化流程,网络工程师的数量毕竟不是无限的,我们倘若仅仅依赖工程师无法实现我们网络优化的科技化,现代化,产业化4。而且,近些年来,移动网络用户的数量在显著增长,随着移动网络的容量在日益在增加,我们就会有越来越多的

    12、数据需要处理,从而导致移动网络的复杂度也在不断提升,并且现在移动网络专业设备的飞速更新,造成仅仅依靠现有的移动网络通信质量已经不能满足用户的需求,需要提高我们的网络质量和整体的业务水平就要求我们采取必要的优化措施,当然,由于其数据量的庞大,这给我们对移动移动网络的优化的工作带来了很大的难题,工作难度也是显著地增加,移动网络优化的方法和手段都亟待我们的创新,赋予它们新的生命力。不断的用新技术新方法进行网络优化已经是当代的大趋势,尤其在大数据的热潮不断高涨下,其必要性也逐渐显现出来,其地位和作用对网络的运行维护、网络维护、网络规划等将会有重要的积极意义5。移动网络优化的目的就是在于为了提高网络用户

    13、的对移动网络质量的满意度。当网络质量急剧下降或是话务关键指标无法满足要求时,我们要尽快对网络进行优化。众多不确定因素都会对无线网络造成重大影响,并且运营商也可能推出新业务或变更服务种类,这些因素都会造成业务流量的变化6。因此,尽管网络建设时期的规划工程师会尽量考虑影响网络性能的方方面面,但是毕竟规划不能解决全部问题。网络优化是一个需要长期钻研研究的过程,不能仅仅依赖现有的技术,亟待创新更多的新技术新方法来适应我们高速发展的网络优化全过程。也就是说网络质量改进与发展贯穿在网络运营的全过程7。众所周知,我们已经步入到了大数据的时代,假如可以把云计算技术比作是一个超大的容器,那么大数据正是其中存放在

    14、这个容器中的水,大数据是要依靠云计算技术来进行存储和计算的。那么到底何谓是“大数据”呢?所谓“大数据”就是得需要利用一些新的处理方式来处理才会具有的更加强大的决策的能力、洞察发现的能力和对整个过程的优化能力的含量、较高的增长比率和比较多样化的信息资产的分析能力8。大数据技术具有的作用是不容小觑的,它不但可以掌控庞大的信息数据,而且还能够对这些庞大的信息数据进行专业化的处理,来得到所需要的结论分析。换一种说法,倘若我们把大数据行业比作是一种产业,那么可以令这种产业盈利的重点,便是在提高对待处理信息数据得“加工的能力”,我们通过一步步的“加工”来实现对信息数据的“增值”9。大数据只是数据挖掘技术的

    15、出现的一个必然的条件。数据挖掘技术则是需要一定的人工智能知识、数据库知识、机器学习语言和统计分析的知识等很多跨学科的范围很广的知识统一相结合的技术。而且数据挖掘技术的出现也需要对海量的数据、计算机技术对大数据量处理的能力、计算机存储与运算的能力、交叉学科发展这四方面的条件缺一不可。显示生活中我们的周围充斥着大量的、无序的的数据中,而且这些数据中还会存在着这样那样的信息干扰,使得我们无法直接通过数据得到自己所需要的关键信息,数据挖掘技术就可以帮助我们提取隐含在其中的并且对人们的生产生活具有重大意义的数据,这个定义使得我们明白了我们所要挖掘的数据必须是来源于真实世界的,并不是我们随意编写的,它必须

    16、要包含巨大的信息量,并且还要包含影响我们直接利用数据的噪声信息;对于我们经过挖掘后发现的数据必须是我们可以理解的且能够在自身的实际和生活中实际运用的,通常我们是针对于某个特定的问题才会对大量的数据进行挖掘,因此我们发现的结论并不是适合与一切场景的,必须是针对与特定的问题10。移动网络优化中所涉及到的技术领域是非常非常的多的,比如话务统计分析、切换、交换技术、信令、频率配置和无线技术等等,移动网络优化是一项波及范围广、难度很大、对工作人员的素质有很高的要求的工作11。不仅如此,于此同时,移动网络中的新功能不断地被应用,网络用户的数量也在连续不断地增加,许多设备的多样化,都对要求网络优化的工作人员

    17、的专业技能得到快速地提高。随着科技的进一步发展,网络的覆盖率进一步的提高,我国的移动通信网络也进入了迅速发展的时代,而且随着智能手机的普及,使得我国的移动网络进入全民化时代,网络结构在日益地复杂,并且移动网络用户的数量也在不断的增加,大量的移动数据的业务已经占据了移动网络行业中的主要业务,还仅仅依靠人力来进行数据的分析和网络的优化显然是一种很大地浪费,并且网络优化的自动化程度低还存在一定程度上的局限性。就现如今的网络情况分析,其具有数据业务速率变化迅速、网络吞吐量巨大以及覆盖范围的动态实时变化等特点,这就决定了我们的移动网络的规划和优化模型,针对这些特性,在网络优化领域引入对大数据的挖掘技术非

    18、常有必要。对于大数据的认识和研究技术现在只是初期阶段,各种技术相对不太成熟,目前国内由三大运营商根据自身业务积极推动者大数据的应用工作。可以看出在网络优化问题上应用大数据的数据挖掘技术显然已经成为了发展的主流趋势。这就要求我们要对存在于移动网络中的大量信息数据进行挖掘和将优化判别算法有机的结合在一起,通过对数据的提取和分析,给出网络优化的合理的解决方案。12 研究现状及趋势目前,移动通信中的网络优化是移动通信行业发展的重头戏。通信是移动通信的最终目标,它是在商业市场中一种极为有效的方式,具有非常巨大的潜力。移动网络通信技术并是一项崭新的新技术,但在最近这些年却得到了非常迅速发展。随着网络通信用

    19、户数量的增加,移动电话业务日益变得复杂和灵活,使得网络通信网络的规模、结构逐渐地朝协议的多功能、多层次的方向迅猛发展12。随着市场竞争的加剧,网络用户对通信质量要求正在逐渐地增加,现在的许多企业都将提高网络的性能和网络服务的质量作为自己企业增强核心竞争力的首要条件,许多公司为了能够提高设备的利用率以及降低运营的成本,都会加大在网络优化方面的投入力度,这样就可以利用现有的网络设备资源来得到最好的企业效益。由于外界因素的变化,也时刻影响着移动网络中的无线环境,这使CDMA网络出现动态不平衡的状况,从而进一步深化和完善,网络优化是不可忽略的,也是不可避免的。目前在中国两个最大的移动运营商,已形成了一

    20、套相对比较标准化的网络优化的流程,并且优质的网络也是保证系统能够稳定运行的基础,保证了移动通信网络优化的日常工作13。国外在此方面的研究大部分都是将其和各个学科联系起来,使好多问题得到了解决,另外在实用方面上有不少软件的产品,可见此项技术被应用到社会的各个相关领域中的,并且也都取得了相对不错的成果。相对国外计算机发展的时间,我国进入二十一世纪才开始进入信息化时代,所以我国对于数据挖掘的研究起步较晚,还没能像国外技术那样,有一个整体力量。况且现在我国的移动网络技术也在飞速发展阶段,无法系鞥称一个相对稳定的环境来提供给网络优化、管理和规划,只是追求于网络发展的速度,从而使得我国的网络运营整体的质量

    21、、工作的效率以及服务的水平都与国外有着很大差距。面对人口如此众多中国,我们的网络结果非常需要一个稳定的时间来实现优化和调整,但是对于如此庞大的网络系统来优化,仅仅依靠人工来统计和利用经验进行优化,由于起效率过低和存在差异性问题,都不符合用来进行网络优化。可见将大数据的数据挖掘技术与网络优化结合的事非常有必要,这样就可以利用数据挖掘技术的技术对庞大的网络系统进行高速自动化的网络优化,真正提高网络优化的效率。13 课题研究的基本内容对于当前的2/3/4G移动通信网络,我们可以看出其网络结构、话务数据和用户数据都具有一定的地理分布特点,因此我们可以利用这些空间分布的特征来更好的实现网络维护和优化14

    22、。本课题是研究网络空间中的大数据挖掘技术与应用,顾名思义就是对数据量较大的网络进行数据处理,因此我们的研究主要也是分为两部分,一部分是对数据挖掘中的各种主要算法进行研究,并且对用到的聚类算法进行进一步的研究,另一部分就是把我们移动网络中的具体数据利用社区复杂算法中的一种(Newman算法)来对基站小区进行分簇,这个算法是在众多复杂网络社区发现方法中,相对典型的并且也是具有代表性的一个。能够处理大规模的网络信息,分组效果也比较理想。最后通过数据优化结果簇,把分好组的结果以图形的形式显示出来,呈现出分布的不同小区。以下是网络优化中主要用到的知识以及研究的基本内容:1.基站的聚类每个基站都有自己经纬

    23、度,并且在其跟周围的基站之间的距离中挑出离它最近的k个,k可以是3、4等等。从k个距离取第k个近的或者把k个基站之间的距离做个平均,这就是k-dist距离。我的工作要做的便是对k-dist距离进行聚类。就是把距离上比较接近,属性比较相近的对象聚在一起,属性就是k-dist的值,其核心是聚类。这里以移动通信网络中的基站为对象,根据基站地理位置数据(经纬度),计算基站站间距(如k-dist距离);采用基于密度的空间聚类算法(如ADBSC),根据基站站间距,将地理位置相近、k-dist类似的基站归并到同组,实现基站空间聚类,保证同组内基站间站间距接近,实现按照基站空间分布疏密程度划分网络覆盖区域。以

    24、移动通信网络中小区为对象,以小区间邻区、切换关系、干扰关系作为小区间相关性衡量指标;根据小区间相关性,采用完全子图发现、复杂网络社区结构发现等空间分析算法,将网络中全部小区分簇,使得同一簇内的小区地理位置相近、相互间相关性较强。2.完全子图发现和社区结构发现的空间分析算法。基站属于一个一个的小区,小区指的是一个基站在它所覆盖的范围,并且每个小区都有自己独立的小区编号,一般一个基站属于三个小区,小区之间是有相互关系的,包含小区间邻区、切换关系、干扰关系等等。一个小区可以有多个相邻小区。邻区的关系不光表现在地理上,还有一些学科的指标。有一些运营商在网络维护上定义一些关系,只要这两个小区有了邻区关系

    25、之后,从一个小区走到另一个小区不会掉话。在实际网络中,少的小区有四五十个,多的一百多个。把它放在图的模型中,点则是对应小区,小区之间有邻区关系就有一条边。其一,可以找完全子图。完全子图即在图中结点之间相互之间都有边就是完全子图,完全子图把小区分成簇,这是一种找的方法,还有一种就是其二,在图中,图上有很多个顶点,顶点之间有边,把相互之间连接比较紧密,边比较多的顶点聚在一起。把小区当做顶点,边则体现在邻区等关系上,这是一种动态关系,把联系紧密的小区放在一起,技术上参考复杂网络挖掘,通过搜集一些社区挖掘算法,实现这一功能,并且要求算法的复杂度要小于等于。3.算法呈现把基站的聚类这一算法呈现出来可以有

    26、多种方法,包括可以使用MapXtreme地理信息系统,XX地图或者excel表之类的形式将数据呈现成图形的形式。可以通过搜集XX一些资料可以找到XX地图使用的接口,将程序导出的数据放在excel表中,再把其呈现在XX地图中。也可以直接将计算好的数据导入excel中并把其方位角等属性通过不同颜色呈现出来。如果呈现出来的图像不平滑要将其修改变得平滑。2 移动网络优化与数据挖掘 21 移动通信网络优化显然,网络优化工作就是一个贯穿于网络的发展的始终而且相对比较复杂的过程,在我们日常的优化工作过程中,在很多情况下,我们都还是仅仅只是依靠话务统计的数据、路测的数据和用户的反映来发现网络优化中遇到的问题。

    27、我们也不能够否定移动通信网的日常的维护和网络优化得工作的的确确也是要靠一批优秀的有经验的优化工程师来完成,但是网络优化工程师的数量在实际中毕竟是有限的而且部分的流程已经规范化的优化工作有时候也并不一定必须需要优化工程师的参与,我们可以借助一些集成化和智能化的工具来完成,从而减少工程师的参与,实现智能化15。2.1.1网络优化技术在我国主要采取的是技术措施来实现移动通信网络的优化,通过推动中国移动、中国联通、中国电信三大运营商的技术来提高通信服务的质量。我们将此工作划分为三个大的基础模块,它们分别是:无线网优化模块、核心网优化模块和传输网优化模块,由于传输网和核心网在实际中的网元并不多,并且它的

    28、运行环境也是相对比较稳定的,所以移动通信网络优化的工作重心就是无线网优化,所以可以将移动通信网络的优化近似地看为无线网络的优化。2.1.2 网络优化主要内容与步骤对于网络的优化主要是对现有的GSM网络进行数据采集和分析,并可以通过技术和工程的手段调剂其参数、天线、网络配置和网络路由,通过调整使网络优化得到提高,发挥其最大的作痛,给企业带来更多的效益,为用户提供更加优质的服务。一般将网络优化最为一个实际的项目来运作,通常分为三个阶段加以实施。1收集数据和熟悉网络阶段尽可能的熟悉网络是第一个阶段的工作重点,在这一阶段中,需要找到问题的所在,给问题整体定位。从而也可以更好的开展第二个阶段的工作。在这

    29、一阶段的主要工作就是找到需求的所在,与客户进行沟通,了解客户的需求从而为整个优化过程找到入手点。还有就是把需要的数据导入到所应用的工具中,包括基站的信息表,其中必须要有的是经纬度,倾角等等主要信息。把这些信息收集好之后,导入到分析软件中,来准备进行下一步分析处理。还有一个方面就是需要锁定 TOP-10 最差小区。对于小区的参数分析,需要提前对目前的参数设置的情况进行下了解,然后再要标出异常的参数设置,与运营商进行沟通。还要从用户的角度熟练掌握网络的质量,为下一阶段提高用户的满意程度作好准备。总而言之,第一个阶段的主要目标是收集完成基础数据,完成摸底的路测,完成参数的审核,为第二阶段工作埋下伏笔

    30、。 2调整网络与执行优化阶段在调整移动网络与执行优化阶段的问题主要是解决如下几个方面:解决掉话、信号等问题;解决用户投诉的主要问题,有一些不能通过网络优化来解决的问题,做出详细的设计计划及原因分析;提高网络中统计的KPI 指标。第二阶段,需要启用设备新功能必须把上述的问题解决好,而且根据网络的实际情况,在第二阶段的优化过程中,对专门的问题有专题进行优化。形成一个专题优化报告,为以后解决这个问题的工程留下材料,有据可查。3保持性能和总结优化阶段在以上两个阶段中,网络性能会有显著的提高,这种提高也是有限的,到底可以到达什么程度,需要看网络的基础。调整网络与执行优化阶段的工作已经让网络性能达到它应该

    31、有的最好的状态。保持性能和总结优化则就是要一直保持着这种状态,于此同时也要进入整个项目执行的总结阶段,第三个阶段就是对前两个阶段的概括和总结,使网络优化性能保持良好。2. 2 数据挖掘技术2.2.1 数据挖掘技术概述 所谓的数据挖掘技术就是根据个人和企业的需要,从大型的数据库经过提取和分析,从而得到有价值的可以被利用的信息的数据分析技术,我们可以根据得出的数据信息,来指导一些商业的行为或者是可以为一些科学研究提供参考价值。它的产生是由于近些年来信息化的进程进一步加快,信息处于大爆炸时代,大量的信息需要我们去了解,但是由于这些杂乱的信息导致我们无法准确提取有用信息,它事数据库研究中的一个新领域,

    32、可以个各个学科进行结合,所以也适用于各个领域。作为计算机领头军的IBM公司就率先开发了一个名叫“智能挖掘机”的应用工具16。2.2.2 数据挖掘常用聚类算法介绍1 聚类算法聚类分析就是将一些实际的或者是抽象的对象集合在一起,根据每个对象的某些性质是否类似来判断能否将其归为一类的分析过程,这是一种重要的人类分析行为。此系统所用到的就是最短距离聚类法,根据个体的数据点在几何空间上的距离来判断是否能够归为一类。例如系统中的最短距离聚类法,开始先将所有的小区按照社区分区算法进行分区,会得到许多分区的小区集合,但是总会有难以判断的小区被孤立出来,还有好多处于边缘的点无法进行分区,这就需要对其通过聚类算法得到应该划分的小区,由于小区都是具体的经纬度,这就需要计算两个点之间的球面距离,来计算出当前距离当前小区最近的几个小区号,从而实现了聚类算法。每个基站都有自己经纬度,并且在其跟周围的基站之间的距离中挑出离它最近的k个,k可以是3、4等等。从k个距离取第k个近的或者把k个基站之间的距离做个平均,这就是k-dist距离。本项目


    注意事项

    本文(本科毕业设计网络优化中的空间大数据挖掘说明书.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开