欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    数据仓库与数据挖掘1简介.pptx

    • 资源ID:15122993       资源大小:2.83MB        全文页数:45页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据仓库与数据挖掘1简介.pptx

    1、数据仓库与数据挖掘Data Warehouse and Data Mining,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,2,动机:需要是发明之母,数据爆炸问题自动的数据收集工具和成熟的数据库技术导致大量数据存放在数据库、数据仓库和其它信息存储器中我们正被数据淹没,但却缺乏知识解决办法:数据仓库与数据挖掘数据仓库与联机分析处理(OLAP)从大型数据库的数据中提取有趣的知识(规则,规律性,模式,限制等),3,什么是数据挖掘,数据挖掘(数据库中知识发现)从大型数据库中提取有趣的(非平凡的、蕴涵的、先前未知的且是潜在有用的

    2、)信息或模式其它名称数据库中知识发现(挖掘)(Knowledge discovery in databases,KDD),知识提取(knowledge extraction),数据/模式分析(data/pattern analysis),数据考古(data archeology),数据捕捞(data dredging),信息收获(information harvesting),商务智能(business intelligence)等,4,数据挖掘可能的应用,数据库分析和决策支持市场分析和管理:针对销售(target marketing),顾客关系管理,购物篮分析,交叉销售(cross sell

    3、ing),市场分割(market segmentation)风险分析与管理:预测,顾客关系,改进保险,质量控制,竞争能力分析欺骗检测与管理,5,数据挖掘可能的应用,其它应用文本挖掘(新闻组、email、文档资料)流数据挖掘(Stream data mining)Web挖掘DNA 数据分析,6,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,7,数据挖掘的过程,数据挖掘:KDD的核心,8,数据挖掘的过程,数据挖掘:KDD的核心,兴趣度量和阈值,9,KDD的步骤,学习应用领域相关的先验知识和应用的目标创建目标数据集:数据选择数

    4、据清理和预处理(可能占全部工作的 60%!)数据归约与变换发现有用的特征,维/变量归约,不变量的表示选择数据挖掘函数汇总,分类,回归,关联,聚类,10,KDD的步骤,选择挖掘算法数据挖掘:搜索有趣的模式模式评估和知识表示可视化,变换,删除冗余模式,等发现知识的使用,11,典型的数据挖掘系统结构,知识库,12,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,13,数据挖掘在什么数据上进行,平面文件关系数据库包括面向对象和对象-关系数据库事务(交易)数据库异种数据库和遗产数据库,14,数据挖掘在什么数据上进行,数据仓库,15,

    5、数据挖掘在什么数据上进行,数据仓库,网页,16,数据挖掘在什么数据上进行,数据仓库,输出,清洗装载转换集成,Top tier:前端工具,Middle tier:OLAP server,Bottom tier:数据仓库server,数据,17,数据挖掘在什么数据上进行,多媒体数据库,空间数据库,18,数据挖掘在什么数据上进行,时间序列数据库,19,数据挖掘在什么数据上进行,文本数据库,20,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,21,数据挖掘的功能,概念描述:特征和区分概化,汇总,比较数据特征,如干燥和潮湿的地区关

    6、联(相关和因果关系)多维和单维关联age(X,“20.29”)income(X,“20.29K”)buys(X,“PC”)support=2%,confidence=60%contains(T,“computer”)contains(T,“software”)support=1%,confidence=75%,22,数据挖掘的功能,分类和预测找出描述和识别类或概念的模型(函数),用于将来的预测例如根据气候对国家分类,或根据单位里程的耗油量对汽车分类表示:决策树(decision-tree),分类规则,神经元网络预测:预测某些未知或遗漏的数值,23,数据挖掘的功能,聚类分析类标号(Class l

    7、abel)未知:对数据分组,形成新的类。例如,对房屋分类,找出分布模式聚类原则:最大化类内的相似性,最小化类间的相似性,24,数据挖掘的功能,孤立点(Outlier)分析孤立点:一个数据对象,与数据的一般行为不一致孤立点可以被视为例外,但对于欺骗检测和罕见事件分析,它是相当有用的趋势和演变分析趋势和偏离:回归分析序列模式挖掘,周期性分析基于相似的分析其它基于模式或统计的分析,25,数据挖掘:多学科交叉,DataMining,26,数据挖掘的分类,一般功能描述式数据挖掘预测式数据挖掘不同的角度、不同的分类待挖掘的数据库类型待发现的知识类型所用的技术类型所适合的应用类型,27,数据挖掘从不同角度的

    8、分类,28,数据挖掘从不同角度的分类,所用技术面向数据库的、数据仓库(OLAP)、机器学习、统计学、可视化、神经网络等适合的应用零售、电讯、银行、欺骗分析、DNA 挖掘、股票市场分析、Web 挖掘、Web日志分析等,29,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,30,Web挖掘,Web Mining,Web Usage Mining,Agent Based Approach,Database Approach,智能查询信息过滤/分类个性化Web,多层次数据库 Web查询系统,预处理事务标识模式发现模式分析,Web

    9、Structure Mining,Web Content Mining,31,Web 使用挖掘,Web Usage Mining是在Web数据存储地中应用数据挖掘技术抽取使用模式的方法数据预处理用户使用页面关联、用户分类、用户聚类、应用个性化站点改进,32,文本挖掘,文本挖掘=数据挖掘(应用于文本存储地)+基本语言学文本预处理(无结构数据结构化)词法/语义分析特征生成Bag of Words特征选择频度、TFIDF、共现等数据挖掘文本分类、聚类等分析结果,33,观点、情感挖掘,观点挖掘(Opinion Mining)是一种从论坛、讨论组、新闻组、博客等用户产生的内容中挖掘其表达观点的技术。文本

    10、挖掘与观点挖掘(事实与观点)文本挖掘关注事实,观点挖掘关注用户对事实所持的观点;事实是客观的,观点是主观的;事实只有一个,观点却各不相同。应用商务、网络舆情、,34,数据流挖掘,性质连续性:数据流是连续到达的无序性:系统无法控制数据到达的顺序无界性:数据流原则上是无限大的实时性:要求算法能够实时地反映模式变化,35,数据流挖掘,性质传统的数据挖掘,36,数据流挖掘,性质传统的数据挖掘,37,数据流挖掘,性质传统的数据挖掘,38,数据流挖掘,性质数据流挖掘,?,39,RFID事件流挖掘,Radio Frequency Identification(RFID),Tag,Reader,40,图像分析与挖掘,Web图像,41,社会网络分析,42,不确定性数据挖掘,数据的不确定性原始数据不准确;使用粗粒度数据集合;满足特殊应用目的;处理缺失值;数据集成。不确定性数据管理的框架,43,作业,简述数据挖掘的一些主要方法,并根据你的见解,谈谈数据挖掘技术可能的应用(举例),44,感谢大家光临!,


    注意事项

    本文(数据仓库与数据挖掘1简介.pptx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开