BW基本知识.docx
- 文档编号:3813664
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:32
- 大小:493.46KB
BW基本知识.docx
《BW基本知识.docx》由会员分享,可在线阅读,更多相关《BW基本知识.docx(32页珍藏版)》请在冰点文库上搜索。
BW基本知识
1基本概念
1.1BEx
ShortforBusinessExplorer.Itincludesfollowingtoolstopresentthereportstoenduser:
Analyzer /WebApplicationDesigner/ReportDesigner/WebAnalyzer.
1.2InfoProvider
InfoProvider,信息提供者。
在创建qury之前,我们需要指定一个InfoProvider。
这个InfoProvider主要是为当前所要创建的报表提供数据来源。
在query中,一般作为的InfoProvider的对象为:
InfoCubes、DataStoreObjects、InfoObject(这里仅仅指的是特征)。
除了这些物理存储对象外,它还可以为:
InfoSets、VirtualProviders、Multiproviders等逻辑视图物理存储类型的存储对象。
然而,在wad的创建中,提供数据的InfoProvider为我们创建的query。
在wad中,可以将多个query作为提供者。
例如:
对于报表,我可以将queryA1作为提供者,然而对于图表我可以把queryB1作为提供者。
但是query的提供者有且仅有一个。
1.3INFOOBJECT信息对象/CHARACTERISTICS特征/KEYFIGURE关键值
infoobject
特征跟关键值合并起来称之为信息对象。
在BI中,项目定义、工作分解结构(WBS要素)、计量单位、日期等都称之为特征(characteristic);例如电压等级、承建单位等都称之为属性(当然,这些也是特征);
每个项目产生的各种金额,如:
可研估算、初设概算、下达预算、实际成本等都称之为:
关键值(keyfigure)。
1.4INFOOBJECT的命名规则
SAP在BCT(BUSINESSCONTENT)中自带一些InfoObjects,这些标准INFOOBJECTS的技术名称则是以’0’开头,如果自定义的,技术名称则必须以’A~Z’开头,长度3~9个字符。
1.5信息范围
所谓的信息范围,我们可以理解为类似目录的文件夹。
信息范围的好处就是来管理我们创建的各种对象。
InfoAreasareusedtoorganizeInfoCubesandInfoObjects.EachInfoCubeisassignedtoanInfoArea.ThroughanInfoObjectCatalog,eachInfoObjectisassignedtoanInfoAreaaswell.Themaximumnumberofcharactersallowedforthetechnicalnameis30.
1.6ODS
数据存储对象
ODS对象没有使用到星形结构模型,仍旧跟普通的二维表没有什么区别。
在ODS级别的数据都是比较的明细。
ODSisaBWarchitecturalcomponentlocatedbetweenPSAandInfoCubesthatallowsBExreporting.Itisnotbasedonthestarschemaandisusedprimarilyfordetailreporting,ratherthanfordimensionalanalysis.ODSobjectsdonotaggregatedataasInfoCubesdo.Instead,dataareloadedintoanODSobjectbyinsertingnewrecords,updatingexistingrecords,ordeletingoldrecords,asspecifiedbythe0RECORDMODEvalue.
ReferenceDSO.
1.7INFOCUB(信息块)
AnInfoCubeisafacttableanditsassociateddimensiontablesinthestarschema.Themaximumnumberofcharactersallowedforthetechnicalnameis30.
一般CUBE所包含的内容如下图所示:
每一个cube都有一个FACTTABLE和最多16张维度表;每一个FACTTABLE又可以容纳233个关键值对象;每个维度表又包含248个自由特征。
Cube不同与一般的普通表,其实cube就是一张多维表,能够容纳海量数据。
这些就是cube的最基本的一些特征。
此处描述的都是cube的一些基本组成部分以及基本特征,至于具体的cube创建操作步骤大家可以参考以下的小节内容。
关于一些详细概念,大家可以到星形结构讲解单元了解。
其实,整个星形结构又是由这些基本内容搭建而成的。
信息立方体在SAPBW中是一个多维信息模型。
分析报表就是基于这些多维度。
1.8ods与cube之间的区别
最主要的一个区别在于cube数据的存储量大于ods;二者的表结构也是不同的,前者是二维表,后者是多维。
正是后者的多维,才真正的体现了数据仓库多维度分析的优势等等。
1.9Facttables
TheFacttableisthecentraltableoftheInfoCube.Herekeyfigures&pointerstothedimensiontablesarestored.Therearetwofacttables:
theF-facttableandtheE-facttable.IfyouuploaddataintoanInfoCube,itisalwayswrittenintotheF-facttable.Ifyoucompressthedata,thedataisshiftedfromtheF-facttabletotheE-facttable.TheF-facttablesforaggregatesarealwaysempty,sinceaggregatesarecompressedautomatically.Afterachangerun,theF-facttablecanhaveentriesaswellaswhenyouusethefunctionality'donotcompressrequests'forAggregates.
E-facttableisoptimizedforReading=>goodforQueries.F-facttableisoptimizedforWriting=>goodforLoads
1.10Freecharacteristic
Afreecharacteristicisacharacteristicinaqueryusedfordrill-downs.Itisnotdisplayedintheinitialresultofaqueryrun.
1.11filter
Filterisusedtorestrictdatatoacertainbusinesssector,productgroup,ortimeperiod.Andthesecanbesavedandreusedintheinothercontexts. Herethedataisfilteredandshowedintheintialresultofthequery.
1.12ETTL
ETTL,oneofthemostchallengingtasksinbuildingadatawarehouse,istheprocessofextracting,transforming,transferring,andloadingdatacorrectlyandquickly.AlsoknownasETL.
ETL是数据抽取(Extract)、转换(Transform)、加载(Load)的简写,它是指:
将OLTP系统中的数据抽取出来,并将不同数据源的数据进行转换和整合,得出一致性的数据,然后加载到数据仓库中。
在这一转换过程中,我们就完成了对数据格式的更正、对数据字段的合并、以及新增指标的计算三项操作。
类似地,我们也可以根据其他需求,完善数据仓库中的数据。
简而言之,通过ETL,我们可以基于源系统中的数据来生成数据仓库。
ETL为我们搭建了OLTP系统和OLAP系统之间的桥梁。
在模型搭建的过程中,数据抽取部分占整个过程的60%。
ETL包含了TRDATA(业务数据)的加载以及MASTERDATA(主数据的加载)。
做数据仓库系统,ETL是关键的一环。
说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具。
其实ETL过程就是数据流动的过程,从不同的数据源流向不同的目标数据。
但在数据仓库中,ETL有几个特点,一是数据同步,它不是一次性倒完数据就拉到,它是经常性的活动,按照固定周期运行的,甚至现在还有人提出了实时ETL的概念。
二是数据量,一般都是巨大的,值得你将数据流动的过程拆分成E、T和L。
探求ETL本质之一:
ETL的过程就是数据流动的过程,从不同异构数据源流向统一的目标数据。
其间,数据的抽取、清洗、转换和装载形成串行或并行的过程。
ETL的核心还是在于T这个过程,也就是转换,而抽取和装载一般可以作为转换的输入和输出。
ExtractionStructure
Thedatastructureusedbytheextractionprogramtoextractdata.ItsfieldsaremappedtothefieldsoftheSAPSourceSystemDataSource.
通过图我们就可以大概了解到,cube、ods、datasource之间都是通过tr来关联的。
如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。
在整个项目中最难部分是用户需求分析和模型设计,而ETL规则设计和实施规则则是工作量最大的,约占整个项目的60%~80%。
1.13数据加载的配置
从这个图示上也能够展示出来关于这个数据加载的方法。
在ecc系统源(数据源)到DATASOURCE之间存在一个INFOPACKAGE,在datasource到ods之间存在一个dtp(datatransferprocess),其中数据在传输的过程中都会按照之前我们创建的传输规则。
在此我们应该注意到的一点是,一个数据流程可以有多个dtp,但是只能有且只有一个infopackage。
这里显示的datasource
正如它的名字一样。
当我们通过infopackage将数据从ecc把数据抽去到bw的时候,它自动就把数据放置到了psa,然后再通过dtp把数据加载到目标对象中去。
1.14Infoobject抽取
除了可以把数据抽取到指定的CUBE以及ODS中,其实我们也可以对INFOOBJECT进行数据的抽取,此时我们抽取的就是所谓的主数据,之前我们说过,INFOOBJECT-CHARACTERISTICS是由属性、文本、层次结构组成,我们可以对INFOOBJECT-CHARACTERISTICS创建一个INFPACKAGE来对属性、文本、层次结构等主数据进行抽取放置到INFOOBJECT-CHARACTERISTICS中去。
这就是我们所说的纬度表。
由于业务数据跟主数据是通过SID这张表中的ID来关联的换句话说就是在事实表中保存的主数据只是一些ID,系统是通过这些ID去查找对象的主数据的内容:
就是我们之前说的属性、文本、层次结构,所以这就真正的实现了纬度表在数据仓库中的共享。
1.15DataSource数据源
ADataSourceisnotonlyastructureinwhichsourcesystemfieldsarelogicallygroupedtogether,butalsoanobjectthatcontainsETTL-relatedinformation.FourtypesofDataSourcesexist:
∙DataSourcesfortransactiondata
∙DataSourcesforcharacteristicattributes
∙DataSourcesforcharacteristictexts
∙DataSourcesforcharacteristichierarchies
IfthesourcesystemisR/3,replicatingDataSourcesfromasourcesystemwillcreateidenticalDataSourcestructuresintheBWsystem.ThemaximumnumberofcharactersallowedforaDataSource'stechnicalnameis32.
1.16InfoSource信息源
AnInfoSourceisastructureinwhichInfoObjectsarelogicallygroupedtogether.InfoCubesandcharacteristicsinteractwithInfoSourcestogetsourcesystemdata.Themaximumnumberofcharactersallowedforthetechnicalnameis32.InBW3.5itisaMUSTandinBI7.0itisoptional.
1.17InfoPackage信息包
AnInfoPackagespecifieswhenandhowtoloaddatafromagivensourcesystem.BWgeneratesa30-digitcodestartingwithZPAKasanInfoPackage'stechnicalname.
1.18MetadataRepository 元数据仓库
MetadatarepositorycontainsinformationaboutthemetadataobjectsofSAPNetWeaverBusinessIntelligence,importantobjectpropertiesandtheirrelationshipswithotherobjects.Metadatacontainsdataaboutdata.
1.19PSA
ThePersistentStagingArea(PSA)isadatastagingareainBW.Itallowsustocheckdatainanintermediatelocation,beforethedataaresenttoitsdestinationsinBW.
1.20Query查询
ABWqueryisaselectionofcharacteristicsandkeyfiguresfortheanalysisofthedatainanInfoCube.AqueryreferstoonlyoneInfoCube,anditsresultispresentedinaBExExcelsheet.Themaximumnumberofcharactersallowedforthetechnicalnameis30.
1.21Systemlandscape
Thesystemlandscapespecifiestheroleofeachsystemandthepathsusedintransportingobjectsamongthevarioussystems.
1.22导航属性
在BI中,属性分为如下两种类型:
显示、导航。
所谓的属性在单独看来其实还是信息对象。
每个特征都可以包含:
主数据、属性、层级。
例如:
特征A、特征B。
如果我将特征A放置到特征B的属性中去,那么特征A就叫做特征B的属性。
一般默认的情况下,所有的属性都是显示属性。
所谓的显示属性就是在报表开发的过程中仅仅用来显示,并没有其他的下钻的功能,仅仅是为了来描述它对应的特征对象而以。
此外,关键值也是可以作为属性来使用的。
前提是这个关键值的变化频率要低。
1.23“维”的概念
维是人们观察客观世界的角度,是一种高层次的类型划分。
维:
一般包含着层次关系,这种层次关系有时会相当复杂。
通过把一个实体的多项重要的属性定义为多个维(dimension),使用用户能对不同维上的数据进行比较。
因此OLAP也可以说是多维数据分析工具的集合。
但是定义维度的时候我们也应该考虑到效率的问题,一般每个cube中的维度最好保持在5~9个之间,否则查询的速度也会相应的慢下来。
每个维度中的特征我们也是最好保持在一个最佳的状态,这些都是会影响到整个报表的速度。
具体的我们会在星状结构模型处做详细的解释。
其实,我们平时见到的普通的表也称得上是维度表,只是它是二维表,即由横坐标和纵坐标来控制。
具体的我们可以参考下边图示所列举的。
如上图所示的,这个就是我们一般的表分析的结果。
仅仅根据季度来分析不同地区的金额分布情况。
与下边的图例比较起来我们就会发现一般的表与星形结构表的区别。
其中维度就是星形结构的一个重要部分。
如图中所示的:
黄色的部分代表季度、绿色的部分代表地区、红色的部分代表公司。
这三种颜色分别代表不同的维度。
假如这是一个销售组织,那么我就可以根据三个维度来分析在不同的季度、不同的地区、不同的单位的具体的经营情况。
这样就比一般的表分析的到位。
这些就体现了维的好处与作用。
维度不仅仅可以划分为3维,目前,我们可以分析到16维。
但是维度一般控制在5~9时最佳的状态。
作为开发的我们应该明白,表与表关联在查询的时候是非查的耗时的。
本身数据仓库的数据就是海量的,在加上过多的关联,那么执行的效率是非常的低的。
1.24钻取
OLAP的基本多纬度分析操作有钻取、切片、和切块以及旋转等。
钻取是改变维的层次,变换分析的粒度。
包括:
上钻/下钻。
上钻又称为:
上卷或者移出下溯,是在某一纬度上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而下钻相反。
1.25切片
切片和切块:
切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。
如果剩余的维只有两个,则是切片;如果有三个则是切块。
旋转是变换维的方向,即在表格中重新安排维的放置(例如行列交互)。
1.26术语表
2图标介绍
2.1QuerydesignerToolBar介绍
NewQuery
:
这个功能,你可以用来定义一个新的query。
OpenQuery
:
如果你想打开一个存在的query,就选择这个功能。
SaveQuery
:
使用这个功能,你可以保存你的query。
Execute
:
如果你想通过portal来显示你的报表,你可以选择此功能按钮。
CheckQuery
:
这个功能将对你的报表执行一个有效性的检查并且告知你任何关于报表的错误信息。
:
如果你想改变报表的描述或为报表的结果显示状态、显示操作、数字显示、关键日期等做设置。
Cut
:
你可以使用这个功能移除一个query已存在的对象插入到该query的其他的区域中。
<这只能是对本报表范围使用,不能将一个报表的对象cut后到其他的报表中>
COPY
:
你使用这个功能在本报表范围内做对象的复制。
跟cut的要求一样,只能限制在某个具体的报表中,不能跨报表进行复制/剪切粘贴
Insert
:
这个功能按钮用来将剪切或者复制的对象插入到本报表的某个区域内使用。
InfoProvider
:
这个功能是用来打开信息提供者信息的界面的。
Filter
:
这个功能将打开过滤器面板,进行过滤设置。
Rows/Coumns
:
query开发中行和列开发的界面。
TableView
:
这个功能在BW7.0中已经不存在,但是在视图菜单下我们可以对预定义、标准工具栏进行设置。
主要是更改我们开发界面的样式。
关于这个按钮的具体的作用就在不在做详细的解释。
Cells
:
这个功能仅仅对报表含有两个结构的有效。
你可以直接定义公式或选择条件对这些单元格。
通过这种方式,你可以控制在结构组建出现交集的时候单元格值的显示。
这个功能也允许你进入个别报的表单元格或者给这些分配特殊的值。
关于此控件的使用,我会在讲解相关的报表的时候提到。
Conditions
:
Youusethisfunctiontodefineconditionsforaquery.Foreachcharacteristic,youcangivelimitconditionstothekeyfigurevaluesinordertodetermine,forexample,allsalesrevenuesaboveorbelowaspecifiedthresholdvalue.Thechosencharacteristicsaredisplayedinthequerywithrestrictedkeyfigures.
Exceptions
:
你可以使用这个功能对与每个报表。
Exceptionsaredeviationsfromnormalkeyfigurevalues,asdefinedbyyou。
Andarehighlightedincolorinthequeryview。
TechnicalNmae
:
这个是用来设置对象的在报表开发中显示方式。
如:
仅仅显示技术名称、仅仅显示文本、技术名称+文本、文本+技术名称。
以上都是一些常见的,至于其他的自己可以尝试一下。
工具栏中的功能在菜单中同样可以找到,这里我就不在对菜单进行详细的介绍。
注释:
报表中的功能按钮同样可以使用键盘的快捷键来操作,如:
保存,CTRL+S。
2.2基础模型搭建图标(RSA1)
2.2.1一般常用按钮图表
:
这个图片是是后退按钮,当你
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BW 基本知识