数据存储

数据存储方式

数据存储层包括数据仓库组件和复值/传播组件。数据仓库组件定义了信息的逻辑和物理存储。复制和传播组件从企业数据仓库中存储的数据创建从属的数据集市。
数据仓库是面向主题的、集成的、非易失的且随时间变化的数据集合。
数据仓库是按照企业整体的信息模型、尽可能以最小的业务单元来组织并存储数据。这样既能保证数据访问的灵活性,又可保证最少量的数据冗余。
在数据仓库的实施过程中,对于某些主题的业务分析问题,可能会按照主题采用数据集市的方式对数据进一步的组织。所以在数据仓库的基础之上根据分析需求会创建相应的从属的数据集市

数据仓库的意义

数据仓库是企业经营分析和决策支持的核心。

数据特性分析

通信业务系统所产生的数据中,数据量最大也最有价值的信息是用户清单信息,所有有关客户消费行为分析、消费习惯分析、按照消费行为对客户分类、业务发展分析等主题基本上都是以用户清单信息为中心。通过用户清单信息能够进行有效的即席查询、多维分析、数据挖掘等,从中能够得到大量的有价值的核心信息。
客户基本资料相对而言比较稳定,这部分信息量的大小同客户数的多少有着直接的关系。
客户业务受理信息包括客户通过所有渠道(含呼叫中心Call center、Internet网络、营业厅等)进行申办、变更等所产生的信息,这部分信息要求保留详细记录。这些信息反映了客户使用移动公司的产品和服务的合约关系,是经营分析系统需要的基本资料之一。
客户服务信息包括客户通过所有渠道(含呼叫中心Call center、Internet网络、营业厅等)进行查询、投诉、咨询、建议等所产生的信息,这部分信息要求保留详细信息,因为这部分信息直接反映了客户对电信公司的满意程度,比如,通过客户投诉可以分析客户对具体产品或服务的满意度以及服务中存在的主要问题;通过客户咨询信息可以了解客户对于电信公司所提供产品、服务的了解程度以及客户最为关注的问题。尤其是当我们分析客户的忠诚度及客户流失情况,能够通过客户服务系统进一步知道客户“为什么”流失。

数据存储模型设计

数据仓库存储模型应结合经营分析系统的应用需求并结合现有的业务系统进行设计。
数据仓库的粒度是设计数据仓库的一个重要方面。
粒度是指数据仓库的数据单位中保存数据的细化或综合的程度。细化程度越高,粒度级越小;相反,细化程度越低,粒度级就越大。
建议在数据仓库中创建两种粒度级。大部分的分析、查询是针对被压缩的、存取效率高的轻度综合级数据进行的。如果需要分析更低的细节级,可以到数据的真实档案层
设计数据存储模型时,需要考虑以下几点:
能灵活满足各种分析性业务的需求,快速的响应性能,数据集中管理,具有灵活的扩展能力,全盘考虑与分步实施
系统建设力求做到全盘考虑、统筹规划,需要考虑今后扩展数据仓库系统多方面功能的需要,为今后建立完善的数据仓库系统打下良好基础。另一方面,应采取分步实施的方法,最初阶段主要任务是数据仓库基础设施建设,解决迫切的业务问题。

追求梦想,做最好的自己