< img height="1" width="1" style="display:none" src="https://a.gdt.qq.com/pixel?user_action_set_id=1200686054&action_type=PAGE_VIEW&noscript=1"/>

数据仓库协同信息与数据挖掘

文:鼎捷ERP

作者:鼎捷数智 | 发布时间:2012-11-30 14:50:34

3.4数据仓库与数据挖掘
    假设一名Victoria"s Secrets公司的管理者想了解上个月皮鞋销售的总收益额,那只需一个简单的查询操作即可,通过运用SQL或QBE2E具便能轻而易举地实现。但如果想要进一步了解“通过将实际销售额与预算额进行比较,进而与过去五年的同期销售状况比较,该公司在东南和西南地区,上个月销售了多少双黑色的8号皮鞋”的话,即使采用先进的技术,这项任务看起来几乎也是不可能的。若真能为此建立一个QBE查询的话,那么就能为企业建立数据库环境打下良好的基础。
    这个例子告诉我们之所以那么多企业都选择构建数据仓库的两个原因。首先,在业务数据库可能包含有所需信息时,这些信息并非是以有助于创建数据库内部电子商务智能,或运用各种数据操作工具创建商务智能的方式进行组织的,其次,若要建立该类查询,那么业务数据库很可能要支持每秒数百次的事务处理请求。在单击“开始”按钮完成此类查询时,这可不是随便就能做到的事情。
    为了支持这种富有活力的、必要而且复杂的功能,许多B2B企业都在建立数据仓库,同时提供数据挖掘工具。简单地说,数据仓库是创建商务智能过程中,继数据库技术之后进一步的发展(超过数据库)。数据挖掘工具是人们用于在数据仓库和商务智能推理过程中,支持决策、解决问题或创造竞争优势而挖掘有价值信息时所必需的工具。
3,4.1  什么是数据仓库
    数据仓库是信息的逻辑集合,这些信息来自于许多不同的业务数据库,并用于创建商务智能,以便支持企业的分析活动和决策任务(见图3—8)。表面上听起来很简单,但数据仓库表达了一种较以往企业中信息组织和管理方式截然不同的思维方法。下面我们就以下的主要特征加以说明。

        
  1.数据仓库具有多维性
  在关系数据库模型中,信息是用一系列二维表来表示的,而在数据仓库中,却不是这样。大多数数据仓库具有多维性,即它们包含若干层的行和列。正因如此,大多数数据仓库实际上是一个多维数据库。数据仓库中的层根据不同的维度来表达信息,这种多维度的信息图表被称为超立体结构。
    在图3—8中,我们可以见到一个表达产品信息的超立体结构,它用产品种类和区域(列和行)、年份(第一层)、顾客群(第二层)、广告媒体的时机(第三层)来表示产品信息。利用这个超立体结构,人们很容易地了解到“在无线电广播广告播出之后,随即发生的产品种类1在西南地区的A客户群中的销售额占总销售额的百分之多少?”这类信息完全可以通过商务智能的查询而得到。
    在较大型的超立体结构中的任一特定部分的立方体都包含有取自各业务数据库的综合信息。例如,较前面一层的顶部左侧的立方体就包含了北部地区、某年、产品种类的相关信息。因此,这些信息可能包括总销售额、平均销售额、销售数量、某些方面的分销摘要。当然,它所包含的内容一定真正符合人们的需要。
    2。数据仓库支持决策而非事务处理
    在企业中,大多数数据库是面向业务的。也就是说,大多数数据库都支持联机事务处理(OLTP)。因此我们可以说,这类数据库是一种业务数据库。数据仓库不是面向业务的,它们是用来支持企业中各种决策活动的。因此,数据仓库仅支持联机分析处理(OLAP)。
    正如我们刚刚陈述的,数据仓库中的立方体包含的是综合信息。因此,当数据仓库可能包含某类产品某年份总销售额时,就不必再包含特定产品种类针对每个个体顾客的每笔销售清单了。显而易见,数据仓库是不能用于进行事务处理的。相反,在业务数据库完成事务处理要求后,再利用包含在业务数据库中的信息构建数据仓库中的综合信息。
3.4.2什么是数据挖掘工具
    数据挖掘工具是用户对数据仓库进行信息查询的协同软件工具。数据挖掘工具支持OLAP的概念,即通过对数据的处理来支持决策任务。数据挖掘工具包括查询与报表工具、智能代理、多维分析工具和统计工具(见图3—9)。从本质上看,数据挖掘工具是为数据仓库用户使用的,就像数据操作子系统工具是为数据库用户使用的一样。

  


  1.查询与报表工具
  查询与报表工具与QBET_具、SQL和典型数据库环境中的报表生成器类似。实际上,大部分数据仓库环境都支持诸如QBE、SQL和报表生成器之类的简单易用的数据操作子系统工具。数据仓库用户经常使用这类工具进行简单查询,并生成报表。
  2,智能代理
  智能代理运用各种人工智能工具(如:神经网络、模糊逻辑)形成OLAP中的“信息发现”基础,并创建商务智能。例如,华尔街的股票分析家Murray Riggiero就运用一种称为Data/Logic的OLAP软件,并结合神经网络为自己高成功率的股票和期货交易系统制定规则。’还有一些OLAPT具(如:数据引擎)与模糊逻辑相结合分析实时的技术处理。
    智能代理代表了正在增长的各类加工信息的盯工具的发展方向。以前,智能代理被认为仅仅是人工智能领域的产物,很少被认为是一个企业中数据组织和管理部门的组成部分。而今天,人们会发现智能代理不仅仅应用于数据仓库环境的OLAP,而且还能应用于在Web上查询信息。在第4章中,我们将探索人工智能技术,例如,智能代理的功能。
  3.多维分析工具
  多维分析工具(MDA)是一种进行切片/切块的技术,它允许人们从不同的角度观察多维信息。例如,若读者已经完成了第1章中推荐的“小组项目热点话题”中的任一项目,实际上你就已经用电子表格工作流软件将给定信息分割成了多个不同的层次。在数据仓库的讨论中,我们把数据仓库的处理过程比喻为旋转魔方。也就是说,数据仓库的处理过程本质上就是一个旋转魔方,以便我们能从不同视角观察信息。
    这种旋转魔方的方法使用户能快速地从不同的立方体中掌握信息。如果查阅前面图3—8的数据仓库,你就会发现与顾客群和定期广告有关的信息已被隐含起来。利用MDA工具就可以轻松地得到数据仓库正面的信息,供人们浏览。实际上,所做的就是将立方体垂直地切割掉一层,同时也就得到了前面这一层背后一层的信息。在进行这些处理时,信息的价值是不受影响的。
  4.统计工具
  统计工具帮助人们利用各种数学模型将信息存储到数据仓库中,进而去挖掘出新的信息。例如,你可以进行一个时间序列分析,以便计划未来趋势;你还可以进行回归分析,以确定一个变量对另一个变量的影响。
    美国的SeSa公司是较大的影碟游戏出版商之一,它采用数据仓库和统计工具有效地对每年5000万美元的广告预算进行规划。Sega的产品专家和营销策略专家们运用数据仓库中的信息来预测每条零售链的销售趋势。他们的目标就是要寻找购买趋势,以便确定哪种广告策略效果较好(在一年当中哪一时间段较好),并决定怎样按照媒介、地区和时间的不同重新分布广告资源。Sega的确从其数据仓库中得到受益。另外如此做的零售商们,像玩具反斗城、沃尔玛和西尔斯公司,都是通过技术实现顾客关系管理的典范。
    要想了解更多较新的数据仓库与数据挖掘工具方面的内容,请访问本书提供的网站:WWW.mhhe.COm/haag。
3.4.3数据集市:小型的数据仓库
    通常数据仓库被视为涉及整个组织范围,包括记录组织发展轨迹所有信息的综合。然而,有些人仅需要存取数据仓库中的部分信息,并不需要全部内容。在这种情况下,企业可能就要建立一个或多个数据集市。数据集市是数据仓库的子集,它仅聚集了部分数据仓库的信息(见图3—10)。

           
    Lands’End公司首先建立了一个涵盖整个组织范围的数据仓库供全体员工使用。不久他们就发现,这里要做的事情太庞大了。实际上,许多Lands’End公司的员工都不使用数据仓库,因为对他们而言数据仓库太大、太复杂,而且包括了许多他们根本不需要的信息。于是,Lands’End公司就建立了几个小型数据集市。例如,Lands’End公司为商品部建立了一个数据集市。该数据集市仅包含特定商品的信息,而不含其他任何信息,再如,对财务部门而言,该数据集市是唯一的。   
行业透视   
LANDO’lAKES不是画蛇添足
    2001年,LANDO"LAKES在收购了PurinaMms后成为美国较大的生产动物饲料的公司(它已经拥有了LANDO"LAKES饲料公司和Farmland饲料公司)。这确实是一个挑战,负责销售和营销的经理们需要便捷地访问贯穿了三个饲料公司的运营的信息,以便准确地分析40000种以上饲料产品的销售情况。
    为应对这种挑战(并获得成功),Land O’Lakes从Informatica购买了一系列的数据挖掘工具,并得到了下述好处:

    .这些软件帮助LandO"Lakes缩短了新产品的开发周期和老产品的修缮时间。
  &n

上一页:数据管理子系统OA协同软件

下一页:数据库供应链管理信息所有权

相关新闻

  • 数据库供应链管理信息所有权

    当人们准备跨入当今快速发展、令人振奋并以信息为基础的商业世界时,你必须准备协助自己的企业管理及组织企业的信息资源。·数据管理子系统:通过自身提供的备份与恢复工具、安全管理工具、较优化查询工具、并发控制和 更新管理工具,帮助人们管理整个数据库环境。

  • 案例:两公司与电子商务智能

    BEN&JERRY’S公司 BEN&JERRY’S公司位于美国佛蒙特州的沃特伯里,每天生产190 000品脱的冰淇淋和冰冻酸奶酪,并将产品运往位于美国和其他12个国家的5万多个食品杂货店中。BIGELOWTEAS公司的员工们努力钻研有关消费者、销售、市场营销和财务方面的商务智能以确保他们在各方面做出正确的决策。

  • 数据管理子系统OA协同软件

    DBMS的应用程序生成子系统是一种常用的开发工具,它帮助用户建立面向事务处理的应用程序。3.3.4数据管理子系统 DBMS的数据管理子系统通过自身提供的备份与恢复工具、安全防范工具、较优化查询工具、并发控制和更新管理工具,帮助人们管理整个数据库环境。

关注我们

留言板

咨询热线:400-626-5858