< img height="1" width="1" style="display:none" src="https://a.gdt.qq.com/pixel?user_action_set_id=1200686054&action_type=PAGE_VIEW&noscript=1"/>

数据库环境创建和发展趋势

文:鼎捷ERP

作者:鼎捷数智 | 发布时间:2012-11-30 14:50:34

6.3创建数据库环境
    要创建数据库环境,首先要了解数据之间的关系、数据的类型和用途以及组织需要采取的相应变革。另一个发展趋势是,在进行数据库设计时,组织越来越需要考虑与合作伙伴之间的数据共享。下面讨论数据库设计的主要原则以及对数据库环境的管理和组织要求。 
6.3.1  设计数据库
    建立数据库之前,首先要经过概念设计和物理设计两个阶段。概念设计(也被称为逻辑设计)是从业务的角度建立一个抽象的数据库模型,而物理设计是指数据库是如何存储在直接访问的存储设备中的。逻辑设许需要对终端数据库用户的业务信息需求进行详细的描述。较好能够把数据库设计作为整个组织数据规划的一部分。
    概念设计描述了如何组织数据库中的数据元,包括确定数据元之间的关系,满足信息需求的较佳数据元组织方式。概念设计还需要确定冗余的数据元以及特定的应用程序所需的数据元组合。
    为了有效地建立关系型数据库模型,需要把复杂的数据组合进行简化,尽可能减少数据冗余和多对多的数据联系。将复杂的数据组合简化成小型、稳定和灵活的数据结构的过程称为规范化(normalizatiOn)。参见图6-6和图6-7。


    数据库设计者通常使用实体联系图(ent“y—rela“onship dia9fam)表示数据模型(见图6—8)。在实体联系图中,矩形框表示实体,连接矩形框的直线表示实体之间的联系。直线末端标注两条短线的表示一,直线末端以鸟足符号(crow’s foot)标注的表示多。图6—8中,“订单”和“订购的零件”之间的直线表示一份“订单”可以包括多种“订购的零件”,即可以通过一份订单订购多种零件。每一种零件可以多次订货,也可以在一份订单中订购多份某种零件。每一种零件只能有一个供应商,多份该种零件只能由同一个供应商管理来提供。

       
6.3.2确保数据质量
    良好的数据库设计和数据模型并不能保证数据库将提供所需的信息。虽然现代数据库可以尽可能减少数据冗余和数据的不一致性,但是拼写错误、数字错位、数据遗漏等输入错误依然会使数据质量难以保证。特别是如今越来越多的公司允许客户和供应商直接在网站上输入数据,导致类似问题有日益严重的趋势。
    在建立新的数据库之前,组织需要找出并纠正错误的数据,建立更严格的数据录入规则。对数据质量的分析通常以数据质量审核(dataquality audit)开始。数据质量审核是对电子商务信息系统中数据的准确性和完整性的审核。数据质量审核可以通过对所有数据文件的审核,或者对数据文件的抽样审核以及对终端用户的调查等方式进行。
    数据清洗(datacleansing,datascrubbing)是指发现和纠正数据库中不正确、不完整、格式不对或冗余的数据的过程。数据清洗不但可以纠正错误数据,还可以增强数据的一致性。可以通过专门的数据清洗协同软件自动对系统中的数据进行清洗。
6。4数据库的发展趋势
    组织可以通过使用功能更强大的数据分析工具和数据仓库,更好地利用数据库中的数据。
6.4.1多维数据分析
    有时候人们需要以传统数据库不能表达的方式来分析数据。例如,某公司在东部、西部和中部三个地区销售螺母、螺栓、垫片和螺钉四种产品。该公司想了解每个地区每种产品的销量并进行比较。这种数据分析需要数据的多维视图。
    要获得这样的信息,需要应用专门的多维数据库,或者在关系型数据库中应用能建立多维数据视图的工具。用户可以通过多维数据分析从多维视角对数据进行分析。信息的每一个方面(如产品、价格、成本、地区、时间等)代表一个数据维度。用户可以应用多维数据分析工具找出6月份在东部地区销售了多少垫片,并把该数据与不同时间、不同地区的销售数据或销售预测数据相比较。多维数据分析也被称为联机分析处理(onlineanalyticalprocessing)。
6.4.2数据仓库和数据挖掘
    决策者不但需要了解准确可靠的当前数据,还需要了解历史数据,以便分析可能的趋势和变化。通常企业系统可以即时提供当前数据,而历史数据因为分散在多个供应链管理系统中,难以全面、及时获得。数据仓库可以帮助决策者方便地获得一致;可靠、全面的数据。
 
1.什么是数据仓库   
    数据仓库(data warehouse)是一个面向主题的(subject oriented)、集成的(integrate)、相对稳定的(non—volatile)、反映历史变化(time variant)的数据集合,用于支持管理决策,来自各个运营系统的数据和外部数据,可能有多种数据模型。数据可能来自于主机系统、关系型DBMS应用程序、面向对象的DBMS应用程序、基于HTML或XML文件的系统等。来自于这些不同应用程序的数据根据需要的时间(每小时、每天、每周或每个月)被复制到数据仓库中。复制到数据仓库中的不同类型数据经过数据清洗,形成一种统一的数据模型,可以应用于各种管理分析。用户可以使用数据仓库中的数据,但不能进行修改。图6—9是一个数据仓库的概念模型。

 
    数据仓库面向整个企业,而数据集市(datamart)则面向部门或特殊用户群等小规模应用。例如,企业可以建立专门用于分析客户信息的市场和销售数据集市。由于数据集市聚焦于某一个领域或某一种业务,所以与面向整个企业应用的数据仓库相比,建设周期更短,成本更低。需要注意的是,建立过多的数据集市也会带来一些相应的管理问题。
2.数据挖掘
    数据仓库提供了一系列的查询工具、分析工具和图形报表工具,包括OLAP和数据挖掘(datamining)工具。数据挖掘通过一些专门技术发掘海量数据中隐藏的模式和关系,并将这些规则用于预测未来发展,指导管理决策。
    数据挖掘是一种强大而有效的工具,但它的出现也带来了个人隐私保护方面的问题。数据挖掘技术可以通过多方来源的数据,生成关于个人的详细“数据图像’,包括个人的收入、家庭、爱好、政治倾向等。由此产生的各种问题值得我们去关注、思考和研究。
6.4。3数据库和Web
    我们能从万维网(worldwide web)上获得所需信息,数据库技术起到了非常重要的作用。下面我们讨论超媒体数据库在Web上扮演的角色以及通过Web访问传统数据库中的信息。
1.Web和超媒体数据库
    网站通过超媒体数据库,以相互链接的网页(内含文本、声音、视频、图片等)存储信息。信息管理的超媒体数据库方法把大量的信息以相互链接的节点方式进行存储,用户可以选择链接路径。例如,你可以点击网页上的某个链接,打开一个文本文件,点击另一个链接打开一个视频文件等。
2.内部数据库与Web的连接
    用户可以应用中间件(middleware)或其他软件,通过Web访问组织内遗产系统中的数据。例如,客户可以通过Web浏览器访问一个网上商店的数据库,查找各种产品的价格。如图6—10所示,用户通过浏览器以HTML命令与Web服务器进行通信,发出数据查询要求。通常后台数据库无法解释HTML命令,因此Web服务器会把HTML命令发给专门的OA软件,将其翻译成SQL命令。在客户机/服务器环境下,DBMS位于数据库服务器上。DBMS接受到SQL命令后,从数据库中返回所需的数据。Web服务器再把数据以HTML的形式发送给用户。图6-10中的应用服务器负责处理所有的应用操作,包括在Web服务器与后台的应用程序或数据库之间的事务处理和数据访问。应用服务器从Web服务器接受指令,根据这些指令运行业务逻辑,并建立与后台应用程序或数据库之间的连接。应用服务器可以是一台专用的计算机,也可以是一系列的脚本程序。

        

上一页:数据管理的数据库方法分析

下一页:管理数据的管理机会、挑战和解决方案

相关新闻

  • 管理数据的管理机会、挑战和解决方案

    实现数据库环境需要广泛的组织变革,包括信息和信息管理者、高层的权力分配、数据所有权和数据分享等。6,5.3解决方案指引 建立数据库环境的关键因素有:数据管理:数据规划与建模方法:数据库技术和管理:用户。

  • 宝洁的供应商管理系统和国家安全局的困扰

    联邦调查局现在也在改善它的国家犯罪中心(nationalcrimecenter)、17个罪犯记录数据库的仓库,这里面有嫌疑犯的面部照片和拇指指纹。根据美国审计局在2002年9月的评估报告,在“9·11”事件之后,除缺少外国留学生的信息外,移民局甚至无法定位联邦调查局想询问的45%的外侨的住处。

  • 数据管理的数据库方法分析

    在现实世界中,越来越需要数据库能够处理与传统数据不同的具有复杂数据结构的图像、声音、视频等多媒体数据。可以通过以下三种方式实现两者混合的DBMS:应用具有面向对象特性的工具访问关系型DBMS,对现有关系型数据库进行面向对象的扩展,应用混合的对象—关系型数据库管理系统。

关注我们

×

数据和智能方案提供商

想要进一步了解或咨询数字化解决方案?
我们随时在线为您服务,谢谢

在线咨询

400-626-5858

添加专属企微客服
获取行业最新案例