当前位置:晨阳文秘网>教案设计 >

数据库设计【五篇】【完整版】

时间:2023-06-15 11:20:05 来源:晨阳文秘网

数据库设计范文第1篇【关键词】数据库;关系数据库;面向对象;服务器1背景分析目前,产品化的数据库管理系统是以关系型数据库为主流,技术相对成熟。面向对象的数据库管理系统尽管技术上处于先进,数据库易于研发下面是小编为大家整理的数据库设计【五篇】【完整版】,供大家参考。

数据库设计【五篇】

数据库设计范文第1篇

【关键词】数据库;
关系数据库;
面向对象;
服务器

1 背景分析

目前,产品化的数据库管理系统是以关系型数据库为主流,技术相对成熟。面向对象的数据库管理系统尽管技术上处于先进,数据库易于研发、维护,但至今为止,还没有成熟的产品。占主导位置的关系型数据库管理系统包括ORACLE、SYBASE、SQL Server、INFORMIX与INGRES,这些产品都支持UNIX、VMS、WINDOWS等不同平台,但支持的程度不一样。

通常系统的设计与研发阶段,设计人员、研发人员与测试人员仅会把工作重点放在系统的功能实现上,而此时因为测试数据较小,难以衡量系统的运行性能的优劣,然而如果系统进入实际运行阶段,大量的业务数据通常会使系统的性能逐步降低,此时再来考虑怎样提升性能则会花费更多的人力及财力。所以,设计出高质量的数据库结构就变得特别关键。

2 数据库服务器选择

对于占主导位置的SQL Server、Oracle、SYBASE、DB2和INFORMIX数据库,分别从性能、运用风险、开放性、易维护性与价格等方面来分析比较。

2.1 性能

SQL Server老版本服务器多用户时性能较差,新版本的性能有了显著的提升,各项处理能力都有了显著的提升,占有数项TPC-C(事务处理性能委员会)纪录,并支持集群。Oracle数据库性能最佳,占有Windows NT平台下的TPC-D(基准测试,衡量联机事务处理系统的一个测试指标)及TPC-C的世界纪录。SYBASE数据库性能较好,满足Sun、IBM、HP、Compaq及Veritas集群设施的性能,达到高可用性;
性能比SQL Server稍差,然而在UNIX平台下的并发性要高于SQL Server,适用于安全性要求较高的应用系统。DB2适合于数据仓库与在线事务处理,性能较好,支持胖客户端和应用模式。INFORMIX性能较好,支持集群,达到高可用性,适用于安全性要求极高的应用系统,特别是在金融业、证券行业的应用。

2.2 运用风险

SQL Server属于完全重写的代码,性能及版本兼容性有了较大的改善,同Oracle、DB2的性能差距显著减小。该产品的产生经历了大量用户长期的测试,对产品的安全及稳定进行了全面的检测,安全稳定性有了显著的改善。Oracle长时期的研发经验,完全向下版本兼容,基本没有风险。能够安全的进行系列产品的升级,在企业、政府中获得普遍应用。而且假如在WINNT平台上不能满足数据的要求,能够安全的将数据转移到UNIX平台上来。SYBASE向下版本兼容,然而ct-library程序不易移植。研发周期较长,升级较为复杂,稳定性较佳,数据安全有保障,风险较小。在安全要求极高的金融、证券领域获得了普遍应用。DB2在巨型企业获得普遍的应用,向下版本兼容性较好,应用风险较小。INFORMIX研发周期较长,升级较为复杂,稳定性较佳,数据安全有较高保障,应用风险较小。在安全要求极高的金融、证券领域中获得了普遍应用。

2.3 开放性

SQL Server仅能在Windows平台上部署、运行,C/S结构,操作系统的稳定对数据库是非常关键的。仅支持Windows平台,能够用ADO、DAO、OLEDB、ODBC、JDBC等网络数据库连接技术沟通。Windows平台的可靠性和安全性通过了最高级别的C2认证,在处理大数据量的重要业务时具备较好的性能。Oracle能在所有主流平台上部署、运行(包含 Windows),完全支持目前所有的工业标准。利用完全开放策略,可以进行多层次网络计算,对多种工业规范提供支持,能够用ODBC、JDBC、OCI等网络数据库连接技术沟通。能够使客户选用最适合的解决方案,对开发商完全支持。SYBASE能在所有主流平台上部署、运行,C/S结构,能够用ODBC、JDBC、Jconnect、Ct-library等网络数据库连接技术沟通,在金融业中获得了普遍的应用。但因为早期Sybase同OS集成度不高,所以VERSION11.9.2以下版本需要较多OS及DB级补丁,在多平台的混合环境下会产生一定问题。DB2能在所有主流平台上部署、运行(包含windows)。有较佳的开放性,最适于海量数据。支持跨平台能力和多层结构,支持ODBC、JDBC等类型应用系统,在大型的国际企业中获得最为普遍的应用。IINFORMIX仅运行于UNIX平台,包括SUNOS(Sun的操作系统最初称呼)和HPUX(Hewlett C Packard UNIX的缩写,属于惠普公司的UNIX操作系统),在金融业获得普遍的应用。

2.4 易维护性与价格

SQL Server从易维护性与价格上SQL Server占有较大优势。基于Microsoft产品的一贯风格,SQL Server的图形管理界面导致了显著的易用性,微软的数据库管理员培训工作相对充分,能够轻松的找到技术较好的数据库管理员,数据库管理费用相对低,SQL Server的价格也是较低的。Oracle从易维护性与价格体来说,Oracle的价格是相对高的,管理相对复杂,因为Oracle的应用相当普遍,经验丰富的Oracle数据库管理员能够相对容易的找到,因而实现Oracle的良好管理。所以,Oracle的性价比在商用数据库中是最佳的。SYBASE的价格是相对低的,然而SYBASE的在企业及政府中的应用较少,较难找到经验丰富的管理员,运行管理费用偏高。DB2价格较高,管理员较少,在中国的应用相对少,只在金融业获得一定应用,运行管理费用都非常高,比较适用于大型企业的数据仓库应用。INFORMIX价格在这些数据库服务器中居于中间,同SYBASE类似,在企业及政府中应用相对较少,只在金融业获得了普遍的应用。经验丰富的管理人员偏少,运行管理费用偏高。

3 数据库设计

数据库结构设计在该数据库管理系统研发过程中占据非常关键的地位,下面从数据库设计原则、数据库设计方法与步骤、逻辑数据模型设计等三方面简述该数据库管理系统数据库设计。

3.1 数据库设计原则

该数据库管理系统的数据库参照以下设计原则:

(1)数据库设计要达到标准化与规范化。数据结构的标准化与数据关系的规范化有助于消除冗余数据。

(2)表中数据类型的合理化。合理的数据类型有助于提升该数据库管理系统数据库的运行性能。

(3)数据表命名的规范化。每个关系型数据库对数据表的命名都有一定要求,在对数据表命名时利用大小写敏感的形式,而且数据表命名长度不应过长,这样能够使该数据库管理系统可以应用在多个不同的数据库平台。

(4)数据库性能的完善。在运行环境已经固定的因素下,数据库的性能成为影响该人事数据库管理系统运行性能的主要条件。可以利用两个步骤开展数据库设计:先是进行逻辑设计,而后进行物理设计。逻辑设计要求消除所有的冗余字段,可以完整地说明数据库表之间的关系。然而对于多表之间关联的查询,去除所有冗余会损耗系统性能,也会增大系统研发难度。因此,找到一个平衡点成为数据库设计的关键,在物理设计中开发人员要分析关联数据表的数据量大小与访问频率,并对数据表中用来关联查询的关键字段留存适当的冗余,以提升数据库的性能。

3.2 数据库设计方法与步骤

数据库的建设分成概念数据模型设计、逻辑数据模型设计与物理数据结构设计等三个阶段,其目的是达到合理的数据表结构,使数据的存取操作更为有序,数据的编辑、查询更为方便,从而实现该数据库管理系统数据库的建设。

(1)概念数据模型设计。概念数据模型反映的是系统最终用户对于数据存储的观点,代表了系统用户综合性的信息需求,它用数据类的方式表达企业级的数据需求,数据类描述了在业务环境中聚集起来的几个重要的类别数据。概念数据模型包括主要的实体和实体之间的关系。描述概念数据模型最常用的是“实体-关系”图(即E-R图),E-R图主要是由实体、属性及关系等三个要素组成的。

(2)逻辑数据模型设计。逻辑数据模型是指系统分析师、设计师对数据存储的见解、看法,是对前一阶段概念数据模型的分解与细化。逻辑数据模型是按照业务规则决定的,是业务对象、业务对象的数据项以及业务对象之间关系的描述。逻辑数据模型包括所有的实体与关系,决定每个实体的属性,指明每个实体的主键和外键。

(3)物理数据模型设计。物理数据模型是对真实数据库的表达。数据库对象包括表,视图、字段、数据类型、长度、主键、外键、索引以及是否可为空,还有默认值。概念数据模型到物理数据模型的转换是将概念模型中的对象转换为物理模型的对象。

4 总结

开发数据库管理系统时,一个优秀的数据库服务器的选择和好的数据库结构设计起到举足轻重的地位。SQL Server属于微软公司研发的大型关系型数据库系统,功能相对全面,效率较高,管理与操作比较简单、方便,整个系统的安全及稳定也较高,并且性能价格比最好,节约企业资金,降低研发成本,是开发人员理想的选择,能够作为中型企业或单位的数据库平台。数据库结构设计在数据库管理系统研发过程中同样占据非常关键的地位,一个好的数据库结构是该数据库管理系统的基础,数据结构设计的优劣将直接影响到该系统的效率以及所要达到的效果。

【参考文献】

数据库设计范文第2篇

关键词:企业调研 课程标准 方案设计

0 引言

《数据库开发》是计算机专业的一门核心课程,通过本课程的学习学生将能够进行初步的需求分析,根据分析结果设计数据库的概念结构模型和逻辑结构模型,并能够根据物理结构模型进行数据库实施和简单数据库应用系统的开发。本课程实践性非常强,注重培养学生的动手能力。所以,设计课程过程中,应该更加注重课程本身的实用性,更加注重课程内容本身与企业岗位的相结合。

《数据库开发》课程设计主要经历了企业调研、课程标准开发、课程方案设计等几个阶段。下面就分别说明一下课程设计的每个阶段。

1 《数据库开发》课程企业调研

进行企业调研是课程建设要进行的第一步,只有进行了充分的企业调研才能培养出满足社会和企业需求的合格人才。才能根据需求进行课程的设计,这样才能使学校的课程更加适合企业,更加适合社会。为此,我们的项目团队到企业进行了实地调研,我们获取到了企业对于学生的需求和对于课程设置方面的建议。

本门课程在进行企业调研之前已经根据之前的教学经验设置了本门课程的任务,具体任务设置如下:

任务1 数据库分析与设计

任务2 系统前台页面设计

任务3 数据库实现

任务4 系统后台实现

任务5 数据库维护

通过与企业专家进行研讨,最终获取来自企业关于《数据库开发》课程设计的建议。具体建议如下:

任务1 教学要求及建议:

①数据库基本概念和知识简单带过,达到了解的程度即可。

②需求分析难度较高,不建议让学生进行整个系统的需求分析,可以编写需求规格说明书的部分内容。

③进行数据库概念结构设计时,可以先画出系统的各个部分的E_R图,最后在将整个系统的E_R图画出来。

④可以使用PowerDesigner软件进行数据库的概念结构设计和物理结构设计。

⑤这部分内容比较难,需要多练习,可以适当多加一些课时。

任务2 教学要求及建议:

①本部分内容是对于之前所学网页设计和JSP的内容进行熟悉,可以以学生做为主。

②进行分小组教学,小组内进行角色划分,充分发挥团队的力量。

③因为是之前的知识可以适当减少课时。

任务3教学要求及建议:

①对于数据库管理软件可以选择相对比较容易上手的,如SQL Server、MySQL等。

②数据库管理软件图形界面操作时,应该注意多做练习培养学生的动手能力,选择是实例可以由浅入深,逐步较大难度和工作量。

③应该重点讲解SQL语句,因为SQL语句的大部分语法都是可以在不同数据库通用的。

④实现所用项目的数据库时,也应该将尽量让学生自己进行SQL语言的编写,这样可以更好的使掌握SQL语句的应用。

任务4教学要求及建议:

①讲解Spring的基本原理和用法时,应通过简单的实例学习Spring的应用。

②学生应该进行分小组不同模块的开发练习,小组规模不要太大,3个人为一组比较适宜。

③不应占用太多课时。

任务5教学要求及建议:

①数据库维护的内容应该以视图和索引为主,进行重点讲解。

②数据库的用户和权限的应该多做实例。

③触发器的使用可以简单讲解。

课程总体建议:

①课程讲解内容较多,且内容难度较高,需要课时较多。

②应重点讲解任务一和任务三的内容,其次是任务四和任务五的内容。

③学生多做练习,注意培养他们的团队合作能力和沟通能力,注意锻炼学生的自学能力。

有了企业调研结果作为课程设计的依据,就可以进行课程标准的制定。

2 《数据库开发》课程标准的设计

课程标准是一门课程进行教学的根本依据,在课程标准中要包含课程的设计思路、能力目标和课程内容框架等内容。制定课程标准一定要详细描述课程各方面的内容,制定完整准确的课程标准是进行课程设计重要环节。

2.1 课程设计思路 本课程主要以企业实际项目为主线,通过五个典型的工作任务,使学生掌握数据库开发的相关知识和技能;
学生在学习本课程过程中,主要学习的内容包括:数据库需求分析、数据库模型设计方法、使用数据库管理软件对数据库模型进行实施、使用数据库管理软件管理数据库,对已有的数据库开发数据库应用系统对数据进行增删改查的基本操作。将该课程的整个教学任务按照项目分为5个典型的工作任务,具体描述如下:

①数据库需求分析:对所选用的项目的需求使用需求分析方法进行分析,并编写需求规格说明书。

②数据库模型设计:根据上一个任务中编写的需求规格说明书,进行数据库的概念结构设计、逻辑结构设计和物理结构设计。

③数据库模型实施:选择数据库管理软件对上一个任务中设计的数据库模型进行实施,并介绍SQL语句的基本应用。

④数据库查询操作及视图、索引等数据库对象应用:对于已有数据库使用SQL语句进行查询的操作,并介绍视图、索引等主要数据库对象的应用。

⑤数据库应用系统开发:开发一个基于Web的数据库应用系统,对已有数据库实现数据的增删改查的功能。

以上的典型工作任务,与企业调研之前的工作任务对比情况,如下表所示:

2.2 能力目标

①能够进行初步的需求分析

②能够根据需求分析的结果设计数据库的概念模型

③能够将数据库概念模型转换为逻辑模型,并生成物理模型

④能够使用SQL语句实施数据库模型

⑤能够使用SQL语句进行简单数据查询

⑥能够使用Spring+Hibernate开发基于Web数据库应用系统

在课程标准中,还包含其他的一些内容,比如课程内容、课程的考核方式等内容,这里不再赘述。制定完课程标准后,就要依据课程标准进行课程方案设计。

3 《数据库开发》课程方案设计

根据课程标准,进行课程方案的设计,课程方案设计一般包含课程总体方案设计、课程任务方案设计和课程活动方案设计。

3.1 课程总体方案设计 课程总体方案设计是对于本课程的总体的介绍,其中包含课程的课时、适用专业、学习内容、能力目标、学习成果和考核方案等内容。

3.2 课程任务方案设计 课程任务设计方案是对于课程中涉及的典型工作任务的描述,它具体说明了课程中每个任务的学习内容、能力目标、学习环境、教学方法、学习成果和评价标准等内容。

3.3 课程活动方案设计 课程活动方案设计是对于每个典型工作任务中具体活动的描述,它具体说明了在典型工作任务中每个学习活动,介绍学习活动的内容、目标、活动具体设计、课程用到的参考资料等内容。

在完成课程的方案设计后,就可以根据方案进行数据库的实施了,在实施过程中还会遇到各种问题,实施完成后,要根据实施的情况,对课程的课程标准、课程设计方案等内容进行修订,从而使得课程的设计方案更加完善。

4 结论

由上面的内容不难看出,《数据库开发》课程的设计或者是其他技术类课程的设计,都应该注重实践,减少课程理论知识的讲解,将课程的理论知识融入到学生完成的典型工作任务中,真正要做到“做中学”,要重视课程本身与企业的关联,要做到课程为企业服务,另外,课程本身中的内容还要与时俱进,跟得上社会发展。

参考文献:

数据库设计范文第3篇

一、何为数据库

概括来说,数字出版产品种类主要包括数据库、电子书、App、音视频、动漫、在线服务等。在专业出版领域,最为常见和成熟的是数据库和电子书,这两者是同一内容针对不同用户需求而表现出来的不同形态。

数据库是关于某一类特定内容的集合体,海量资源、注重检索是数据库的两大特征,适用于专业内容,尤其是科学、技术和医学内容。数据库产品参考性强、具有工具性特征,是设计产品时要考量的核心要素。数据库产品的销售以机构用户为主,个人用户是未来发展的潜在市场。

二、数据库产品的结构

数据库产品的结构主要包括支撑层(搜索引擎、电子商务、版权保护、管理系统等)、资源层(资源描述、加工标引、词库分类)、功能层(内容浏览、分类导航、精准检索、知识关联)和用户层(知识服务、个性化服务)。

设计产品的最终目的是满足用户需求、提供良好用户体验。对于数据库产品而言,以上四层结构的设计保障了最终目标的实现。在海量内容的基础上,依靠有序的资源组织,借助专业词库、搜索引擎、内容挖掘等基础支撑,快速查找出用户需求的内容,满足查询参考的需要,在实现用户价值的同时实现产品价值。图1为数据库产品的结构图:

三、数据库产品的出版流程

数据库产品的出版,从设计到实现一般需经历6个核心环节:需求调研、资源调研、功能设计、资源加工、产品研发和运营管理。随着用户需求变化、资源增加和技术升级不断螺旋上升、迭展,从而形成一个循环发展的过程。

下面以人卫社的西医图书数据库为例,简述数据库产品的出版过程。

在需求调研阶段,从用户对医学图书的需求特征入手,明确用户的核心需求,即解决临床实际问题、准确定位查询内容。

在资源方面,人卫社出版的医学图书品种多、专业覆盖全面、内容权威,基本可以满足临床工作需求,具备构建医学数据库的基础条件。

在功能设计上,西医图书数据库在产品设计时明确了功能需求,有明晰的内容组织架构,能提供用户所熟悉的导航浏览路径;
能够快速精准的检索;
从简单的图书内容服务向知识服务转变;
针对不同用户实现个性化服务。

在资源加工方面,所有功能的实现都要从资源加工做起,精准检索和知识服务离不开资源的深度标引。

在关键的产品开发阶段,为了解决开发人员与产品设计人员的知识背景壁垒,建立相应项目组共同工作,定期召开例会,反复沟通详细设计。尤其是一些核心功能的开发,产品设计人员提前介入,及时测试,做到问题早发现早纠正。数据库产品的开发,工作量大、功能点多,从底层架构到前端UI设计都需要切实到位,才能保证质量和开发进度。

最后是产品运营管理阶段,需要以产品设计人员为核心,协调市场销售人员、客户服务人员和技术开发人员,及时响应用户需求,形成产品迭展的机制。

四、以内容资源为基础的产品布局

在内容资源加工和管理的基础上,需要考虑多维度的产品,构建出成体系的产品布局,如此才能真正体现出内容资源的内在价值。

数据库设计范文第4篇

1.1灾情信息表

对灾情数据进行信息分类是一项非常重要的过程,适当的分类可以简化系统结构,实现数据的精确分析。具体来说,灾情数据分为两部分,一部分是过程信息表,一部分是灾情信息表。其中,过程信息表用来记录灾害天气发生过程中的灾害信息,这部分记录是灾情数据库的基础;
灾情信息表是受灾后的灾情详细信息记录,如灾害强度、灾害损失、灾害原因等。两部分在数据使用方面体现为一对多关系,即一次灾害过程对应着多个灾情信息记录。灾情信息表是整个数据库系统的核心,其结构是否科学合理决定了后续灾情分析的准确程度。为满足分析需求,通常灾情详细信息表的数据存储字段可分为灾情起因信息、基本信息、空间属性信息、灾害带来的损失信息、后期影响信息等几部分。

1.2灾情的协同通报信息结构

数据库的建立不仅仅用于记录,还应该具有联网通报的功能,通过该功能可以实现信息的联网分析和总结,提高灾情通报的实时性和系统使用效率,减少或者避免重复工作所带来的人力资源浪费。该部分数据库架构为,在灾情协同录入界面,辅助录入人员可以将灾情数据进行及时收集整理后进行录入,然后利用协同通报系统将信息上传到数据库端并将该部分数据标记为待审核数据。经过工作人员的审核和评定后,若该数据录入准确且具有唯一性,则取消待审核状态,转为灾情详细信息数据,为后续上报或者灾情分析评估等提供数据支持。该部分的信息需要进行单独存放,以免与灾情信息表产生混淆。

1.3灾情评估信息数据结构

灾情根据灾害特点和灾害原因可以分为多种类别,如自然灾害和人为灾害、地质灾害和天气灾害等。不同的灾害收集方式和评估方式均有所不同,因此在数据库架构中如何合理制定灾害信息采集分析表对应用灾害数据进行灾情评估具有重要作用。该部分数据库应该按照如下方式进行构建。首先建立灾情分类数据库,不同灾情与对应灾情描述之间进行特征关联,同类型灾害进行细分和归类。然后根据灾情特征建立对应的数据模型,便于数据录入和灾害评估。

1.4辅助数据表结构

为提高系统的应用性能,可以增设部分辅助数据表作为灾情数据库的补充。利用该表可以进行新灾情的自定义等,增强数据库的可扩展性。同样辅助表还具有区域记录功能,通过对受灾区域进行记录,可以提高灾情地理分布的精确度,增强局部预警能力。

2基于灾情数据库的灾害评估技术分析

在建立气象灾情信息数据库的基础上结合使用GIS技术、数据分析技术、WEB技术等,可以保证对数据库的充分利用,实现灾情的精确评估,减少灾害带来的经济损失。

2.1灾情统计分析技术

对灾情进行记录的主要目的在于利用这些数据进行统计分析,并对分析结果进行总结,生成统计报表,根据报表制定防灾决策,或者指导今后的灾情预警等。该技术生成的统计报表可以用于存储或检索。其中,检索功能可以进行要素关联检索、条件检索、影响检索等。通过进行细分检索和信息对比,可以方便的实现灾害评估。

2.2可视化分布图显示技术

在对灾害数据库进行限定检索后,可以获得相关灾情信息和气象数据。结合使用可视化技术等,可以根据数据统计量生成要素分布图。如灾情分布图、灾害损失分布图等。这些分布图可以直观、便捷的实现天气和灾情的关联,突出灾害易发点,为不同天气下的灾害预防工作提供理论依据。

2.3灾害防御对策技术

灾害防御对策技术主要是指对数据库内的灾害数据进行分析,根据各要素的影响程度调用对应的防御对策信息以供气象工作人员参考。该技术的实现需要对现有的应对策略进行收集、整理和归类,并根据灾害程度制作成相应的数据库文件,进而将该数据库与灾害信息库进行关联。

3总结

数据库设计范文第5篇

[关键词] 零售业 数据仓库 数据挖掘

零售业是任何一个处于从事由生产者到消费者的产品营销活动的个人或公司,他们从批发商、中间商或者制造商处购买商品,并直接销售给消费者。当代的零售业早已不再是传统的“整买零卖,贱进贵出”的简单商业行为。它是行业间科学管理和高科技应用的竞争。沃尔玛前CEO David Glass 曾经说过这样一句话:“沃尔玛是一家科技信息公司”。乍一听,这句话很难理解:沃尔玛不是世界上最大的零售商吗?细细品味,Glass 这句话可以说是一语道出了沃尔玛低成本、高效益的真谛。

众所周知,现代化的市场信息收集和分析本身就是高科技的体现。消费者的心理、行为、生活习惯,以及收入甚至婚姻状况无不成为商家的决策必需,由此,新的系统、软件应运而生。高科技在产品开发、商品策划、销售预测、货源采购和精确定价等各个环节的应用已经成为经营者们不可缺少的决策依据。而支持众多决策的是其中的数据仓库和挖掘技术。

一、构建数据仓库与数据挖掘技术的必要性

简单讲数据仓库是一种多个异种数据源在单个站点以统一的模式组织存储,以支持管理决策。数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有用知识的过程。

数据的丰富带来了对强有力的数据分析工具的需求,大量的数据被描述为“数据丰富”,但“信息贫乏”。快速增长的海量数据收集、存放在大型和大量数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。结果,收集在大型数据库中的数据变成了“数据坟墓”――难得再访问的数据档案。这样,重要的决定常常不是基于数据库中的信息丰富的数据,而是基于决策者的直觉,因为决策者缺乏从海量数据中提取有价值知识的工具。此外,考虑当前的专家系统技术,通常,这种系统依赖用户或领域专家人工地将知识输入知识库。不幸的是,这一过程常常有偏差和错误,并且耗时、费用高。数据挖掘工具进行数据分析,可以发现重要的数据模式,对商务决策、知识库、科学和医学研究做出了巨大贡献。数据和信息之间的鸿沟要求系统地开发数据挖掘工具,将数据坟墓转换成知识“金块”。简单讲数据挖掘是从大量数据中提取或“挖掘”知识。

数据仓库中不是存放每个销售事物的细节,而是存放每个部门每类商品的汇总数据,或对较高层次的汇总数据。OLAP(联机分析处理)提供数据仓库中汇总数据的多视图和动态视图能力,为成功的数据挖掘奠定了坚实的基础。数据挖掘可以帮助商界经理们找到合适的客户,也能获得对商务的洞察,帮助提高市场份额和增加利润。此外,数据挖掘能够帮助经理们了解客户的群体特点,并据此制定价格策略;
不是根据知觉,而是根据客户的购买模式导出的实际商品组的排放;
在降低推销商品开销的同时,提高总体推销的纯效益。

二、零售业中的数据仓库与数据挖掘

零售业是数据挖掘的主要应用领域,这是因为零售业积累了大量的销售数据,顾客购买历史记录,货物进出,消费与服务记录,等等。其数据量在不断地迅速膨胀,特别是由于日益发展的Web或电子商务商的商业方式的方便和流行。今天,许多商店都有自己的Web站点、顾客可以方便地在线购买商品。一些企业,如,只有在线方式,没有砖瓦构成的(物理的)商场。零售数据为数据挖掘提供了丰富的资源。

零售数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销售比率,涉及更好的货品运输与分销策略,减少商业成本。

零售业中的数据挖掘可从以下几个方面具体实施:

1.基于数据挖掘的数据仓库设计与构造

由于零售数据覆盖面广(包括销售、顾客、职员、货品运输、销量和服务),所以有许多设计数据仓库的方式。所包含的细节级别可以变化很大。由于数据仓库的主要用途是支持数据分析和数据挖掘,预先的一些数据挖掘例子的结果可作为设计和开发数据仓库结构的参考依据。这些设计要决定哪些维护什么级别,以及为保证高质量和有效的数据挖掘应进行哪些预处理。建议以递增、进化的方式(如图1)实现数据仓库。

图1 数据仓库开发的方法

2.销售、顾客、产品、时间和地区的多维分析

考虑到顾客的需求,产品的销售,趋势和时尚,以及日用品的质量、价格、利润和服务,零售业需要的是实时的信息。因此提供强有力的多维分析和可视化工具是是十分重要的一件事,这包括提供根据数据分析的需要构成复杂的数据立方体如图2所示。基本方体包含所有的维city,item和year,它可以返回这三维的任意组合。顶点方体表示分组为空的情况,它包含所有销售的总合。特征数据立方体,在零售数据分析中是一种有用的数据结构,因为它方便了带有复杂条件的聚集上的分析。

图2 三维数据立方体

3.促销活动的有效分析

零售业经常通过广告、优惠券和各种折扣和让利的方式搞促销活动,以达到促销产品,吸引顾客的目的。认真分析促销活动的有效性,有助于提高企业利润。多维分析可满足这方面分析的要求,方法是通过比较促销期间的销售量和交易数量与促销活动前后的有关情况。此外,关联分析可以找出哪些商品可能遂将假商品一同被购买,特别是与促销活动前后的销售向比,它广泛应用于购物车或事物数据分析。

4.顾客保持力――顾客忠诚分析

通过顾客荣誉卡信息,可以记录下一个顾客的够买序列。顾客的忠诚和购买趋势可以按系统的方式加以分析。由同一顾客在不同时期购买的商品可以分组为序列。序列模式挖掘可用于分析顾客的消费或忠诚的变化,据此对价格和商品的花样加以调整,以便留住老客户,吸引新顾客。

5.购买推荐和商品参照

通过从销售记录中挖掘关联信息,可以发现买某一品牌香水的顾客很可能够买其他一些商品。这类信息可用于形成一定的购买推荐,购买推荐可在Web、每周传单或收据上宣传,以便改进服务,帮助顾客选择商品,增加销售额。同样,诸如“本周热点商品”之类的信息或有吸引力的买卖也可以和相关信息一同,以达到促销的目的。