基于CS结构的中小型医院住院管理系统的设计与实现本科毕业论文 联系客服

发布时间 : 星期四 文章基于CS结构的中小型医院住院管理系统的设计与实现本科毕业论文更新完毕开始阅读86ba55552379168884868762caaedd3383c4b5e1

xxx本科学士论文

内容

数据挖掘是什么? ......................................... 14

数据挖掘的局限性 ........................................ 16

数据挖掘的利用 .......................................... 16

恐怖主义信息意识(TIA)的程序 .................................... 18 计算机辅助乘客初筛检测系统 ..................................... 20

数据挖掘问题 ............................................ 24 数据质量 ....................................................... 24 互操作性 ....................................................... 24 使命蠕变 ....................................................... 25 隐私 ........................................................... 26

第108次国会立法 ........................................ 26

为进一步阅读,可参看: .................................. 29

13

xxx本科学士论文

数据挖掘:概述

数据挖掘是什么?

数据挖掘涉及到使用复杂的数据分析工具来发现以前不为人知的,有效的模式和在大数据集之间的关系。这些工具可以包括统计模型、数学演算法、机器学习方法(算法改进系统的性能自动通过经验,如神经网络和决策树)。因此,数据挖掘是由超过收集和管理数据,它还包括分析与预测。

数据挖掘可以执行数据代表了在定量、文本、或多媒体形式。数据挖掘应用程序能使用的各种参数,以检查数据。他们包括协会(模式,在那里一个事件被连接到另一个事件,比如购买一支钢笔和采购纸张)、序或路径分析(模型在一个事件导致另一件事,如生育一个孩子和采购尿布)、分类(识别的新模式,比如购买之间的管道胶带的巧合和塑料薄膜采购)、聚类(发现和视力记录组以前未知的事实,如地理位置和品牌偏好(发现),和预测模式,一个可以做出合理的预测对未来的活动,如本研究之预测,显示人们加入一项体育俱乐部可能锻炼课)。

作为一个应用程序,相较于其他数据分析的应用软件,如结构化查询(用于很多商业数据库)或统计分析软件,数据挖掘代表一个不同类型的不同而不是学位的不一样。许多更为简单的分析工具应用一个基于证明的方法,那些用户开发一种假说,然后测试数据,以证实或否认的假说。例如,一个用户可能假设一名顾客买一把锤子,还会买一盒的指甲。该方法的有效性可以限制用户的创造力开发多种假说,以及软件的结构被利用了。相比之下,发现数据挖掘运用方法,算法可以检测几种多维数据的关系,同时,鉴别出那些独特或频繁的代言人。例如,一个硬件存储工具可以比较其客户的购买与置业、汽车的驱动类型、年龄、职业、收入、和住宅和商店之间的距离

[1]两只乌鸦公司,《数据挖掘和知识发现的介绍》(第3版)(波多马克,MD:两只乌鸦公司,1999);Pieter Adriaans和Dolf Zantinge,数据挖掘(纽约:艾迪卫斯里,1996)。

[2] 为数据采集的一个针对技术的定义,请见

[http://searchcrm.techtarget.com/gDefinition/0,sid11_gci211901,294236全世界]。

【2】

【1】

14

xxx本科学士论文

CRS-2

由于其复杂的能力是很重要的,两个数据挖掘前兆作为一个成功的运用;一个清晰的制定需要解决的问题,并获得了相关数据。

数据挖掘反映的这个概念,一些观察家认为数据挖掘只是一步在一个更大的过程称为数据库中知识发现(KDD)。其它的步骤在KDD过程中有秩序的进步,包括数据清理、数据集成、数据的选择、数据转换、数据挖掘、模式评价和知识呈现。

许多先进的技术和业务流程,这些都造成了日益增长的兴趣,在这两个数据挖掘中公共和私营部门。其中一些改变包括计算机网络的增长,这可以用来连接数据库的发展,增强搜索链接技术和神经网络等先进的算法;蔓延的客户机/服务器计算模型,允许用户访问集中式数据资源,从桌面;一个与能力的提高数据从各种不同的消息源结合成一个单一的可查找的来源。

除了这些改进数据管理工具,利用增加的成本信息和降低储存这也发挥了重要的作用。在过去的几年中有了迅速增长的大量信息收集并存储与之,一些观察家暗示的数量,世界上的数据约双打每年。在同一时间,成本的数据存储有明显的减少与美元每兆到便士每兆。同样,计算能力已继续每18 - 24个月成倍飙涨,而的相对成本,计算能力已继续减少。

数据挖掘已成为越来越普遍,在这两个公共和私营部门。组织使用数据挖掘作为一种工具来调查客户信息,减少浪费,欺诈和协助医学的研究。然而,数据挖掘的扩散已经提出了一些实施和监督的问题。这些包括关心质量的数据进行了实证分析,互操作的数据库和软件机构之间的、潜在的侵犯隐私的。同样地,有一些担心限制了数据挖掘工作,忽略了机构同样强调他们的国土安全措施。

[3]约翰,“政府公然反抗数据挖掘系统的定义”华盛顿技术,1999年2月22日,[http://www.washingtontechnology.com/news/13_22/tech_ 1999年的功能/ 393-3.html]。 [4] 韩佳伟与米舍利娜,数据挖掘:概念和技术(纽约:摩根·考夫曼出版商,2001年),第7页。 [5] 彼得 Adriaans和道夫 Zantinge,数据挖掘(纽约:艾迪卫斯里,1996年),第5-6页。 [6] 同上,第2页。

[7] 两只乌鸦公司,《数据挖掘和知识发现的介绍》(第3版),(波多马克,MD:两只乌鸦公司,1999),第4页。

15

[7]

[6]

[5]

[4]

[3]

xxx本科学士论文

CRS-3

数据挖掘的局限性

尽管数据挖掘产品可能是非常强大的工具,但他们不可以自给自足的应用。要是成功的话,数据采集要求能构造分析并且解释产品被创造的熟练的技术和分析专家。 结果,数据采集的局限是主要数据或与人员相关的,而不是与技术相关。 [8]

尽管数据挖掘能够帮助揭示模式和关系,但它不能告诉用户这些模式的价值或意义。这些类型的应用都必须由用户使用来决定。同样的,发现模式的有效性取决于他们如何比较“真实世界”的情况。例如,以评估效力的数据挖掘应用程序设计去识别在一个大水坑里的潜在的恐怖分子嫌疑人,用户可以测试模型中使用的数据,这些数据包含了关于有名的恐怖分子。然而,尽管可能再确定一个特定配置文件,但是这并不意味着应用程序将会确定嫌疑犯,因为其行为明显偏离原模型。

另一组数据挖掘的限制是,虽然它可以识别行为和变量之间的连接,它并不一定确定的因果关系。例如,一项应用也许识别出一种行为模式的倾向,如购买机票,只是在飞机起飞之前不久买的,它关系到以下特征例如收入、教育程度水平和互联网的使用。然而,那并不一定表明机票购买行为是由于一个或多个上述变量。事实上,个人的行为可能会受到一些附加变量,如职业(需要在短时间内出差),家庭状况(一个有病的亲戚需要照顾),或一种嗜好(利用最后一分钟的折扣来访问新目的地)。

[9]

数据挖掘的利用

数据挖掘是以各种各样的用途在私人和公共部门应用。工业如银行、保险、医药、零售等通常使用数据挖掘技术可以降低他们的成本,增强研究,并增加销售量。例如,保险和银行等行业使用的数据挖掘应用来侦测诈骗和协助风险评估(例如,信用评分法)。使用客户所收集的数据在几年内,公司可以发展模型,预测客户有无一个良好的信用风险,或者是否意外权利要求可以欺骗、应当研究更密切。医疗团体有时用数据挖掘来帮助预测程序的有效性和医学奖。制药公司使用数据挖掘的化合物和遗传资料来帮助指导研究新的治疗疾病的方法。零售商可以利用收集的资料,通过亲和(例如,购物者的俱乐部会员卡,频繁的宣传单分,竞赛活动)来评估

[8] 同上,第2页。 [9] 同上,第1页。

16