星论文网欢迎您的来访,本中致力于各类论文代写,论文发表,代写代发论文服务

想快速发表职称论文找星论文网
当前位置:代写网论文资料->管理论文->信息管理论文

数据挖掘在高校学生综合测评中的应用

作者:代写论文  来源:星论文网  发布时间:2009-07-12 12:42:50
[要 ] 首先对数据挖掘的起源以及发展过程作简要概述,重点分析介绍数据挖掘以及相关概念的含义。然后引入管理信息系统的相关内容,着重分析当前管理信息系统开发过程,并进而引入大学生综合测评系统作为典型范例,展开论述。对学生综合测评系统这一概念以及相关知识进行介绍与分析研究,讨论当前这种典型的管理信息系统中存在的问题与相关解决对策。介绍详细系统开发过程,通过多方面的调查研究与需求分析产生相关模型和总体构架,完成概念结构、逻辑结构设计和数据库设计,并最终编程实现。其次,对数据挖掘的应用进行总结与初步探究。最后,结合数据挖掘在管理信息系统中的应用,进一步展开论述。重点分析数据挖掘的相关方法、步骤、各类应用模式等内容。
 [关键词]数据库 数据挖掘 应用分析
一、数据挖掘概述
数据挖掘也可以称为数据库中的知识发现,就是从大量的,不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一个多学科交义研究领域,它融合了数据库技术、人上智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果。经过十几年的研究, 产生了许多新概念和新方法。特别是最近几年, 一些基本概念和方法趋势于清晰, 它的研究正向着更深入的方向发展。
随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润,而这种从海量数据库中挖掘信息的技术,就称之为数据挖掘。
二、数据仓库与数据挖掘
数据仓库与数据挖掘有以下关系:
1、数据仓库系统的数据可以作为数据挖掘的数据源
因为数据仓库系统已经按照主题将数据进行了集成、转换, 因此数据仓库系统能够满足数据挖掘技术对数据环境的要求, 可以直接作为数据挖掘的数据源。如果将数据仓库和数据挖掘紧密联系在一起, 将获得更好的结果。
2、数据挖掘的数据不一定必须是数据仓库系统
作为数据挖掘的数据源不一定必须是数据仓库。它可以是任何数据文件或格式, 但必须事先进行数据预处理, 处理成适合数据挖掘的数据。数据预处理是数据挖掘的关键步骤,在数据挖掘全过程占的很大比重。数据仓库是面向主题的、集成的、不可更新的、随时间的变化不断变化的, 这些特点决定了数据仓库的系统设计不能采用同开发传统的数据库一样的设计方法。
通常, 数据仓库使用时间越长, 它进化得越好。该进化进行多遍。开始, 数据仓库主要用于产生报告和问答预先定义的查询。渐渐地, 它用于分析汇总的和细节的数据, 结果以报告和图表形式提供。稍后, 数据仓库用于决策, 进行多维分析和复杂的切片和切块操作。最后, 数据仓库能用于知识发现, 并使用数据挖掘工具进行决策。在这种意义下, 数据仓库一工具可以分为存取与检索工具,数据库报表具, 数据分析工具和数据挖掘工具。
商业用户需要一种手段, 知道数据仓库用什么通过元数据, 如何访问数据仓库的内容, 如何使用数据分析具分析这些内容和如何提供分析结果。
三、数据挖掘技术
数据挖掘是一个需要经过反复多次处理的过程。如同软件程在软件开发中的作用, 数据挖掘的处理过程模型为数据挖掘提供了宏观指导和工程方法。合理的处理过程模型能将各个处理阶段有机地结合在一起, 指导人们更好地开发及使用数据挖掘系统。数据挖掘处理过程一般有几个阶段,这几个处理阶段分别是数据准备、数据选择、数据预处理、数据缩减、数据挖掘目标确定、挖掘算法确定、数据挖掘、模式解释及知识评价。
挖掘算法的确定需要反复试探、比较、调整。这里提出数据挖掘的一种新原型处理模型。该模型的思想是利用确定的数据挖掘目标选择算法, 根据确定的数据挖掘日标和挖掘结果调整算法, 在前一次的选择基础上重新筛选数据。

数据

准备
 
确定挖掘对象
知识发现算法
数据
挖掘
模型解释知识评价
1:管理信息系统
确定数据挖掘的目标根据用户的要求, 确定所要完成的数据挖掘是发现何种类型的知识, 确定知识模式及挖掘结果最终应达到的精度、范围等。知识发现算法根据确定数据挖掘的日标及各种学习算法的特点设计挖掘算法的详细步骤。详细设计算法的过程中, 可以根据确定的数据挖掘目标和挖掘结果调整算法, 返回数据准备阶段, 在前次的挖掘结果基础上重新筛选数据集。数据挖掘使用选择的算法对指定的数据集进行知识的提取。但由于数据量很小, 本模型在这一阶段的时间消耗将大大减少。
四、案例:数据挖掘在高校综合测评系统中的应用
数据挖掘工具是怎样准确地告诉你那些隐藏在数据库深处的重要信息的呢?它们又是如何作出预测的?答案就是建模。建模实际上就是在你知道结果的情况下建立起一种模型,并且把这种模型应用到你所不知道的那种情况中。比如说,如果你想要在大海上去寻找一艘古老的西班牙沉船,也许你首先想到的就是去找找过去发现这些宝藏的时间和地点有哪些。那么,经过调查你发现这些沉船大部分都是在百慕大海区被发现,并且那个海区有着某种特征的洋流,以及那个时代的航线也有一定的特征可寻。在这众多的类似特征中,你将它们抽象并概括为一个普适的模型。利用这个模型,你就很有希望在具有大量相同特征的另外一个地点发现一件不为人知的宝藏。
伴随我国高等教育由精英化教育向大众化教育逐渐转变,势必给学校学生管理带来诸多问题。 学生的信息是大量的和复杂的, 学生管理者越来越感到管理的复杂性,对于学生的状态和发展越来越难以预测。因此学校希望学生海量数据不只是简单的备份和查询,而更迫切地需要学生管理信息系统能够具备辅助决策的能力。 经过分析研究,数据挖掘技术正是解决这个问题可行而有效的方法。
数据挖掘就是从大量的不完全的有噪声的模糊的随机的实际应用数据中,提取隐含在其中的人们事先不知道的、 但又是潜在有用的信息和知识的过程。 数据挖掘研究是信息技术的汇总。它融数据库技术、 人工智能技术、 数理统计技术和可视化技术为一体, 是一个多学科相互交叉融合所形成的一个新兴的具有广泛应用前景的研究领域。 当前数据挖掘的主要技术包括$特征提取、分类、聚类、相关性分析和偏差分析等。
为提高管理效率, 建立科学高效的高校学生综合测评系统,需要构建学生综合评价系统的数据仓库。 根据“学生信息数据仓库”的应用特点,现在一般使用由两层体系结构向三层体系结构过渡的方案。数据仓库的设计结构选用了目前较为流行的雪花模式。 主题事实表是汇总整理后的“综合测评事实表”,以及“学生基本情况”、“测试内容”、“设置”等三个维度表。 通过三个维度表,可以在建立数据立方体之后方便地在测试内容(包括德育、学业水平、课外实践活动)、设置(加权系数、课程设置)和学生基本情况(包括姓名、学号、性别等)各个维度上进行数据切片。由于SQL sever2000 的Analysis Services 是一个管理多维记录集(立方体)的服务器,故利用Analysis Services建立在前面设计的数据仓库的维度和多维记录集(立方体)很容易,只要按照Analysis Services 中的各种向导一步步进行就可以了。 通过数据仓库,在Analysis Services 的支持下可以十分方便的进行各种数据挖掘的模型可以选择决策树、聚类和第三方的算法)挖掘模型的参数可以由用户调整,使数据中的各种潜在的关系变得可视化,使异常数据更醒目。 在组织数据仓库和进行数据挖掘时, 在数据的质量和模型的选择方面可能会是目前建立数据仓库要特别注意的地方。
大学生综合测评系统一般采用多维数据模型。 该模型将数据看成数据立方体模式, 数据库模式为雪花模式(如前所述),采用统计归纳、空间分析和聚类的挖掘方法。测评系统可以按学号,时间,综合测评内容几方面立体查询。 将学生的测评系统内容分为独立的三个方面:德育部分、学业水平、课外实践活动。 如果把学生综合测评体系统视为三维立方体,那么通过对立方体的上卷、下钻、切片和切块,可以看到任何学生或任何班级在任意时间段的综合或某一项测评结果。(1)德育部分:本部分可以根据以往经验采取学生互评,教师测评相结合。每学期由同学按项互评,然后辅导员和班主任测评,综合二者分数录入系统。 本部分不实行标准化过程。(2)学业水平:学业水平按必修核心课程、必修一般课程、选修课程三个模块,在计算测评分时,可分别赋予可调权重。对每个学生,计算每个学期的学分积。 学年或综合只需将相应的学期的学分积相加,同时也要显示平均成绩。 然后将学分积标准化。 (3)课外实践活动:课外实践活动采取加分制,其中分为几个单项,每项有上限,即最多可得多少分(可调),然后标准化。 这部分是将测评定量计算。 拟分为社会实践、参加社团、课外活动三个方面。 每一项制定一个上限,校院级制定可调加权系数,采取加分,类似奖励学分制度,最后用标准化可得测评分。
依据测评分,运用数据挖掘的决策树法将测评结果进行分类,实现定性化测评,可考虑按排名前20%为优,20%至40%为良,40%至60%为中,60%至80%为较差,后20%为差的规则,让系统自动划分,并且显示学生的定性分析结果。
假如某生不及格科目太多,临近退学,系统马上将其情况显示: 你的如下课程有过不及格记录:xx,55 分;xx,51分;。。。。。。;xx,43分;总学分x分,即将到退学边缘,提醒你注意! 其中“退学”是可调的,如换成“无学位”等。
五、综合测评系统中数据挖掘应用分析
数据挖掘是个非线性的过程,在综合测评系统建立良好的模型,保证数据挖掘有条不紊地实施并取得成功,就要不断重复、循环,各个阶段在具体实施中可能需要多次建立,有一个完整的流程。
1.确定数据挖掘的目标。在开始数据挖掘之前,企业最基础的工作就是对挖掘目标的确定,这是数据挖掘成功实施的前提。确定企业想要了解哪些方面的信息。如企业想了解某种产品在某市的试销中,购买了该产品的客户群是否有一些共同属性?如果发现了这些共同属性,那么在整个市场全面开展销售时就可以对具有这些属性的客户重点关注,提升销售业绩。
2.数据的收集。确定数据挖掘目标之后,就要展开数据的收集工作,对基础数据进行了解和选择。比如,企业首先要研究数据的获取渠道——数据从哪里获得?数据仓库是否建立?企业原有数据仓库中的数据,是否有满足此次数据挖掘任务需要的数据?已有数据的哪些字段可以被此次任务所用?因此,建立有效的数据仓库是进行数据分析之前必须要做的。
3.数据清洗及准备。该步骤是对收集的基本数据进行必要的转换、填补、清理及合并等处理,以消除数据噪声,提高数据的完整性、准确性和可信度,为后续的数据分析工作做准备。例如:通过上一步骤得到的数据集市中,有多少样本量,多少字段,哪些字段是因变量,哪些是自变量,哪些字段是连续型定量变量,哪些是离散型定量变量、序数型定性变量或者名义型定性变量,哪些字段数据存在缺失现象,是否能够通过填补或者合并进而客观地补齐缺失数据等。这一阶段的重要工作还包括:将字符型变量变换为数值型变量;通过技术手段对数据录入过程中的明显错误进行排查及更正。
4.数据初步分析。这一步骤的工作较为繁重,因为企业需要在这一步中做好建模前的所有准备工作,具体包括:基于模型的数据变换、研究每个字段的取值分布、字段之间的相关性及联合分布、数据降维,以及可能进行的离散化操作等。
5.建立模型。建模是数据挖掘的核心环节,可分为以下步骤进行:(1)建模方法选择。就是根据前面所确定的数据挖掘的目标,从多种方法中选择一种方法或多种合适的方法来对数据进行建模;(2)将总数据集划分训练集和测试集。一般采用分层随机抽样在建模之前将总数据集划分为训练集和测试集,即保持目标变量——因变量的取值在训练集和测试集中比例与总数据集相同;(3)建立模型及结果解释。对训练集用已选择的建模方法进行建模,并分析和解释得到的模型表达式。
6.评估模型。对建好的模型进行评估和表示,这是数据挖掘中不可缺少的环节。运用实验数据或新的样本数据进行检验,评估挖掘结果的可用性和可信性,并在此基础上,调整和修改数据模型和挖掘方法。
7.模型总结与应用。把建立好满意的模型所发现的知识应用到实际工作中,在企业内应用和部署模型,为决策提供支持。如根据得到的知识可以设置某些触发器,当满足条件时进行特殊处理。
随着信息技术的飞速发展,利用综合测评系统进行学生成绩综合管理,已成为学校提升自身竞争力的重要选择。特别是数据挖掘技术的发展也为综合测评系统的实施提供了良好的基础平台和技术支撑,它的运用将会增强学校的潜力开发、创新和管理能力,推动学校的整体信息化建设。今后随着数据挖掘技术的理论进一步发展和深化,必然会带给综合测评系统更为广泛的应用前景和使用价值,提高学校管理能力。另外,数据挖掘在其它管理信息系统当中的应用也必将大大提高系统效率,为今后更广泛领域的管理信息系统提供服务。
 
参考文献
1吴苏、史惠利、张可、张鹏飞,等.《基于ASP.NET的高校学生综合素质测评系统的设计与实现》.2007年6月49~52页
2刘洁、武智慧,等.《基于Delphi的高校学生综合素质测评系统的设计》2007年79~87页
3李南、张家驯,等.《学生综合测评系统的设计与实现》常州技术师范学院学报,1999年5月40~43页
4徐向红.《基于Excel的学生综合测评系统》中国现代教育装备2006年7月71~74页
5陈显祥.《基于学生综合测评系统数据挖掘应用研究》贵阳:贵州大学计算机软件与理论系,2007;
6牛祥春.《对大学生综合测评系统构建的思考教育新导向》2003年12月32~34页
7萨师煊、王珊.《数据库系统概论》(第三版).北京:高等教育出版社,2004年10~23页;
8安淑芝等.《数据仓库与数据挖掘》北京:清华大学出版社,2005年102~234;
9王贵农等.《构建人学生素质综合测评体系的动因、原则及处理好的几个关系》南京航空航天大学学报,2001年3月58~60页

本文TAGS:代写论文
  • 好的评价如果您觉得此论文资料好,就请您
      0%(0)
  • 差的评价如果您觉得此论文资料差,就请您
      0%(0)
文章评论
   评论摘要(共 0 条,得分 0 分,平均 0 分)
如您需要代写代发表论文请联系QQ:800054855