【中文摘要】聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域。聚类算法可以分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。层次聚类算法和基于划分的Kmeans聚类算法是实际应用中聚类分析的支柱,算法简单、快速而且能有效地处理大数据集。针对层次聚类算法的高计算性,本文通过对聚类对象间的距离进行排序来避免合并类时重新计算类间距离,降低算法的计算复杂性,使算法的可伸缩性更好。为了克服层次聚类算法的某一次合并或分裂后不能更改对象所属的类的缺点,本文利用层次聚类的聚类结果,利用其类结构,计算其中心点并将它作为Kmeans算法的初始聚类中心,从而避免了Kmeans初始聚类中心随机选择所导致的聚类结果的随机性的缺点,并且对对象的所属类别加以修正,提高聚类的准确率。最后,本文探讨了改进算法在径向基函数(RBF)神经网络分类器设计中的应用,利用改进聚类方法自动确定径向基函数的数目、基函数中心及宽度,输出层权值由线性方程组确定的RBF网络设计方法。通过对uci数据集的仿真实验,表明该RBF网络更加稳定高效。');
【Abstract】Clusteringanalysisisamajorfieldindatamining,whichisanimportantmethodofdatapartition.Clusteringanalysisnowhasbeenappliedintovariouswaysinstatistics,machinelearning,spatialdatabase,biologyandmarketanalysisandsoon.ClusteringAlgorithmsincludespartitioning,hierarehieal,density-based,grid-based,model-basedAlgorithm.ThehierarchicalclusteringAlgorithmandthepartitioningKmeansAlgorithmareusedfrequencybecauseofitssimpleuseanditshandlelargedataability.FocusonthehierarchicalclusteringAlgorithm\'shighcompute,thispaperthroughsortingthedistanceofthedatatoavoidrecalcutingthedistancebetweentheclass,thusloweredthecalculatecomplex,itmaketheflexibleoftheAlgorithmbetter.InordertoavoidthehierarchicalclusteringAlgorithm\'scannotadjustthedata\'sclass,wetakeovertheclassstrucster,attaintheclassCentroid,whichcanbeusedastheKmeansAlgorithminitialclasscentroid.ThusavoidedtheresultunsteadycausedbytheKmeansAlgorithminitialclassCentroidselectfromrandom.Inthelastofthispaper,weproposeamethodofdesignRBFNeuralNetworkusingtheimprovedClusteringalgorithmtodeterminethenumberandcenterandspreadofRedialBasisFunction,itsoutputlayer\'sweightsdeterminesbythelinearequations.ThesimulateexperimentoffunctionapproximationexplainstheRBFNeuralNetworkmorestableandhighefficiency.
付费硕士论文:文章格式正规,摘要、关键词、图表、代码、参考文献齐全如需全文请联系QQ:271245358
注:此文严禁擅自转载,客户付费购买后永久清除,本站保证购买者的唯一性。
本文TAGS:[标签:文章关键词]