程序代写代做 • 2.投影寻踪模型

• 2.投影寻踪模型
• 投影寻踪(projection pursuit model,简称PP模型)是一种可用于高维数据分析,既可以作探索性分析,又可以作确定性分析的方法。PP方法的特点主要有:(1)能成功克服高维数据所带来的严重困难;(2)可以排除与数据结构和特征无关的或者关系很小的变量的干扰;(3)为使用一维统计方法解决高维问题开辟了途径;(4)与其他非参数方法一样可以用来解决某种非线性问题。
• 投影寻踪模型建模过程步骤如下:
• 评价指标集归一化处理
• 假设各个指标样本集,其中n,p分别为样本的个数和农业产业结构调整效果评价的指标数。为消除量纲,对各指标值进行归一化处理:
• 对于越大越优的指标:
• 对于越小越优的指标:
• 式中:为指标特征值归一化后的序列;和为第j个指标值的最大值和最小值;为第i个样本的第j个指标值。
• 构造投影指标函数Q(a)
• 投影寻踪方法就是把p维数据综合成以 为投影方向上的一维投影值:

• 式中:a(j)为第j个指标值的单位长度向量;x(i,j)为指标特征值归一化后的序列;z(i)为第i个样本的投影值。投影值z(i)的散布特征为:整体上投影点之间尽可能散开,而在局部投影点尽可能密集,最好凝聚成若干个点团。因此,投影指标函数可表达为:

• 式中:Sz为投影值z(i)的标准差;Dz为投影值z(i)的局部密度;Q(a)为投影指标函数,即:


• 式中:E(z)序列的平均值;R为局部密度的窗口半径,可以根据试验来确定,一般可取0.1;r(i,j)样本之间的距离,;u(t)为单位阶跃函数,当t<0,其函数值为0,当t≥0,其值为1。
• 优化投影目标函数
• 当指标值的样本集合确定后,指标函数Q(a)只随着a的变化而变化。最佳投影方向最大可能地反映了高维数据特征结构的投影方向,可通过求解指标函数最大化来确定最佳投影方向。最大化目标函数:

• 约束条件:
• ,
• 这是一个以优化变量的复杂非线性优化问题,用传统的优化方法处理较难。因此,本文应用模拟生物优胜劣汰与群体内部染色体信息交换机制的基于实数编码的加速遗传算法(RAGA)来解决其高维全局寻优问题。
• 分类与优序排列
把所求得的最佳投影方向。a*代入后可得各方案点的投影值之z*(i)。将z*(i)值从大到小排序,则可以判断优序。