论文部分内容阅读
淘宝网内的商品可谓是琳琅满目,涉及到了人们生活中的方方面面。当客户通过终端登录到淘宝网后,首先要面临的问题是如何选出一家心仪的店铺;而当购买者进入店铺购买商品时,需要通过浏览商品的评语来进一步了解商品,但由于大量“滥竽充数”评语的存在,致使整个评语数据集呈现一种极度不平衡的状态,很难从中获取到有效信息。因此需要建立一种面向淘宝客户的决策分析的数学模型,对店铺和商品进行决策分析,为客户提供决策支持。针对传统的TOPSIS决策分析方法在权重不能获得情况下难以进行决策分析的问题,将部分序集表示方法引入TOPSIS模型中,进一步加强了排列的健壮性;针对传统的前景理论模型在决策分析时没有考虑到决策者的主观风险态度的问题,提出了一种基于前景理论的多要素灰数关联的决策方法。将多要素灰数关联系数引入到前景理论的价值函数中,通过构建模型求出最优权重,然后将方案进行排序。为了改善不平衡的评语数据集的分类问题,本文从样本采样和分类算法两方面进行优化。样本方面,对决策边界的少类样本进行循环过采样生成新样本集,并与决策边界外合成的少类样本集合并,提高样本的重要度;针对传统ε-SVM在对不平衡数据集分类时超平面偏移的问题,引入了正负惩罚系数和混合核函数,并利用客观的熵值法选取惩罚系数,提高了分类算法的性能;针对提出的分类模型在分类时参数过多难以确定的问题,本文引入了粒子群优化参数的方法,并在传统粒子群优化方法的基础上引入了反馈调节的机制,提高了参数寻优的精确度。利用本文提出的两种优化的决策分析方法对各个备选的淘宝店铺进行智能排序,实验结果显示,本文提出的两种决策分析方法对店铺的排序结果与淘宝官方给出的评价结果一致,证明了本文的决策方法具有一定的使用价值;利用本文提出的的分类模对评语进行分类,实验结果表明,本文的分类模型的F-measure值要高于标准的SVM算法,证明了本文的分类模型可以通过精确的分类为客户提供决策支持。