[00348167]基于多维支持向量机的P2P流量识别方法研究
交易价格:
面议
所属行业:
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
提出了一种多维支持向量机(MSVM)训练方法,建立了一种基于多维支持向量机的P2P网络流量识别模型。该模型利用多维支持向量机作为分类器来识别P2P流量,各种网络流量经过数据捕获模块、特征提取模块、数据预处理模块以及MSVM训练模块将网络流量分类成P2P流量和NonP2P流量,再经过组建的MSVM支持向量库识别出具体的P2P流量和未知P2P。提出了基于通信网络拓扑结构的P2P流识别模型P2P-CNTIM。模型使用异常检测和P2P流的多主机特征和通信对端类型特征对P2P流进行识别,并通过这两个特征的有机结合以提高模型的识别准确率和识别效率。为提高分类模型的稳定性,提出了基于决策树分类器集成模型用以识别流量。模型首先利用特征选择方法(FCBF)提取最优分类特征信息,按Bagging随机抽样原理形成5个子分类器,依少数服从多数原则生成决策模型。借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,用SVDD方法寻找包含大部分样本最小超球,保留各自支持向量样本点作为识别模型;计算测试样本距各球心距离,距离近者为其所属类别。提出了基于K均值集成和支持向量机相结合的P2P流量识别模型,以保证流量识别精度和稳定性,克服聚类识别模型中参数值难以确定、复杂性高等缺点。对少量标签样本采用随机簇中心的K均值算法训练基聚类器,按最大后验概率分配簇标签,无标签样本与其最近簇标签一致;按投票机制集成无标签样本标签信息,结合原标签样本训练支持向量机识别模型。为解决网络样本标注的难题,实现多种网络流量环境中的主动学习,提出一种基于支持向量机后验概率的网络流量识别方法。结合支持向量机输出和Sigmoid函数拟合样本所属类别后验概率,用其中较大的2类概率信息熵值衡量样本影响分,借助支持向量机和不确定性采样策略实现主动学习过程,形成流量识别模型。原型系统的实验结果表明,上述提出的模型和方法都取得良好的效果。项目执行期间获江苏省科技进步奖一个,出版专著一部,发表论文44篇,录用5篇,其中SCI收录3篇,EI收录23篇,获得和申请专利17项,培养研究生21名,完成了项目合同的任务。
提出了一种多维支持向量机(MSVM)训练方法,建立了一种基于多维支持向量机的P2P网络流量识别模型。该模型利用多维支持向量机作为分类器来识别P2P流量,各种网络流量经过数据捕获模块、特征提取模块、数据预处理模块以及MSVM训练模块将网络流量分类成P2P流量和NonP2P流量,再经过组建的MSVM支持向量库识别出具体的P2P流量和未知P2P。提出了基于通信网络拓扑结构的P2P流识别模型P2P-CNTIM。模型使用异常检测和P2P流的多主机特征和通信对端类型特征对P2P流进行识别,并通过这两个特征的有机结合以提高模型的识别准确率和识别效率。为提高分类模型的稳定性,提出了基于决策树分类器集成模型用以识别流量。模型首先利用特征选择方法(FCBF)提取最优分类特征信息,按Bagging随机抽样原理形成5个子分类器,依少数服从多数原则生成决策模型。借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,用SVDD方法寻找包含大部分样本最小超球,保留各自支持向量样本点作为识别模型;计算测试样本距各球心距离,距离近者为其所属类别。提出了基于K均值集成和支持向量机相结合的P2P流量识别模型,以保证流量识别精度和稳定性,克服聚类识别模型中参数值难以确定、复杂性高等缺点。对少量标签样本采用随机簇中心的K均值算法训练基聚类器,按最大后验概率分配簇标签,无标签样本与其最近簇标签一致;按投票机制集成无标签样本标签信息,结合原标签样本训练支持向量机识别模型。为解决网络样本标注的难题,实现多种网络流量环境中的主动学习,提出一种基于支持向量机后验概率的网络流量识别方法。结合支持向量机输出和Sigmoid函数拟合样本所属类别后验概率,用其中较大的2类概率信息熵值衡量样本影响分,借助支持向量机和不确定性采样策略实现主动学习过程,形成流量识别模型。原型系统的实验结果表明,上述提出的模型和方法都取得良好的效果。项目执行期间获江苏省科技进步奖一个,出版专著一部,发表论文44篇,录用5篇,其中SCI收录3篇,EI收录23篇,获得和申请专利17项,培养研究生21名,完成了项目合同的任务。