[00272633]一种非平衡IPTV数据集上的少数类样本的合成方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610753263.9
交易方式:
技术转让
技术转让
技术入股
联系人:
南京邮电大学
进入空间
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种非平衡IPTV数据集上的少数类样本的合成方法,用于解决现有少数类数据合成方法中对少数样本不加以分析处理直接生成新样本而造成的后续分类预测模型性能下降的缺陷,本发明的实施流程为首先找出少数类样本的邻居集合,根据邻居样本所属类别的比重将其分为噪声集、安全集和危险集三类,对噪声集中的样本不做处理,对安全集和危险集计算其比率并计算相关概率,以此概率选择安全集或危险集,基于所选集合中的样本产生新的少数类样本;采用本发明的方法,可以去除对分类其负面作用的少数类样本效应,并且增加分类面附近的少数类样本的效用,所获得的新的少数类样本可以更好地提升后续分类、预测模型的性能。
本发明公开了一种非平衡IPTV数据集上的少数类样本的合成方法,用于解决现有少数类数据合成方法中对少数样本不加以分析处理直接生成新样本而造成的后续分类预测模型性能下降的缺陷,本发明的实施流程为首先找出少数类样本的邻居集合,根据邻居样本所属类别的比重将其分为噪声集、安全集和危险集三类,对噪声集中的样本不做处理,对安全集和危险集计算其比率并计算相关概率,以此概率选择安全集或危险集,基于所选集合中的样本产生新的少数类样本;采用本发明的方法,可以去除对分类其负面作用的少数类样本效应,并且增加分类面附近的少数类样本的效用,所获得的新的少数类样本可以更好地提升后续分类、预测模型的性能。