本发明设计一种基于多维高斯分布贝叶斯分类的癌症复发预测系统。该系统利用预处理模块、训练模块和贝叶斯分类器实现癌症复发的预测。预处理模块对训练集进行数据清洗并生成类向量数据集;训练模块首先计算两个类属性先验概率,然后利用pearson相关系数将数据属性分成与类属性关联度紧密的类数据属性集合和与类属性关联度稀疏的两类数据属性集合,两类数据属性集合分别利用多维高斯分布和一维高斯分布来计算相应的概率;贝叶斯分类器将两者概率及类別的先验概率联合共同作为数据属于每个类的概率,并据此判別癌症的分类测试结果。本发明提高了癌症是否复发的预测准确率。