针对传统数据挖掘方法无法胜任与日俱增的海量数据挖掘工作的问题,引入大数据挖掘技术,以粗糙集属性约简方法为基础,对经典K-means聚类算法进行改进,实现其在Hadoop平台的MapReduce框架上的并行化计算,形成满足海量数据挖掘工作的新算法。以某600 MW燃煤发电机组海量运行数据为挖掘对象,采用新算法对典型负荷工况下影响锅炉效率的运行参数进行挖掘,挖掘出可调控机组运行参数的最优目标值。结果表明:新算法可用于锅炉海量运行数据优化目标值的确定,节能减排效果良好,其挖掘出的优化目标值代表了历史最优可达值,可指导锅炉优化运行。