摘要: |
随着信息技术的飞速发展,快速货物运输企业积累了大量的历史数据,但由于缺乏有力的分析工具,使得重要的决策常常不是基于数据库中丰富的数据,而是基于决策者的直觉。因此,通过提高数据分析的能力,进而提高决策的准确性就十分重要。数据挖掘技术是在信息技术发展的基础上发展起来的数据组织和分析新技术,本文重点研究数据挖掘技术在快速货物运输的决策中的应用问题,主要包括以下几个方面:
(1)介绍了数据挖掘技术相关的内容,包括所需要做的准备工作,一般应用过程,及常见的数据挖掘技术。详细分析了各种数据挖掘技术的不同点,并针对快速货物运输的特点选择合适的方法——决策树方法。
(2)探讨决策树的构造,并基于现有的一些决策树算法,特别是CART算法,提出改进算法。
(3)参照相关的数据挖掘过程,通过数据库收集中铁快运北京分公司办理量等数据,并对数据进行抽取、转换等处理,把“有价值的、干净”的数据加载到数据库中,完成数据的预处理,以降低数据之间的相关性和减少变量个数。
(4)结合实际工作,针对中铁快运北京分公司办理量数据,用改进的决策树算法建模,对货物运输需求进行预测。在建模过程中,由系统自动剔除异常点,改善数据质量,最终得到一个二叉树的模型,并对该模型作了相关解释。 |