摘要: |
近年来数据挖掘技术一直是学术界的研究热点。李德毅院士提出的云模型是实现定量数据与定性概念之间转换的有力工具,并已经成功应用于海量数据的数据挖掘。
交通管理中心中存储了海量的数据,通过数据挖掘技术可以发现交通流的规律和知识。利用这些知识能够更好地进行交通规划、管理和控制。交通状态判别是交通控制中的重要一环。交通状态判别首先要确定交通状态的分类,交通状态分类的前提条件是进行很好的交通状态聚类。
本文主要分为三部分:
第一部分简单介绍本文涉及的数据挖掘技术的相关知识和云模型的相关概念,重点介绍正态云、正态云的数学性质和它的普适性。
第二部分简单介绍了概念层次的概念及其自动生成;提出了一种改进的云变换算法,去除了在求合适的熵时人工设置的阈值,使生成的初始概念更符合客观情况:在云模型“3En规则”基础上提出了一种基于云模型属性相似度的概念划分算法;对原有的云合并运算中的截断熵进行了更全面的定义;提出了基于云模型的概念层次划分评价算法,方便用户确定概念层次粒度和选择概念划分算法:最后简单介绍了隶属概念的判定方法。
第三部分将云模型引入交通流数据挖掘,对采集的交通数据进行概念划分验证了云模型在交通状态聚类中的有效性;应用两组采集的交通数据验证了设置阈值对生成初始概念的影响,并讨论了基于最小期望中心距离的概念划分算法和本文提出的基于云模型属性相似度的概念划分算法的适用性。结果表明,要根据不同的数据和不同的概念粒度应用不同的概念划分算法。
|