摘要: |
决策树学习是广泛被人们使用的一种学习方法。本文抓住决策树新面对的动态模糊性问题。引用动态模糊集基本理论,(1)提出基于DFS及相关理论的动态模糊决策树(DFDT):(2)提出了以属性论域成员为测试结点判断条件的选择算法;(3)以信息熵及其相关概念为评价标准的动态模糊数据离散化方法(论域、隶属度离散化)和测试结点选取方法;(4)提出了DFDT在建树阶段和匹配阶段中对缺失值属性的处理方法;(5)构造了DFDT自修剪系统,使DFDT产品在实际使用中自我完善;(6)使用DFDT为核心工具,建立了城市道路监控系统,对DFDT的应用进行了研究。
综上所述,本文的特色表现在:
(1)深入研究DFDT建树和匹配过程中对缺失属性条件的处理方法,使建树过程中充分利用包含缺失属性的样例,而在匹配过程中提高准确率。
(2)提出了DFDT的自修剪系统,使DFDT在实际使用中能随使用次数增加而提高性能,减少DFDT在建树阶段中对训练数据过度拟合的负面影响。
(3)对DFDT在各领域的应用做了研究,并以计算程序模拟了运行过程。
尽管如此,本文的工作还很基础,今后还有许多工作需做进一步研究,如DFDT建树速度优化、DFDT自修剪中的结构优化等。 |