专利名称: | 一种基于扩展熵信息瓶颈理论的聚类方法 |
摘要: | 本发明公开了一种基于扩展熵信息瓶颈理论的聚类方法,主要是针对数据挖掘中无监督聚 类问题,当聚类数组之间关系复杂而又无法用统计概率描述的数组集合聚类问题,该方法既 可以体现数组之间复杂的相关性,又可以体现数组对应位置之间的对应关系,而且该聚类方 法可以提供一个客观的聚类截尾准则,有效避免由主观指定聚类个数的缺陷。该聚类方法可 以广泛应用于医学、智能交通、模式识别等领域的聚类问题。 |
专利类型: | 发明专利 |
国家地区组织代码: | 山东;37 |
申请人: | 山东省计算中心 |
发明人: | 孙占全 |
专利状态: | 有效 |
申请日期: | 2008-08-22T00:00:00+0800 |
发布日期: | 2019-01-01T00:00:00+0800 |
申请号: | CN200810139542.1 |
公开号: | CN101655847 |
分类号: | G06F17/30(2006.01)I |
申请人地址: | 250014山东省济南市科院路19号 |
主权项: | 1、一种基于扩展熵信息瓶颈理论的聚类方法,其特征在于,包括步骤: 根据样本确定聚类数组及数组的取值,计算每个取值的比值; 用比值代替概率计算聚类数组的扩展熵; 确定数组合并后联合扩展熵的计算形式; 根据信息瓶颈理论选择信息损失量最小的聚类数组进行合并,生成一个新的数组; 以聚类产生的信息损失量变化率作为确定聚类结束的标准,即获得最终的聚类结果。 |
所属类别: | 发明专利 |