
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
类别数据是一种离散数据。类别属性可取有限个不同的值且这些值之间无大小和顺序,如国家、工作、商品类别等。本文南宁计算机培训和大家一起了解一下类别概念层次树的简介,
构造类别属性的概念层次树的主要方法有以下几种。
1)属性值的顺序关系已在用户或专家指定的模式定义中说明。构造属性(或维)的概念层次树会涉及一组属性,在(数据库)模式定义时指定各属性的有序关系,可以有助于构造出相应的概念层次树。
例如,一个关系数据库中的地点属性将会涉及以下属性:街道、城市、省和国家。根据(数据库)模式定义时的描述,可以很容易地构造出(含有顺序语义)层次树,即街道<城市<省<国家。
2)通过数据聚合来描述层次树。这是概念层次树的一个主要(手工)构造方法。在大规模数据库中,通过穷举所有值而构造一个完整的概念层次树是不切实际的,但可以通过对其中的一部分数据进行聚合来描述层次数。例如,在模式定义基础上构造了省和国家的层次树,这时可以手工加入{安徽、江苏、山东}⊂ 华东地区和{广东、福建}⊂ 华南地区等“地区”中间层次。
3)定义一组属性但不说明其顺序。用户可以简单将一组属性组织在一起以便构成一个层次树,但不说明这些属性的相互关系。这就需要自动产生属性顺序以便构造一个有意义的概念层次树。
没有数据语义的知识,想要获得任意一组属性的顺序关系是很困难的。一个重要线索就是,高层次概念通常包含了若干低层次概念。定义属性的高层次概念通常比低层次概念包含少一些的不同值。根据这一线索,就可以通过给定属性集中每个属性的一些不同值自动构造一个概念层次树。
拥有最多不同值的属性被放到层次树的最低层,拥有的不同值数目越少的属性在概念层次树上所放的层次越高。这条启发知识在许多情况下的工作效果都很好。用户或专家在必要时,可以对所获得的概念层次树进行局部调整。
假设用户针对商场地点属性选择了一组属性,即街道、城市、省和国家。但没有说明这些属性的层次顺序关系。地点的概念层次树可以通过以下步骤自动产生。
① 根据每个属性不同值的数目从小到大进行排序,从而获得以下顺序,其中,括号内容为相应属性不同值的数目。
国家(15)、省(65)、城市(3567)和街道(674339)。
② 根据所排顺序自顶而下构造层次树,即第一个属性在最高层,最后一个属性在最低层
③ 用户对自动生成的概念层次树进行检查,必要时进行修改以使其能够反映所期望的属性间相互关系。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请添加3216764521学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。