数据仓库中如何准确的确定主题以及主题与数据集市的关系
1、我现在做一个人口信息系统,业务有出生、死亡、迁移、出国等业务,这些业务一同维护一个常住人口的基本信息表。 那么在这样的一个数据仓库中,主题是什么? 我感觉只有一个就是常住人口,因为其他的业务都和常住人口有关系,常住人口ID可以作为这些业务的通用码键。不知是否正确?
2、由于数据仓库建设的庞大和复杂,经常建立一个能马上投入适用的小型数据仓库,成为数据集市。
根据上述,这个数据集市只有一个主题。那么要在这个数据集市中建立什么样的事实表比较合适?
问题点数:100、回复次数:4Top
1 楼yongwc(疯狂客)回复于 2006-03-10 09:39:30 得分 0
人员可以作为一个分析的主题吧.事实表就是人员变动记录表.该表中记录了所有的人员变动情况,包括出生、死亡、迁移、出国等业务.
如果数据量大,可以对根据时间对事实表进行分区.然后,根据经常统计分析的需要确定主题的维度.Top
2 楼qcbao()回复于 2006-03-10 11:05:48 得分 0
当时间发生变化时每个人的状态就可能发生变化,那么时间维的处理就很重要,同时要看客户需要的时间刻度情况。Top
3 楼notruiyi(什么乱七八糟的)回复于 2006-03-15 08:39:19 得分 0
关于你标题的问题"数据仓库中如何准确的确定主题以及主题与数据集市的关系"
回答应该是经验,现在很多常用仓库的主题都是变化不大的,可以搜索到主要的主题,自己再进行相关分析,精简.
第二个,出生、死亡、迁移、出国都可以做成主题,关键看你最终的需求,也就是看最终是否要合并
Top
4 楼bygoner(白扛)回复于 2006-03-15 12:43:25 得分 0
先画几个case图吧,你需要做什么呢?比如你可能要分析年龄和死亡的关系,那是否死亡是个度量,年龄是个维度。不知道我有没有说错Top




