如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?

How do I make a simple day dimension table for data warehousing star schema with postgresql?

我将如何在 postgreSQL 中为星型模式创建和填充简单的 DAY 维度表?
这是一个数据仓库的入门课程,所以它只有几个字段,但大多数在线示例都非常复杂,对于初学者来说似乎非常复杂。这不是为了作业 - 这是为了学习,因为我正在尝试使用事实表制作我自己的简单星型模式,以便我可以开始熟悉它。

谁能给我一个简单的例子,说明我如何用几个字段创建表(day_key 作为代理键,一个描述日期的字符串,以及一些表示天或月的整数值)所以我至少可以开始理解?


一个非常简单的 DAY 维度表,应该适用于大多数版本的 PostgreSQL(我使用的是 10.5)。这只是应该帮助刚接触数据仓库的人制定一个基本的日常维度,以便在刚开始时使用。

创建日表

1
2
3
4
5
6
7
8
CREATE TABLE DAY (
    day_key SERIAL PRIMARY KEY, -- SERIAL is an integer that will auto-increment as new rows added
    description VARCHAR(40), -- a 'string' for a description
    full_date DATE, -- an actual date type
    month_number INTEGER,
    month_name VARCHAR(40),
    YEAR INTEGER
);

在 Day 维度中插入行

1
2
3
4
5
6
7
8
9
10
11
12
13
INSERT INTO DAY(description, full_date, month_number, month_name, YEAR)
SELECT
to_char(days.d, 'FMMonth DD, YYYY'),
days.d::DATE,
to_char(days.d, 'MM')::INTEGER,
to_char(days.d, 'FMMonth'),
to_char(days.d, 'YYYY')::INTEGER
FROM (
    SELECT generate_series(
        ('2019-01-01')::DATE, -- 'start' date
        ('2019-12-31')::DATE, -- 'end' date
        INTERVAL '1 day'  -- one for each day between the start and day
        )) AS days(d);

结果Sample

注意事项:

  • 基本上,您只是使用嵌套 SELECT generate_series(... 生成的行插入到 Day 表中。
  • 我使用上面的 FM 两次来删除在某些日期格式中自动生成的一些空白填充。
  • 我建议您在第一次执行此操作时删除 INSERT INTO day(...) 行,以确保每列的格式是您在将其插入表格之前所追求的格式。

这只是我所看到的常用方法——查看 PostgreSQL 文档有一些更全面和更好的示例,这些示例说明了格式化日期类型和获取各种有用维度的更多方法。