关于并发性:PostgreSQL的这个通用MERGE / UPSERT函数是否安全?

Is this generic MERGE/UPSERT function for PostgreSQL safe?

我创建了一个"合并"函数,它应该执行UPDATE或INSERT查询,具体取决于现有数据。此函数不是为每个表编写upsert-wrapper(如大多数可用示例中所示),而是采用整个SQL字符串。这两个SQL字符串都是由我们的应用程序自动生成的。

计划是这样调用函数:

1
2
3
4
5
6
-- hypothetical"settings" table, with a primary key of (user_id, setting):

SELECT MERGE(
    $$UPDATE settings SET VALUE = 'x' WHERE user_id = 42 AND setting = 'foo'$$,
    $$INSERT INTO settings (user_id, setting, VALUE) VALUES (42, 'foo', 'x')$$
);

这是merge()函数的完整代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
CREATE OR REPLACE FUNCTION MERGE (update_sql TEXT, insert_sql TEXT) RETURNS TEXT AS
$func$
DECLARE
    max_iterations INTEGER := 10;
    i INTEGER := 0;
    num_updated INTEGER;
BEGIN
    -- usually returns before re-entering the loop
    LOOP

        -- first try the update
        EXECUTE update_sql;
        GET DIAGNOSTICS num_updated = ROW_COUNT;
        IF num_updated > 0 THEN
            RETURN 'UPDATE';
        END IF;

        -- nothing was updated: try the insert, watching out for concurrent inserts
        BEGIN
            EXECUTE insert_sql;
            RETURN 'INSERT';
        EXCEPTION WHEN unique_violation THEN
            -- nop; just loop and try again from the top
        END;

        -- emergency brake
        i := i + 1;
        IF i >= max_iterations THEN
            RAISE EXCEPTION 'merge(): tried looping % times, giving up now.', i;
            EXIT;
        END IF;

    END LOOP;
END;
$func$
LANGUAGE plpgsql;

它似乎在我的测试中运行良好,但我不确定我是否没有错过任何关键的内容,特别是关于并发UPDATE / INSERT / DELETE查询,可以在不使用此函数的情况下发出。我忽略了什么重要的事吗?

我为此功能咨询的资源包括:

  • PostgreSQL手册中的UPDATE / INSERT示例40.2
  • 为什么UPSERT如此复杂?
  • SO:插入,重复更新(postgresql)

(编辑:其中一个目标是避免锁定目标表。)


您的问题的答案取决于您的应用程序将如何访问数据库的上下文。 有很多方法可以解决这个问题,正如您自己引用的depesz的帖子中所讨论的那样。 此外,您可能还想考虑使用可写CTE,请参阅此处。 还有[问题]插入,在PostgreSQL中重复更新? 为您的决策过程进行了一些有趣的讨论。