关于jdbc：通过关键的”内部”分区进行有效分组

Efficient grouping by key “within” partitions

我正在尝试调整一个过程以激发灵感。
基本上，该过程分析来自JDBC数据源的成批数据
每个记录都有一个batchId，还有一个更高级别的groupId。

实际的分析代码无关紧要，但不适合reduceByKey或CombineByKey的更具体模型

我的想法是：

瓶颈似乎是groupByKey，据我所知，即使每批都包含在一个分区中，它也会强制进行随机播放(将数据写入磁盘)。

另一种可能的方法是使用batchId进行分区，但这将创建大量的分区-因此会有大量的查询

有没有一种方法可以在分区内按组进行分组？
还有其他可能的方法吗？