关于多线程：C-全局指针可以由不同的线程修改吗？

C - Can global pointers be modified by different threads?

全局指针在线程之间是否存在作用域？

例如，假设我有两个文件，file1.c和file2.c：

file1.c：

1
2
3
4
5
6
7
8
9

uint64_t *g_ptr = NULL;

modify_ptr(&g_ptr) {
//code to modify g_ptr to point to a valid address
}

read_from_addr() {
//code which uses g_ptr to read values from the memory it's pointing to
}

file2.c：

1
2
3

function2A() {
read_from_addr();
}

所以我有threadA，它通过file1.c运行并执行Modify_ptr(＆g_ptr)和read_from_addr()。然后，threadB运行，并通过执行function2A()的file2.c运行。

我的问题是：threadB是否看到g_ptr被修改？还是仍然看到它指向NULL？

如果不是这种情况，那么指针成为全局指针意味着什么？以及如何确保在不同线程之间可以访问此指针？

请让我知道是否需要澄清任何事情。谢谢

相关讨论

+1不错的答案，并感谢您希望使use-volatile-for-thread-synchro思想家安静下来(至少现在如此)。
@WhozCraig：对不起，我离开了一段时间。：P我没有说使用volatile进行同步。曾经不止一次。我的意思是使用它来防止编译器因自身利益而变得太聪明。即使这个答案也承认了它的作用，而我唯一的选择(每个人都在动摇易变的魔鬼党派路线)是，整个邪教组织中没有一个人尚未提供确凿的证据证明互斥量实际上在所有情况下都始终可靠地完成(甚至承诺要做)volatile工作。
我完全同意。它们有两个不同的目的，简单的和不太简单的。 volatile旨在容纳某些内容。就像同步对象旨在容纳某些东西一样。它们做不同的事情，当情况需要时，您很可能会看到我说"同步对象并非旨在做到这一点；易失性是"，因为我打算针对同步对象的设计不使用易失性。 volatile当然不是魔鬼，但如果不按预期使用，它肯定可以。 = P。同样，相反。
@WhozCraig：也可以编译此代码，以便将ptr存储在寄存器中。我看不出没有volatile就不会发生这种情况。顺便说一句。没有人说volatile用于同步，但是使用同步概念是先决条件。
@bkausbk，由此我们正式到达了100,000英尺的平流层。我编写了太多的线程安全代码，而不必一次将volatile固定到源代码中甚至讨论最终将无济于事的问题。 (这并不是说Ive从未使用过volatile；我有；但不是因为我担心寄存器中包含全局变量)。病到运气。每次(我现在要买彩票)。祝你一切顺利。
@bkausbk：volatile不是使用同步概念的先决条件。不允许编译器通过诸如pthread_mutex_lock()之类的不可内联函数调用将全局变量缓存在寄存器中，因为编译器无法知道该函数是否会修改全局变量，因此必须从内存中重新加载该变量。
@AdamRosenfield：好的，如果这是正确的，那么在这种情况下就不需要volatile。您有任何官方资料可供我阅读吗？
@bkausbk：请参阅C99语言标准：程序执行请参见5.1.2.3，volatile请参见6.7.3 / 6，序列点请参见附件C。关键文本是5.1.2.3/2，其中说"修改对象都是副作用。在序列点上，以前的所有副作用都是。评估应是完整的，以后的评估应没有副作用。"
@AdamRosenfield：好的，但是看起来与我的问题无关。您说"不允许编译器通过不可内联的函数调用在寄存器中缓存全局变量"，或者我错过了什么。
@bkausbk：全局变量是一个对象。如果您读取该变量，则调用一个修改该变量的函数，然后再次读取该变量，C语言标准中指定的抽象机表示，当您第二次读取该变量时，它将在函数调用。不需要完全一致的实现来完全实现抽象机，但是需要在顺序点上将其与可观察到的副作用相匹配。因此，在函数调用之后，读取的值必须是写入的最新值。
@bkausbk ：(续)因此，不允许编译器通过外部函数调用将全局变量缓存在寄存器中(如果函数位于同一翻译单元中，则编译器可能会推断出该函数可能无法修改全局变量)，因为这样做将不再与抽象机的语义匹配。
@AdamRosenfield：关于您对全局变量的声明：那么您是说全局变量仅在该文件中是全局变量吗？如果您有一个静态全局变量，会发生什么。该过程是全局的，还是仅存在于它的文件中？我不明白您说的意思是什么："不需要完全一致的实现来完全实现抽象机，而是需要在顺序点上将其与可观察到的副作用相匹配"。谢谢！

这个问题是导致并发编程困难的教科书示例。一个真正彻底的解释可以填满整本书，以及许多不同质量的文章。

好。

但是我们可以总结一下。全局变量位于所有线程可见的内存空间中。 (另一种选择是线程本地存储，只有一个线程可以看到。)因此，您可以期望，如果您有一个全局变量G，并且线程A向其写入值x，则线程B在读取该变量时将看到x。稍后的。总的来说，这是正确的-最终。有趣的部分是"最终"之前发生的事情。

好。

棘手的最大原因是内存一致性和内存一致性。

好。

一致性描述了当线程A写入G而线程B几乎同时尝试读取它时发生的情况。想象一下，线程A和B在不同的处理器上(为简单起见，我们也称它们为A和B)。当A写入变量时，它与线程B看到的内存之间存在许多电路。首先，A可能会写入其自己的数据缓存。它将存储该值一段时间，然后再将其写回主存储器。将高速缓存刷新到主存储器也需要时间：在导线，电容器和晶体管上必须来回传递许多信号，并且高速缓存与主存储器单元之间的对话很复杂。同时，B具有自己的缓存。当主存储器发生更改时，B可能至少不会立即看到它们，直到从该行重新填充其缓存为止。等等。总而言之，线程A的更改对于B来说可能要花几微秒的时间。

好。

一致性描述了当A先对变量G进行写入，然后对变量H进行写入时发生的情况。如果它先回读这些变量，它将看到写入按该顺序进行。但是线程B可能以不同的顺序查看它们，具体取决于H是否先从高速缓存刷新回主RAM。如果A和B同时(通过挂钟)同时写入G，然后尝试从中回读，会发生什么情况呢？他们会看到什么价值？

好。

在具有内存屏障操作的许多处理器上都必须实现一致性和一致性。例如，PowerPC有一个同步操作码，它说"保证在同步操作之后，任何线程都可以看到任何线程对主存所做的任何写操作。" (基本上，它是通过重新检查主RAM中的每个缓存行来完成此操作的。)如果您提前警告"此操作涉及同步内存"，则英特尔架构会在某种程度上自动执行此操作。

好。

然后，您会遇到编译器重新排序的问题。这是代码

好。

1
2
3
4
5
6
7

int foo( int *e, int *f, int *g, int *h)
{
*e = *g;
*f = *h;
// <-- another thread could theoretically write to g and h here
return *g + *h ;
}

可以由编译器在内部转换成更像

好。

1
2
3
4
5
6
7
8
9

int bar( int *e, int *f, int *g, int *h)
{
int b = *h;
int a = *g;
*f = b ;
int result = a + b;
*e = a ;
return result;
}

如果另一个线程在上面给定的位置执行写操作，则可能会给您完全不同的结果！另外，请注意在bar中写入是如何以不同顺序发生的。这是volatile应该解决的问题-它阻止编译器将*g的值存储在本地中，而是每次看到*g时强制其从内存中重新加载该值。

好。

如您所见，这不足以在许多处理器之间实现内存一致性和一致性。它的确是为以下情况而发明的：您有一个处理器试图从内存映射的硬件中读取数据(例如串行端口)，您希望每n微秒查看一次内存中的位置，以查看当前线路上的值。 (这就是他们发明C时I / O的工作方式。)

好。

怎么办呢？好吧，就像我说的那样，有整本关于这个主题的书。但是简短的答案是，您可能希望使用操作系统/运行时平台为同步内存提供的功能。

好。

例如，Windows提供了互锁的内存访问API，从而为您提供了在线程A和B之间进行内存通信的清晰方法。GCC尝试公开一些类似的功能。英特尔的线程构建块为x86 / x64平台提供了一个不错的接口，C ++ 11线程支持库也提供了一些功能。

好。

My question is: Does threadB see that g_ptr is modified?

大概。线程B通过read_from_addr()访问g_ptr，因此始终可以看到相同的g_ptr。这与g_ptr的"模块内全局性"无关：如果将g_ptr声明为static并具有内部链接，它也将同样有效，因为正如您在此处编写的那样，它出现在文件范围之前read_from_addr()。

Or does it still see that it's pointing to NULL?

可能不会。分配完成后，所有线程均可见。

这里的问题是，如果有两个线程正在访问共享数据，而其中至少有一个线程正在写入共享数据(此处就是这种情况)，则您需要同步对其进行访问，因为普通内存的读写不是原子的。例如，在POSIX中，这种情况下的行为在形式上是"未定义的"，这基本上意味着所有赌注都已关闭，并且您的机器可以进行恶意攻击，并且就标准而言可以吃掉猫。

因此，您确实希望使用适当的线程同步原语(例如，读/写锁或互斥锁)来确保程序运行良好。在具有pthreads的Linux上，您需要查看pthread_rwlock_*和pthread_mutex_*。我知道其他平台也有等效物，但我不知道它们是什么。

全局变量可用于所有线程。
例如：

结构雅拉古尔
{
字符名称[200];
int rollno;
struct yalagur *下一步；
}头;

int main()
{
thread1();
thread2();
thread3();
}

现在，以上结构在所有线程之间共享。

任何线程都可以直接访问该结构。

因此，这称为线程之间的共享内存。

您需要使用互斥锁/共享变量/等概念来更新/读取/删除共享内存。

谢谢
佐田