关于C#：好奇的null-coalescing运算符自定义隐式转换行为

Curious null-coalescing operator custom implicit conversion behaviour

注：这似乎是在罗斯林修复的。

这个问题是在写我对这个问题的答案时产生的，这个问题讨论了空合并操作符的关联性。

正如一个提醒，空合并运算符的概念是

x ?? y

首先评估x，然后：

如果x的值为空，则计算y的值，这是表达式的最终结果。
如果x的值不为空，则不计算y，x的值是表达式的最终结果，必要时转换为y的编译时类型。

现在通常不需要转换，或者只是从一个可以为空的类型转换为一个不可以为空的类型——通常类型是相同的，或者只是从(比如)int?到int。但是，您可以创建自己的隐式转换运算符，并在必要时使用这些运算符。

对于简单的x ?? y案例，我没有看到任何奇怪的行为。然而，对于(x ?? y) ?? z，我看到了一些令人困惑的行为。

下面是一个简短但完整的测试程序-结果在注释中：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

using System;

public struct A
{
public static implicit operator B(A input)
{
Console.WriteLine("A to B");
return new B();
}

public static implicit operator C(A input)
{
Console.WriteLine("A to C");
return new C();
}
}

public struct B
{
public static implicit operator C(B input)
{
Console.WriteLine("B to C");
return new C();
}
}

public struct C {}

class Test
{
static void Main()
{
A? x = new A();
B? y = new B();
C? z = new C();
C zNotNull = new C();

Console.WriteLine("First case");
// This prints
// A to B
// A to B
// B to C
C? first = (x ?? y) ?? z;

Console.WriteLine("Second case");
// This prints
// A to B
// B to C
var tmp = x ?? y;
C? second = tmp ?? z;

Console.WriteLine("Third case");
// This prints
// A to B
// B to C
C? third = (x ?? y) ?? zNotNull;
}
}

所以我们有三种自定义值类型：A、B和C，它们的转换是从A到B、A到C和B到C。

我能理解第二种情况和第三种情况…但是为什么在第一种情况下会有额外的A到B转换呢？特别是，我真的希望第一种情况和第二种情况是一样的——毕竟它只是将表达式提取到局部变量中。

有人知道发生了什么事吗？当C编译器出现"bug"的时候，我绝对不会大喊"bug"，但是我很难理解到底发生了什么……

编辑：好吧，这是一个更糟糕的例子，这要归功于配置程序的回答，这给了我进一步的理由认为这是一个bug。编辑：该示例现在甚至不需要两个空合并运算符…

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

using System;

public struct A
{
public static implicit operator int(A input)
{
Console.WriteLine("A to int");
return 10;
}
}

class Test
{
static A? Foo()
{
Console.WriteLine("Foo() called");
return new A();
}

static void Main()
{
int? y = 10;

int? result = Foo() ?? y;
}
}

其结果是：

1
2
3

Foo() called
Foo() called
A to int

事实上，在这里两次调用Foo()对我来说是非常令人惊讶的——我看不出任何理由可以对表达式进行两次计算。

相关讨论

我敢打赌他们认为"没人会用那种方式"：)
打电话给安德斯·赫杰斯伯格！快！
只是出于好奇，你什么时候会使用像(a ?? b) ?? c这样的东西？
想看更糟的东西吗？尝试在所有隐式转换中使用此行：C? first = ((B?)(((B?)x) ?? ((B?)y))) ?? ((C?)z);。你会得到：Internal Compiler Error: likely culprit is 'CODEGEN'。
还要注意，当使用LINQ表达式编译相同的代码时，不会发生这种情况。
@配置器：我刚刚注意到表达式树最终得到了正确的答案，因为它似乎使用了一种非常不同的方法来在类型之间转换。
@彼得：我通常会依赖正确的关联行为，不会使用不同类型的隐式转换等。但是，我发现角盒行为很有趣……
@彼得不太可能出现这种情况，但对埃多克斯来说是合理的。
@但是你为什么需要括号呢？
@sixlettervariables：几乎可以肯定的是，问题出在"降低"过程中，该过程从高级分析表单转换为可以提供给代码生成器的较低表单。表达式树层使用一种完全不同的降低算法，因为显然生成的代码将完全不同。
@埃里克：明白了，在注意到它是从2K5到2K8/2K10的回归之后，我得出结论，它必须是给代码生成器的表示的一部分。如果问题的一部分是与C 2.0和3.0之间的隐式可空转换相关的规范的变化，我就无法确定。
@sixlettervariables：为了使表达式树工作，我们对C 3.0中的可为空的降低代码进行了大量的重组，显然这样做引入了这个bug。
@埃里克，找到这个虫子我有什么值得称赞的地方吗：)
你为什么不马上为一个编译器错误而哭泣？我相信你知道是那样的
@是的123：当它只处理转化的时候，我并不完全相信。看到它两次执行一个方法，很明显这是一个错误。你会惊讶于一些看起来不正确但实际上完全正确的行为。C组比我聪明-我倾向于认为我是愚蠢的，直到我证明有什么是他们的错。

感谢所有参与分析这个问题的人。这显然是一个编译器错误。似乎只有在合并运算符左侧有涉及两个可为空类型的提升转换时才会发生。

我还没有确定到底哪里出了问题，但是在编译的"可以为空的降低"阶段的某个时刻——在初始分析之后，在代码生成之前——我们减少了表达式

1	result = Foo() ?? y;

从上面的例子到道德等价物：

1
2
3
4

A? temp = Foo();
result = temp.HasValue ?
new int?(A.op_implicit(Foo().Value)) :
y;

显然这是不正确的；正确的降低是

1
2
3

result = temp.HasValue ?
new int?(A.op_implicit(temp.Value)) :
y;

根据我目前的分析，我的最佳猜测是，可以为空的优化器在这里偏离了轨道。我们有一个可以为空的优化器，它查找我们知道可以为空类型的特定表达式不可能为空的情况。想想下面的幼稚分析：我们可以先这么说

1	result = Foo() ?? y;

是一样的

1
2
3
4

A? temp = Foo();
result = temp.HasValue ?
(int?) temp :
y;

然后我们可以这么说

1	conversionResult = (int?) temp

是一样的

1
2
3
4

A? temp2 = temp;
conversionResult = temp2.HasValue ?
new int?(op_Implicit(temp2.Value)) :
(int?) null

但是优化器可以介入并说"哇，等一下，我们已经检查了temp不是空的；不需要再次检查它是否为空，因为我们调用的是提升的转换运算符"。我们让他们把它优化到

1	new int?(op_Implicit(temp2.Value))

我的猜测是，我们正在缓存这样一个事实：(int?)Foo()的优化形式是new int?(op_implicit(Foo().Value))，但这实际上不是我们想要的优化形式；我们希望foo()的优化形式被临时替换，然后转换。

C编译器中的许多错误都是由错误的缓存决策造成的。明智的一句话：每次缓存一个事实供以后使用时，如果发生了相关的更改，都可能导致不一致。在这种情况下，改变初始分析后的相关事情是，对foo()的调用应该始终作为临时的获取来实现。

我们对C 3.0中的可空重写过程进行了大量的重组。这个bug在C 3.0和4.0中复制，但在C 2.0中没有复制，这意味着这个bug可能是我的错。对不起的！

我将在数据库中输入一个bug，然后我们将查看是否可以在将来的语言版本中修复这个bug。再次感谢大家的分析，非常有帮助！

更新：我为Roslyn从头重写了Nullable优化器；它现在做得更好，并且避免了这些奇怪的错误。有关Roslyn中优化器如何工作的一些想法，请参阅我的系列文章，文章从这里开始：https://ericlippert.com/2012/12/20/nullable-micro-optimizations-part-one/

相关讨论

这绝对是一个错误。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

public class Program {
static A? X() {
Console.WriteLine("X()");
return new A();
}
static B? Y() {
Console.WriteLine("Y()");
return new B();
}
static C? Z() {
Console.WriteLine("Z()");
return new C();
}

public static void Main() {
C? test = (X() ?? Y()) ?? Z();
}
}

此代码将输出：

1
2
3
4
5
6
7

X()
X()
A to B (0)
X()
X()
A to B (0)
B to C (0)

这使我认为每个??合并表达式的第一部分被计算两次。这段代码证明了这一点：

1	B? test= (X() ?? Y());

输出：

1
2
3

X()
X()
A to B (0)

只有当表达式需要在两个可为空的类型之间进行转换时，才会出现这种情况；我尝试了各种排列，其中一个边是字符串，但没有一个边导致这种行为。

相关讨论

如果您查看左分组案例生成的代码，它实际上是这样做的(csc /optimize-：

1
2
3
4
5
6
7

C? first;
A? atemp = a;
B? btemp = (atemp.HasValue ? new B?(a.Value) : b);
if (btemp.HasValue)
{
first = new C?((atemp.HasValue ? new B?(a.Value) : b).Value);
}

另一个发现是，如果使用first，那么如果a和b都为空并返回c，它将生成一个快捷方式。但是，如果a或b不为空，则在返回a或b中的哪个不为空之前，会重新评估a作为对b隐式转换的一部分。

根据C 4.0规范第6.1.4条：

If the nullable conversion is from S? to T?:

If the source value is null (HasValue property is false), the result is the null value of type T?.

Otherwise, the conversion is evaluated as an unwrapping from S? to S, followed by the underlying conversion from S to T, followed by a wrapping (§4.1.10) from T to T?.

这似乎可以解释第二个展开包装组合。

C 2008和2010编译器生成的代码非常相似，但这看起来像是C 2005编译器(8.00.50727.4927)的回归，它为上述代码生成以下代码：

1
2
3

A? a = x;
B? b = a.HasValue ? new B?(a.GetValueOrDefault()) : y;
C? first = b.HasValue ? new C?(b.GetValueOrDefault()) : z;

我想知道这是否是因为类型推理系统的额外魔力？

相关讨论

实际上，我现在把它称为bug，用更清楚的例子。这仍然有效，但双重评价肯定不好。

似乎A ?? B是作为A.HasValue ? A : B来执行的。在这种情况下，也有很多铸件(遵循三元?:运算符的常规铸造)。但是如果你忽略了所有这些，那么基于它是如何实现的，这是有意义的：

A ?? B扩大到A.HasValue ? A : B。

a是我们的x ?? y。扩大到x.HasValue : x ? y。

替换所有出现的a->(x.HasValue : x ? y).HasValue ? (x.HasValue : x ? y) : B。

在这里可以看到，x.HasValue被检查了两次，如果x ?? y需要铸造，x将铸造两次。

~~我把它简单地说成是一个如何实现??的工件，而不是一个编译器错误。~~take away:don't create implicit casting operators with side effects.~~~~

~~这似乎是一个围绕如何实现??的编译器bug。带走：不要用副作用嵌套合并表达式。~~

相关讨论

哦，我当然不想正常使用这样的代码，但我认为它仍然可以被归类为编译器bug，因为您的第一个扩展应该包括"但只计算一次a和b"。(假设它们是方法调用。)

@乔恩，我同意这也可以，但我不认为这是明确的。实际上，我可以看到，A() ? A() : B()可能会对A()进行两次评估，但A() ?? B()没有那么多。因为这只发生在演员阵容上…隐马尔可夫模型。。我刚刚说服自己，认为这肯定是不正确的行为。

从我的问题历史可以看出，我根本不是一个C专家，但是，我尝试过，我认为这是一个错误……但是作为一个新手，我不得不说我不理解这里发生的一切，所以如果我离开的话，我会删除我的答案。
我已经得出了这个结论，通过对您的程序做一个不同的版本来处理相同的场景，但要简单得多。
我正在使用三个带后备存储的空整数属性。我将每个设置为4，然后运行int? something2 = (A ?? B) ?? C;。
(此处为完整代码)
这只是读A，没有其他内容。
我觉得这句话应该：

从括号中开始，看a，如果a不为空，返回a并结束。

如果a为空，则计算b，如果b不为空，则完成。

如果a和b为空，则计算c。

因此，因为a不是空的，所以它只查看a并完成。
在您的示例中，在第一种情况下放置一个断点表明x、y和z都不是空的，因此，我希望它们被视为与我的不太复杂的示例相同的东西……但我担心我太像一个新手了，完全错过了这个问题的要点！

相关讨论

乔恩的例子有点晦涩难懂，因为他使用的是一个可以为空的结构(一个值类型，类似于int之类的内置类型)。他通过提供多个隐式类型转换，将案例进一步推向一个模糊的角落。这要求编译器在检查null时更改数据类型。正是由于这些隐式类型转换，他的示例不同于您的示例。

关于c＃：null合并运算符的右关联如何表现？

关于c＃：这个Nullable＆lt; T＆gt;的理由是什么？

关于php：奇怪的行为三元运算符

C＃??

关于c＃：是吗？

关于c＃：编程语言错误或编译器错误？

来自??的C＃类型推断（“var”）赋值

C#的隐藏特征

javascript中是否有"空合并"运算符？

关于c＃：Nullable类型和三元运算符：为什么是`？

关于c＃：当给定null时，为什么is运算符返回false？

关于c＃：在可空类型上使用coalescing null运算符更改隐式类型

关于c＃：理解null合并运算符（??）

不完全是C＃4.0规范中的“7.13空合并运算符”

关于c＃：使用null-coalescing运算符进行隐式转换

关于php 7：PHP三元运算符vs null合并运算符