优化c/.net程序的提示

Tips for optimizing C#/.NET programs

最近优化似乎是一门失传的艺术。难道没有一段时间所有的程序员都从他们的代码中榨取每一盎司的效率吗？经常在雪地里走五英里？

本着恢复丢失的艺术的精神，对于优化C/.NET代码的简单(或复杂)更改，您知道哪些技巧？因为这是一个如此广泛的事情，取决于一个人试图完成什么，这将有助于提供与您的提示上下文。例如：

当将多个字符串连接在一起时，使用StringBuilder。请参阅底部的链接了解有关此问题的注意事项。
使用string.Compare比较两个字符串，而不是执行string1.ToLower() == string2.ToLower()之类的操作。

目前普遍的共识似乎是衡量的关键。这种做法忽略了一点：测量并不能告诉你出了什么问题，也不能告诉你遇到瓶颈时该怎么做。我曾经遇到过字符串连接瓶颈，不知道该怎么做，所以这些技巧很有用。

我的观点是，即使张贴这是有一个地方共同的瓶颈，以及如何避免它们之前，甚至遇到它们。它甚至不一定是任何人都应该盲目遵循的即插即用代码，而是更多地了解应该考虑性能，至少在某种程度上，还有一些常见的陷阱需要注意。

我可以看出，知道一个提示为什么有用以及应该在哪里应用可能是有用的。为了得到StringBuilder的小费，我在乔恩·斯基特的网站上找到了很久以前在这里所做的帮助。

相关讨论

It seems like optimization is a lost art these days.

比如说，有一天，显微镜的制造被当作一门艺术来实践。人们对光学原理了解甚少。零件没有标准化。管子、齿轮和镜片必须由熟练工人手工制作。

现在显微镜是作为一门工程学科生产的。物理的基本原理是非常清楚的，现成的零件是广泛的，显微镜建筑工程师可以做出明智的选择，如何最好地优化他们的仪器，以完成设计任务。

性能分析是一门"丢失的艺术"，是一件非常非常好的事情。那是一门艺术。优化是一个可以通过仔细应用固体工程原理来解决的工程问题。

在过去的几年里，我被问了很多次，想知道我的"技巧和窍门"列表，人们可以用它来优化他们的vbscript/他们的jscript/他们的活动服务器页面/他们的vb/他们的c代码。我总是抵制这一切。强调"技巧和诀窍"正是接近绩效的错误方法。这样就产生了难以理解、难以推理、难以维护的代码，通常不会明显快于相应的简单代码。

正确处理性能的方法是将其作为工程问题处理，就像处理其他问题一样：

设定有意义的、可衡量的、以客户为中心的目标。
构建测试套件，在现实但可控且可重复的条件下，根据这些目标测试您的性能。
如果这些套件显示您没有达到目标，请使用诸如profiler之类的工具来找出原因。
优化探查器标识为性能最差的子系统的检查。对每一项更改进行分析，以便清楚地了解每一项更改对性能的影响。
重复，直到三件事中的一件发生(1)你达到了你的目标并发布了软件，(2)你把你的目标向下修改为你能达到的目标，或者(3)你的项目因为你不能达到你的目标而被取消。

这与解决任何其他工程问题一样，比如添加一个特性——为特性设置以客户为中心的目标，跟踪实现可靠的进度，通过仔细的调试分析解决问题，不断迭代直到发布或失败。性能是一个特性。

对复杂的现代系统进行性能分析需要有纪律性，并关注坚实的工程原理，而不是一袋仅适用于琐碎或不现实情况的技巧。我从来没有通过应用技巧和技巧解决过实际的性能问题。

相关讨论

本来打算写一篇类似的文章，但你的更好。好极了。
只有在某些情况下，有一种已知的更好的方法来完成相同的任务，而不是像猪一样拥有资源。我不认为只要你达到某个目标，并且看起来一切正常，就可以按你想要的方式进行编程。或者最好先编程，然后运行分析器，然后返回并更改问题区域。如果一个人在某些代码开始之前就已经很好地了解了如何优化它们，那他有什么错呢？
措辞很好，埃里克。我喜欢你制定目标，衡量当前绩效的方法。违背目标，然后重复。
@鲍勃：聪明地使用资源没什么错。出错的地方在于：(1)人们花费大量时间(金钱)进行不起作用的微观优化；(2)编写错误的程序；(3)编写不清楚的程序。您应该优化的是首先，正确性。第二，良好的编码风格。第三，表演。一旦代码是正确的和优雅的，它将更容易使其执行。
这很好，但是你会注意到我并不是说一个人不应该首先为正确性编写代码，或者第二种样式，或者说你拥有什么。但是，有时(或者现在很多时候)，程序员根本不考虑性能或优化也是如此。只有1&2足以弥补3的总取消绑定吗？我看不出在优化和学习一两件事情的过程中多加注意是个坏主意。
@弗雷德里克：我想你可能是想得太多了。：)
@鲍勃：我同意一些程序员不关心性能。但我不明白你的意思。一系列的技巧和诀窍不会突然把他们变成关心表现的人。假设为了争论，你可以让目前对感兴趣的人不感兴趣，那么一系列的技巧和诀窍并不能帮助他们获得良好的表现。你可以整天对代码体应用技巧和技巧，永远不知道你是否在违背目标的情况下取得了任何进展。你必须有目标，衡量你的进步。
我同意一般的技巧和技巧通常是没有帮助的，但我会指出针对特定情况的技巧和技巧可以真正节省一天的时间！通常，这些被称为"黑客"或"Kludges"，而不是"提示"。在解决"其他人的代码"中的性能问题时，这些问题往往会发挥作用。
以良好的编码实践为例。在可读性和可维护性方面有很多不同的想法和规则。这些事情不会创造出关心这些事情的人，但这并不会使这些清单变得无用。优化提示也是如此。有些人会开始至少关注他们正在做的低效的事情，而另一些人则会插拔和播放，就像他们粗暴地使用OOP一样，因为他们并不真正关心或理解其背后的想法。
关于优化的一般技巧和技巧的问题是，它们中的许多在100%的时间里都是无效的。很多人甚至10%的时间都是无效的。剩下的唯一合理的建议就是通过这些答案来阐述：概述，找到热点，理解语言是如何工作的。
当我认为双方都是对的时候，来回地跟踪这一点是很有趣的。小贴士和诀窍对程序员来说就像给医生开药一样。没有人喜欢只开处方但不诊断的医生，但当诊断表明某种药物是合适的，医生应该知道并开处方。
"优化探查器所识别的性能最差的子系统的检验"—这不是他所要求的吗？
@Blueraja Dannypflughoeft：那么操作人员实际上应该提供一个确定的缓慢子系统，并就如何修复它征求具体的建议。现在的问题基本上是"我该如何改进我的计划？"这是如此含糊以至于无法回答。
我不认为他会得到像编码大型游戏，或神经网络编程或视觉应用的工作。有些编程领域的时间仍然很重要，而每一次黑客攻击都很重要。在其他领域，你可以创建你的网站可以为30个用户服务的网页，这对你来说很好……但对于这个网站上许多通过学者级别的人来说，这是不可能的。

找一个好的探查器。

在没有好的分析器的情况下，甚至不必费心优化C(实际上是任何代码)。实际上，手头上有一个采样和一个跟踪分析器有很大的帮助。

如果没有一个好的探查器，您很可能会创建错误的优化，最重要的是，优化一开始就不是性能问题的例程。

分析的前三个步骤应该始终是1)测量，2)测量，然后3)测量……

相关讨论

优化指南：

除非你需要，否则不要这样做。

如果用新硬件解决问题比用开发人员解决问题更便宜，就不要这样做。

除非您能够在生产等效环境中测量更改，否则不要这样做。

除非你知道如何使用CPU和内存分析器，否则不要这样做。

如果它会使代码不可读或不可维护，请不要这样做。

随着处理器速度不断加快，大多数应用程序的主要瓶颈不是CPU，而是带宽：片外存储器的带宽、磁盘的带宽和网络的带宽。

从远端开始：使用yslow了解为什么最终用户的网站速度较慢，然后向后移动并修复数据库访问，使其不太宽(列)也不太深(行)。

在极少数值得做任何事情来优化CPU使用的情况下，请注意不要对内存使用产生负面影响：我看到过"优化"，开发人员试图使用内存来缓存结果以节省CPU周期。最终的效果是减少了缓存页面和数据库结果的可用内存，这使得应用程序的运行速度慢得多！(见测量规则。)

我也看到过这样的情况：一个"哑"的非优化算法击败了一个"聪明"的优化算法。永远不要低估优秀的编译器编写者和芯片设计人员如何将"低效"的循环代码转换成可以完全在片上内存中运行且具有流水线功能的超高效代码。你的"聪明"的基于树的算法，有一个打开的内部循环倒计时，你认为是"有效的"，可以简单地击败，因为它在执行过程中未能留在芯片内存中。(见测量规则。)

相关讨论

使用ORM时，请注意N+1选择。

1
2
3
4
5

List<Order> _orders = _repository.GetOrders(DateTime.Now);
foreach(var order in _orders)
{
Print(order.Customer.Name);
}

如果客户不急于加载，这可能会导致多次访问数据库。

不要使用幻数，使用枚举
不要硬编码值
尽可能使用泛型，因为它是类型安全的，避免装箱和拆箱
在绝对需要的地方使用错误处理程序
处置，处置，处置。clrwind不知道如何关闭数据库连接，因此在使用和释放非托管资源后关闭它们
用常识！

相关讨论

如果您将一个方法识别为瓶颈，但您不知道如何处理它，那么您基本上就陷入了困境。

所以我会列出一些事情。所有这些东西都不是银弹，您仍然需要分析您的代码。我只是为你能做的事提出建议，有时也能帮上忙。尤其是前三个很重要。

尝试只使用(或：主要是)低级类型或它们的数组来解决问题。
问题往往很小——使用一个智能但复杂的算法并不总是能让你获胜，特别是如果不太智能的算法可以用只使用(数组)低级类型的代码来表示。例如，insertionsort vs mergesort for n<=100或tarjan的主宰查找算法vs使用位向量天真地解决了n<=100问题的数据流形式。(100当然只是给你一些想法-简介！)
考虑编写一个只使用低级类型(通常是大小小于64的问题实例)就可以解决的特殊情况，即使对于较大的问题实例必须保留其他代码。
学习位算术来帮助你处理上面的两个想法。
与字典相比，bitarray可以是您的朋友，或者更糟的是，列表。但是要注意实现不是最佳的；您可以自己编写一个更快的版本。与测试您的参数是否超出范围等不同，您通常可以构造您的算法，以便索引不会超出范围——但是您不能从标准位数组中删除检查，而且它也不是免费的。
作为一个只使用低级类型数组的例子，位矩阵是一个相当强大的结构，可以实现为一个ulong数组，甚至可以使用ulong作为"front"遍历它，因为可以在恒定时间内取最低阶位(与宽度优先搜索中的队列相比-但显然顺序是不同的，它取决于项目的索引，而不仅仅是您找到它们的顺序)。
除法和模是很慢的，除非右手边是常数。
浮点数学一般不再比整数数学慢(不是"你能做的事"，而是"你能跳过的事")。
分支不自由。如果您可以使用一个简单的算术(除法或模以外的任何运算)来避免它，那么有时您可以获得一些性能。将分支移动到循环外部几乎总是一个好主意。

相关讨论

好的，我必须加入我最喜欢的：如果任务足够长，可以进行人与人之间的交互，请使用调试程序中的手动中断。

与事件探查器相比，这为您提供了一个调用堆栈和变量值，您可以使用这些值来真正了解正在发生的事情。

这样做10-20次，您就可以很好地了解什么样的优化可能真正起到作用。

相关讨论

+阿门。我从那时起就一直在这样做。&您的程序拖拉音乐看起来棒极了！
这基本上就是分析人员所做的，除了他们在大约一千种不同的方面(更快、更频繁、更准确等)比你做得更好之外。他们也提供呼叫堆栈。这是穷人(和害怕学习新事物的老人)的解决办法。
@他们欺骗了你。他们非常精确地告诉你，没有什么事情要做。这个方法和分析程序之间的区别在于，在这个方法中，您可以看到一些不能从简单的统计数据中挑出的加快速度的事情。相反，如果你真的能看到原始样本，他们会在前10个问题明显的时候抽取1000个样本。我相信你看过这篇文章。
@Blueraja Dannypflughoeft：看看结果。使用分析器的最大加速比是多少？
@Mikedunlavey：大约两个数量级。如果你认为分析人员告诉你没什么可做的，你需要学习如何正确地阅读他们的结果(通常情况下，你不想加快热点的速度，你想阻止他们被这么多人叫来)。如果有人在一次采访中告诉我，他们认为暂停方法比抽样资料(做同样的事情，但实际上每种方法都更好)要好，我不会雇佣他们。
@布鲁拉贾·丹尼弗鲁格霍夫特：我相信你不会，当你到了我这个年纪，你会遇到像你这样的人。但让我们把它放在一边。这里有一些源代码，如果你能将它加速3个数量级，而不看我是怎么做到的，使用任何其他方法，你将拥有吹牛的权利：)
@蓝调：顺便说一句，当你说"经常，你不想加速热点，你想阻止他们被这么多人叫来"时，我强烈同意你的看法。如果一个特定的函数调用站点出现在>1个堆栈示例上，而您实际上并不需要它，那么您就得到了一个宾果。这是计算你能省多少钱的数学公式。
@布鲁拉贾：有几种不同类型的轮廓仪，大多数都有严重的缺陷。最差的是gprof(imho)和最好的一个缩放，因为它对堆栈的墙上时钟时间进行采样，并报告行级别的包含百分比。(即使如此，它也不会停止。)表示就是一切——它不会落入热路径、调用图、火焰图或递归的陷阱中。可能还有其他类似于变焦的轮廓仪-我不知道。在这段5:18的视频中，它试图回答你提出的反对意见。

人们对真正重要的事情有着有趣的想法。堆栈溢出充满了问题，例如，++i是否比i++更"性能"。下面是一个实际性能调优的例子，对于任何语言来说，基本上都是相同的过程。如果代码只是以某种方式"因为它更快"编写，那就是猜测。

当然，您不会故意编写愚蠢的代码，但如果猜测有效，就不需要配置文件和配置技术。

事实上，没有完美的优化代码。但是，您可以在已知的系统(或一组系统)上、已知的CPU类型(和计数)上、已知的平台(Microsoft)上，针对特定的代码部分进行优化。单？)，一个已知的框架/bcl版本，一个已知的cli版本，一个已知的编译器版本(错误、规范更改、调整)，一个已知总量和可用内存，一个已知的程序集源(gac？磁盘？远程？)，具有来自其他进程的已知后台系统活动。

在现实世界中，使用分析器，并查看重要的部分；通常明显的事情是涉及I/O的任何事情，涉及线程的任何事情(同样，版本之间的变化很大)，以及涉及循环和查找的任何事情，但是您可能会惊讶于"明显不好"的代码实际上不是问题，以及"明显好"的代码是什么。奥德是个罪魁祸首。

告诉编译器该做什么，而不是怎么做。例如，foreach (var item in list)优于for (int i = 0; i < list.Count; i++)，m = list.Max(i => i.value);优于list.Sort(i => i.value); m = list[list.Count - 1];。

通过告诉系统你想做什么，它可以找出最好的方法来做。Linq很好，因为它的结果只有在需要时才会计算出来。如果只使用第一个结果，就不必计算其余的结果。

最终(这适用于所有编程)最小化循环，最小化循环中的操作。更重要的是尽量减少循环中的循环数。O(n)算法和O(n^2)算法有什么区别？O(n^2)算法在循环内有一个循环。

相关讨论

我并没有真正尝试优化我的代码，但有时我会通过使用类似于Reflector的东西将程序放回源代码。然后将我的错误与反射镜的输出进行比较是很有趣的。有时我发现我所做的更复杂的形式是简化的。也许不能优化事情，但可以帮助我找到更简单的问题解决方案。