关于C#：我只是证明了Eratosthenes筛子的效率比审判部门低吗？

Did I just prove that sieve of Eratosthenes is less efficient than trial division?

我试图比较两种算法的运行速度：一个用于打印质数(10,000个数字)的蛮力C程序和一个Eratosthenes C程序筛网(也包含10,000个质数)。

我为筛分算法测得的运行时间为：0.744秒

我为蛮力算法测得的运行时间为：0.262秒

但是，有人告诉我，Eratosthenes算法的Sieve比蛮力方法更有效，因此我认为它的运行速度会更快。所以我错了或者我的程序有缺陷(我对此表示怀疑)。

因此，我的问题是：由于得到的结果与预期相反，这是否证明了Eratosthenes的Sieve在速度方面的确比试验部门效率更低？

我不确定是否相关，但是我使用的是Dev C ++编译器和Windows 7。

相关讨论

简短的答案是：不一定。效率是渐近定义的(对于任意大的输入)。许多非常有效的算法都是通过某种形式的缓存/预分配来获得效率的……这使得它们对于微小的输入而言，其速度要比蛮力慢。但就您的情况而言，我发现蛮力表现比橡皮擦筛网(基本上是一种聪明的蛮力)要好得多，这非常令人惊讶。您是否100％确信您的实施？
这取决于算法的实现方式。我解决了这个问题，在项目euler上使用了eratosthenes筛子，它的速度要快得多。
Windows中的大多数基准测试都是非常不准确的，并且通常是不正确的。每当讨论Windows中执行时间的度量时，都必须提及如何度量时间。另外，由于Windows 7不是RTOS，因此您不能简单地测量一次时间，而必须多次测量并计算平均时间或平均时间。您还必须同时对这两种算法进行基准测试。如果您测量算法A 100次，然后假设要测量算法B时某些过程在后台启动。那么显然您会得到错误的结果。
现在是时候到阿特金筛子了
提出此问题的正确方法是发布用于实现和计时这两种算法的代码。然后，我们不必简单推测在某些情况下您看到的行为的原因。我们实际上可以告诉您您的代码出了什么问题。此问题由于不完整而被搁置。您可以对其进行编辑以包括您的代码和问题的更详细描述，以便重新打开它。
"所以我错了或者我的程序有缺陷(对此我表示怀疑)。" -我无法想象你为什么会怀疑...很可能你的程序甚至没有实现Eratosthenes筛。即使在经验丰富的程序员中，这也是一个常见的错误：cs.hmc.edu/~oneill/papers/Sieve-JFP.pdf
正如现在越来越经常发生的那样，关闭的原因是[自我审查]。对此问题给出"很少的段落"答案是完全合理的。这里是概述：测量两种算法的经验增长顺序。一分是不够的。三点就足够了。"仅此而已，这不在此处给出的答案之内。
有关此问题的元讨论
@CodyGray我们仍然可以讨论一个尺寸点测量是否意味着任何意义，或者是否必须对更大尺寸的输入进行比较？即使我们对所讨论的代码一无所知，也可以找到该问题的答案。 :)我已经编辑以使问题更具体。
@当然，您会发现我不是投票决定关闭的人之一。在阅读了Gilles已经链接到的Meta问题之后，我将该评论发布为对问询者的一些建设性建议。作为Meta的固定参与者，我可以看到墙上的文字：这个问题即将结束，经验告诉我，问题可能与缺乏代码有关。很多人认为FAQ中的指南更加具体：好的SO问题需要代码。
记录下来，Ive删除了多余的格式，当我看着这个问题时，它在我的口中留下了最初的不良味道，并投下了我自己的一票来重新讨论。我仍然认为，如果也发布用于测试问题的代码，那将是一个改进，但这并不意味着我认为该问题在当前状态下是不可接受的。
@CodyGray：修复它的一个很好的尝试，但是我仍然认为需要包含用于算法的代码。问题指出："这是否证明Eratosthenes的筛网确实是效率较低的算法"，因为我们都知道，速度较慢的原因可能纯粹归结为不良的实现。我认为，唯一可能给出的答案是" Eratosthenes算法的筛网，根据您的特定实现，肯定更慢"……但这有点像问"哪个更快，2秒或7秒？"。。无意义
致新近的投票人：您为什么不在这里发表评论，以解释仍不清楚的地方？ (我无法想象这可能是什么，请解释一下)。也许无需先关闭再重新打开即可澄清问题。
一天后，代码仍然丢失。没有代码，这是完全毫无价值的，应该关闭并删除。
从我的回答可以看出，@ starblue我显然非常不同意。有一个有意义的讨论，一个有意义的答案。我希望我给了。值得一提(很重要)，要知道无论使用哪种代码，都最好根据经验的增长技术顺序来评估其效率，而仅在输入大小的一点上测量比较速度是没有意义的。

TL; DR：仅在一种输入大小下比较代码变体的速度是没有意义的；比较经验的增长顺序确实反映了代码的算法性质，并且对于相同的输入大小测试范围，将在不同的测试平台上保持一致。比较绝对速度值仅对表现出相同渐近或至少局部增长行为的代码变体有意义。

仅以一个输入大小来衡量两个实现的速度是不够的。通常需要几个数据点来评估我们的代码在运行时的经验增长顺序(因为代码可以在不同的输入大小下运行)。它是基于输入大小比率的运行时间比率的对数。

因此，即使某些输入code_1的运行速度比code_2快10倍，但其运行时间却随着输入大小的每倍增加而翻倍，而对于code_2，它的增长速度仅为1.1x，很快code_2会变为比code_1快得多。

因此，算法效率的真正衡量标准是运行时间复杂度(以及其空间复杂度，即内存需求)。当我们凭经验测量它时，我们仅测量是否针对手头的特定代码(在特定的输入大小范围内)而不是算法本身，即它的理想实现。

特别是，在产生的n个素数中，试验划分的理论复杂度为O(n^1.5 / (log n)^0.5)，通常被视为~ n^1.40..1.45经验增长顺序(但对于较小的输入量，最初可能为~n^1.3)。对于Eratosthenes筛子，它是O(n log n log (log n))，通常被视为~ n^1.1..1.2。但是，肯定有在~n^2.0或更糟糕的情况下进行试验的部门和Eratosthenes筛子的次佳实现。

所以不，这没有证明。一个数据点是没有意义的，至少需要三个数据点才能获得"全局"，即能够确定地预测较大输入大小所需的运行时间空间。

科学方法的目的在于确定性地进行预测。

顺便说一句，您的运行时间很长。 10,000个素数的计算应该几乎是瞬时的，对于在快速框上运行的C程序而言，它的秒数要不到1/100秒。也许您也在测量打印时间。别。 :)

不，经过的运行时间并不是衡量效率的标准，因为运行时间因平台而异-说"我的算法在10秒钟内运行"几乎没有提供关于算法本身的信息。除此之外，您还需要列出整个环境规范和同时运行的其他进程，这会造成很大的麻烦。因此，订单符号(大哦，小哦，欧米茄等)的发展。

效率通常分为两个部分：

时间效率。

空间效率。

...其中一种算法可能具有极高的时间效率，但在空间方面却效率极低。反之亦然。当缩放需要为给定输入n执行的指令量时，将基于算法的渐近行为来分析算法。这是博士学位计算机科学家精心研究的一个领域的高级解释-我建议您在这里阅读更多有关它的信息，以获取最佳的低级解释。

注意，我附加了Big Oh符号的链接-姐妹符号都可以在该Wikipedia页面上找到，通常是一个不错的起点。它还将涉及时空效率的差异。

使用Big Oh的时间效率小应用程序：

考虑一下Racket中的以下递归函数(如果我知道的话，将在Python中使用-我可以做的最好的伪代码)：

1
2
3
4
5
6

(define (fn_a input_a)
(cond
[(empty? input_a) empty]
[(empty? (rest input_a)) input_a]
[(> (first input_a) (fn_a (rest input_a))) (cons (first input_a) empty)]
[else (fn_a (rest input_a))]))

...我们看到：empty?，rest，>和first均为O(1)。我们还注意到，在最坏的情况下，在input_a的rest的第三个条件和第四个条件下调用fn_a。然后，我们可以将递归关系写为T(n)= O(1)+ 2T(n-1)。在递归关系图上查找，我们发现fn_a的阶为O(2 ^ n)，因为在最坏的情况下，会进行两次递归调用。

还需要注意的是，根据Big Oh的正式定义，声明fn_a为O(3 ^ n)也是正确的(但无用)。分析时使用Big Oh表示了很多算法，但是使用Big Theta来收紧界限更合适，本质上是指：相对于给定算法而言，最低，最准确的顺序。

注意，请阅读正式定义！