关于C++：家庭树软件中的循环

Cycles in family tree software

我是一些家庭树软件的开发者(用C++和Qt编写)。直到我的一个客户给我寄了一份错误报告，我才有问题。问题是，客户有两个孩子，他们有自己的女儿，因此，由于错误，他无法使用我的软件。

这些错误是我关于正在处理的族图的各种断言和不变量的结果(例如，在遍历一个循环之后，程序声明x不能既是y的父也不是y的祖父)。

如何在不删除所有数据断言的情况下解决这些错误？

相关讨论

听起来你应该把软件的销售限制在那些避免陷入棘手家庭状况的人身上！一个人怎么会和他自己的女儿生孩子-我希望你是在谈论他的儿媳！
很明显，你应该把雷·史蒂文斯的歌记在心里来写你的软件。
这可能是你需要问问自己的情况之一：我真的想和那个人做生意吗？另一个解决办法是对他提出刑事指控。毕竟，世界上大多数地方都禁止乱伦。最后，你的软件被破坏了，因为你可以(合法地)在一个家族树上有循环：表亲可以在大多数(全部？)中结婚。西方国家。
如果你把你的家谱追溯到足够远的地方，你会比你想的更经常地碰到这个问题。放弃树表示可能会很痛苦，但最终会更正确。
你不应该为不可能的事情添加断言，只为不可能的事情。循环是家族树图中不可能出现的显而易见的事情…任何人都不能通过任何方法成为自己的祖先。这些其他断言只是伪造的，应该删除。
也许下次你会尝试一个更抽象的例子。这里的人们不能忽视乱伦的部分，仅仅关闭它，即使这是一个关于树状数据表示的有效问题。
@pgod并没有在这些断言上失败，我认为向用户报告不太可能发生的事情是有帮助的，让他们知道他们可能犯了错误，但提供了一种简单且不受保护的方法来继续。
在宠物繁殖的世界里，这根本不是一个愚蠢的问题。女儿对父亲，母亲对儿子，姐妹对兄弟，孙子对祖父母是标准技术，宠物饲养者也需要家庭树软件。"纯种"我的&164；%amp；。
这个问题很好地说明了软件工程师在生成代码时所做的假设。对于可能发生的情况，断言在生产代码中没有位置。
你们真的想把这当作是主观的和有争议的吗？这个问题对我来说是完全清楚的，它要求一个树/图中循环的解决方案。
如果表兄弟结了婚，你会得到同样的循环错误吗？例如，结了婚的表兄弟的孩子也会是父母的孩子，但也是父母的表兄弟。这是一个常见的场景。
在维多利亚时代的英国，尤其是在上层阶级中，与第一代表亲结婚是很常见的(这是一种很好的家庭理财方式)。例如，查尔斯·达尔文嫁给了他的第一个表妹艾玛·威奇伍德。任何家族树软件都需要支持这种情况。
仅供参考，从Reddit链接到这里
事实上，从数学意义上讲，它不再是一棵树了。一旦你引入(乱伦)循环，它就变成一个完全成熟的图。所以告诉客户去买一个为乱伦的乡巴佬量身定做的"家庭图"程序。-)
车祸报告应该交给警方而不是开发商的罕见案例之一。
@如果一个人娶了娶他母亲的人的母亲，那么他就是他自己的祖父。做你自己的祖先在基因上是不可能的，但在社会上却是不可能的。而且大多数家谱软件都会跟踪这两种情况。
2013年2月7日，我提出了一个建议。也许这对某人还是有帮助的。如有必要，可以通过输入一个"人"来妥协GEDCOM的困难限制，该"人"包含一组有不支持的关系的人。为了说明这一点，我把我的例子称为"爸爸女儿公司"。我公开承认这对人们来说是不愉快的，并且没有以机器可读的形式捕捉到一些事实。从技术上讲，它不修补gedcom表示的一个家庭中的一个局部问题吗？哦，好吧。它被否决为-3，没有评论，所以我从答案中删除了它。
这就是为什么在收集需求时强烈挑战断言是好的。"X不会发生。好吧，但这是否意味着"x通常不会发生"，"x永远不会"发生，或者"x不可能发生"？
没有家族树(时间旅行小说之外)有循环，但这里的问题是您的程序不支持有向无循环图，其中一个节点可以充当另一个节点的多个祖先类型。无论是在道德上、社会上还是在法律上，这些图表都可能是不可取的，但它们在生物学上并非不可能。

似乎你(和/或你的公司)对家谱应该是什么有着根本的误解。

让我澄清一下，我也在一家公司工作，该公司(作为其产品之一)的投资组合中有一个家族树，我们一直在与类似的问题作斗争。

在我们的例子中，这个问题，我也假设您的例子，来自于GEDCOM格式，它对家庭应该是什么非常有意见。然而，这种格式包含了一些关于家族树实际外观的严重误解。

GEDCOM存在着许多问题，如同性关系不相容、乱伦等。这在现实生活中发生的次数比你想象的要多(尤其是回到1700-1800年的时候)。

我们已经将我们的家谱模型化为现实世界中发生的事情：事件(例如，出生、婚礼、订婚、工会、死亡、收养等)。我们对这些没有任何限制，除了逻辑上不可能的限制(例如，一个人不能成为自己的父母，关系需要两个人，等等…)

缺乏验证给了我们一个更"真实的世界"，更简单和更灵活的解决方案。

对于这个特定的案例，我建议删除断言，因为它们不具有普遍性。

对于显示问题(将出现的问题)，我建议根据需要多次绘制相同的节点，在选择其中一个节点时，通过点亮所有副本来提示复制。

相关讨论

这看起来是正确的方法，很容易扩展到检测更复杂的问题。您可以计算出事件之间的一组"A发生在B之前"关系。例如，一个人出生在任何其他事件之前。这是一个有向图。然后您可以检查图表是否不包含循环。请参阅stackoverflow上的这个问题。在时间旅行发明之前，这应该是可以的。
@保罗·哈里森如果它在哪里就那么简单。在旧记录(甚至是新记录)中，存在日期不一致。出生前的洗礼，多重出生记录等…所以在某种程度上，在官方记录中，有时间旅行。我们允许这种不一致的数据。我们允许用户指出在出现重复的情况下，应用程序应该考虑什么"出生记录"。如果发现时间线有问题，我们会指出。
@本·沃伊特·格德姆是耶稣基督末世圣徒教会创造的一种形式。该规范明确指出，婚姻(marr)是男女之间的关系。对于同性婚姻或乱伦，应使用asso标签(associates)，也用于表示友谊或是邻居。很明显，在这个规范中同性婚姻是二等关系。一个更中立的规范不会要求男女关系。
@BertGoethals：你把gedcom和一些不支持同性婚姻(paf，legacy)的程序混淆了。GEDCOM不排除"0@f1@fam/1 husb@i1@/1 husb@i2@"这样的构造，因此，如果您的软件选择支持同性婚姻，那么GEDCOM也支持这种构造。
@皮埃尔，你真的可以欺骗这个系统。这直接来自5.5.1文件："结婚：=一项法律、普通法或习惯性事件，即建立一个男人和女人作为丈夫和妻子的家庭单位。"(homepages.rootsweb.earthy.com/~pmcbride/gedcom/55gcappa.h&zwnj；&8203；tm)，如你所见，这里没有同性婚姻。
@Bert Goethals:这里有一个测试，你可以很容易地进行自己的测试：[1]在一个家庭树生成器文件中创建一个同性婚姻；[2]导出到gedcom；[3]将gedcom文件导入rootsmagic。同性婚姻得以保留(vg.两个伴侣仍然是男性)。那是怎么发生的？不要混淆规范的建议和实际可行的建议。
@泰勒，至少我是说。此外，任何"关系"都可以表示为多对。三人行可以表示为每个人两个关系。
@pierre my post是关于规范的；不是关于其他应用程序试图通过破坏规范来实现什么。规范"指定"不是推荐的。实现人员违反规范的事实表明规范确实有缺陷。

放松你的断言。

而不是通过更改规则，这对99.9%的客户在输入数据时遇到错误非常有帮助。

相反，将其从错误"can't add relationship"更改为警告"add anyway"。

相关讨论

家谱有个问题：它们不是树。它们是有向无环图或DAG。如果我正确理解人类生殖生物学的原理，就不会有任何循环。

据我所知，甚至基督徒也接受表兄弟之间的婚姻(因此也接受子女)，这将把家族树变成家族之剑。

这个故事的寓意是：选择正确的数据结构。

相关讨论

我猜你有一个值，它唯一地标识了一个人，你可以根据这个人进行检查。

这是一个棘手的问题。假设您希望将结构保留为树，我建议这样做：

假设：A和自己的女儿有孩子。

A将自己添加到程序中，称为A和B。一旦成为父亲，我们就称之为男朋友。

添加一个is_same_for_out()函数，该函数告诉程序的输出生成部分，到B内部的所有链接在显示数据时都应该指向A。

这将为用户做一些额外的工作，但我想这将相对容易实现和维护。

在此基础上，您可以处理代码同步A和B，以避免不一致。

这个解决方案肯定不完美，但却是第一种方法。

相关讨论

你应该关注什么才是你的软件真正的价值所在。花在为一个消费者工作上的时间是否值许可证的价格？可能不会。

我建议你向这个客户道歉，告诉他他的情况超出了你的软件范围，并给他退款。

相关讨论

你应该建立阿特瑞德家族(现代，沙丘，或古代，俄狄浦斯雷克斯)作为测试案例。通过将清理过的数据用作测试用例，您不会发现错误。

相关讨论

这就是为什么像"go"这样的语言没有断言的原因之一。它们被用来处理你可能没有想到的案件，太频繁了。你只应该断言不可能，而不仅仅是不可能。后一种做法会让断言名声扫地。每次你输入assert(时，都要走开十分钟，好好想想。

在你特别令人不安的情况下，这种断言在罕见但可能的情况下是伪造的，这是可以想象的，也是令人震惊的。因此，在你的应用程序中处理它，如果只是说"这个软件不是为处理你提出的场景而设计的"。

断言你的曾祖父、曾祖父是你的父亲是不可能的，这是一件合理的事情。

如果我是为一家被雇佣来测试你的软件的测试公司工作的话，我当然会提出这种情况。为什么？每一个幼稚但聪明的"用户"都会做同样的事情，并喜欢由此产生的"错误报告"。

相关讨论

我不喜欢评论这样一个混乱的情况，但最简单的方法不是重新获得你所有的不变量是在你的图中创建一个幻影顶点，作为一个代理返回乱伦的父亲。

所以，我做了一些家庭树软件的工作。我认为你要解决的问题是，你需要能够在不陷入无限循环的情况下行走树-换句话说，树需要是非循环的。

然而，你似乎在断言一个人和他的祖先之间只有一条路。这将保证没有循环，但太严格了。从生物学角度讲，后代是一个有向无环图(DAG)。你的情况当然是一个退化的情况，但是这种类型的事情总是发生在更大的树上。

例如，如果你观察N代的2^n祖先，如果没有重叠，那么在公元1000年你的祖先会比活着的人多。所以，必须有重叠。

但是，您也会得到无效的循环，只是错误的数据。如果您正在遍历树，那么必须处理循环。您可以在每个单独的算法中或在加载时执行此操作。我是负重的。

在树中找到真正的循环可以用几种方法完成。错误的方法是标记来自给定个体的每个祖先，当遍历时，如果要进入下一个个体的人已经被标记，那么就切断链接。这将切断潜在的精确关系。正确的方法是从每个个体开始，并用指向该个体的路径标记每个祖先。如果新路径包含当前路径作为子路径，那么它是一个循环，应该被破坏。您可以将路径存储为vector(mfmf、mffmf等)，这使得比较和存储非常快。

还有其他几种方法可以检测循环，例如发送两个迭代器，查看它们是否与子集测试冲突，但是我最终使用了本地存储方法。

另外请注意，您不需要实际切断链接，只需将其从普通链接更改为"弱"链接，这不是您的一些算法所遵循的。在选择哪一个链接将标记为弱链接时，您还需要小心；有时，您可以通过查看生日信息来确定应该在何处破坏循环，但通常情况下，由于丢失了这么多数据，您无法找到任何内容。

相关讨论

对于一个愚蠢的问题，另一个假装严肃的回答是：

真正的答案是，使用适当的数据结构。人类谱系不能完全用一个没有循环的纯树来表达。你应该使用某种图表。此外，在进一步讨论这一点之前，请先和人类学家谈谈，因为在其他许多地方，即使在"西方父权制的一夫一妻制婚姻"这一最简单的案例中，也可能出现类似的错误，试图建立家谱模型。

即使我们想忽略这里讨论的当地禁忌关系，也有很多完全合法和完全意想不到的方法可以将循环引入到家族树中。

例如：http://en.wikipedia.org/wiki/coun-marriage

从根本上说，表亲婚姻不仅是常见的，也是人们期望的，它是人类从数千个小家庭群体走向全球60亿人口的原因。它不能以任何其他方式工作。

当涉及到系谱、家庭和血统时，确实很少有普适性。几乎任何关于规范的严格假设，暗示谁是姑姑，谁可以嫁给谁，或者为了继承遗产而如何使孩子合法化，都会因世界或历史上的某个地方的某些例外而感到不安。

相关讨论

撇开潜在的法律含义不谈，您显然需要将家族树上的"节点"视为前辈，而不是假定节点可以是唯一的人。

让树节点包括一个人和继承人-然后您可以让另一个节点更深入树，其中包含具有不同继承人的同一个人。

一些答案显示了保留断言/不变量的方法，但这似乎是对断言/不变量的滥用。断言是为了确保应该是真的东西是真的，不变量是为了确保不应该改变的东西不会改变。

你在这里断言的是乱伦关系并不存在。显然它们确实存在，所以您的断言是无效的。您可以解决这个断言，但真正的错误在于断言本身。应删除断言。

你的家谱应该使用有向关系。这样你就不用骑自行车了。

系谱数据是循环的，不适合于非循环图，所以如果您有针对循环的断言，应该删除它们。

在视图中处理此问题而不创建自定义视图的方法是将循环父级视为"重影"父级。换言之，当一个人同时是同一个人的父亲和祖父时，则通常显示祖父节点，但父亲节点渲染为具有简单标签(如"see grandor")并指向祖父的"幽灵"节点。

为了进行计算，您可能需要改进逻辑来处理循环图，以便在存在循环的情况下一个节点不会被访问多次。

断言不存在于现实中

通常，断言在与现实数据的接触中不存在。这是软件工程过程中需要决定的一部分，需要处理哪些数据，哪些数据超出了范围。

循环族图

关于家族"树"(事实上，它是完整的图表，包括循环)，有一个很好的轶事：

I married a widow who had a grown daughter. My father, who often visited us, fell in love with my step-daughter and married her. As a result, my father became my son, and my daughter became my mother. Some time later, I gave my wife a son, who was the brother of my father, and my uncle. My father's wife (who is also my daughter and my mother) got a son. As a result, I got a brother and a grandson in the same person. My wife is now my grandmother, because she is my mother's mother. So I am the husband of my wife, and at the same time the step-grandson of my wife. In other words, I'm my own grandpa.

当你考虑到代孕或"模糊的父亲身份"时，事情会变得更加奇怪。

如何处理这个问题将周期定义为超出范围

你可以决定你的软件不应该处理这种罕见的情况。如果出现这种情况，用户应该使用不同的产品。这使得处理更常见的情况更加健壮，因为您可以保留更多的断言和更简单的数据模型。

在这种情况下，在软件中添加一些好的导入和导出功能，这样用户可以在必要时轻松地迁移到其他产品。

允许手动关系

您可以允许用户添加手动关系。这些关系不是"一等公民"，即软件按原样处理，不检查，也不在主数据模型中处理。

然后用户可以手动处理罕见的情况。您的数据模型仍然非常简单，您的断言将继续存在。

小心处理手动关系。有一种诱惑，使它们完全可配置，从而创建一个完全可配置的数据模型。这不起作用：你的软件不会扩展，你会得到奇怪的错误，最终用户界面将变得不可用。这种反模式被称为"软编码"，"每日WTF"中充满了这样的例子。

使数据模型更灵活，跳过断言，测试不变量

最后一个办法是使您的数据模型更加灵活。您将不得不跳过几乎所有的断言，并将数据模型建立在一个完整的图表上。如上面的例子所示，很容易成为你自己的祖父，所以你甚至可以有循环。

在这种情况下，您应该广泛地测试您的软件。您必须跳过几乎所有的断言，因此有很好的机会产生额外的错误。

使用测试数据生成器检查异常的测试用例。对于Haskell，Erlang或C，有快速检查库。对于Java/Scala，有ScalaCheck和Nyay.一个测试的想法是模拟一个随机的群体，让它随机地混合，然后让您的软件首先导入，然后导出结果。期望是，输出中的所有连接也在输入和副韵文中。

属性保持不变的情况称为不变量。在这种情况下，不变量是模拟人群中个体之间"浪漫关系"的集合。试着找到尽可能多的不变量，并用随机生成的数据测试它们。不变量可以是函数的，例如：

叔叔还是叔叔，即使你加上更多的"浪漫关系"
每个孩子都有父母
有两代人的人口至少有一个祖父母。

或者它们可以是技术性的：

您的软件不会在多达100亿成员的图形上崩溃(无论有多少互联)
您的软件按o(节点数)和o(边数^2)缩放
您的软件可以保存和重新加载每个族的图形，最多100亿个成员

通过运行模拟测试，您将发现许多奇怪的角情况。修理它们需要很多时间。此外，您将失去许多优化，您的软件将运行得更慢。你必须决定它是否值得，是否在你的软件范围内。

最重要的是对avoid creating a problem，所以我认为你应该使用直接关系来避免循环。

正如@markmywords所说，包括"fritzl.h"。

最后我要说的是recheck your data structure。也许那边出了问题(也许双向链表解决了你的问题)。

除了删除所有断言之外，您还应该检查是否有人是自己的父母或其他不可能的情况，并提出错误。如果不太可能，可能会发出警告，这样用户仍然可以检测到常见的输入错误，但如果一切都正确，它将工作。

我会将数据存储在一个向量中，每个人都有一个永久整数，并将父对象和子对象存储在person对象中，其中所述int是向量的索引。这在几代人之间是相当快的(但是对于像名字搜索这样的事情来说是很慢的)。对象将按照创建的顺序排列。

复制父级(或使用symlink/reference)。

例如，如果您使用的是分层数据库：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

$ #each person node has two nodes representing its parents.
$ mkdir Family
$ mkdir Family/Son
$ mkdir Family/Son/Daughter
$ mkdir Family/Son/Father
$ mkdir Family/Son/Daughter/Father
$ ln -s Family/Son/Daughter/Father Family/Son/Father
$ mkdir Family/Son/Daughter/Wife
$ tree Family
Family
└── Son
├── Daughter
│ ├── Father
│ └── Wife
└── Father -> Family/Son/Daughter/Father

4 directories, 1 file

相关讨论