广义后缀树Java实现

Generalized Suffix Tree Java Implementation

我正在寻找一个Java实现的广义后缀树(GST),具有以下特点:

在使用say 1000字符串创建GST之后,我想知道这1000个字符串中有多少包含其他字符串"s"。

搜索必须安静快速,因为我需要将搜索应用于大约10万个平均长度为10的候选字符串。


尝试语义发现工具包。它在T/SRC/Java/ORG/SD/TEX/RexxTead上实现


我在Java中创建了一个后缀树,允许您轻松添加自己的搜索功能和其他匹配算法。我的博客文章,后缀树在Java中,有一个概述,以及下载最新版本的说明。我的Java实现是基于Mark Nelson的快速字符串搜索后缀树文章。

2016-06-18更新

  • 包含上述后缀树实现的库现在可以在https://bitback.org/globalmentor/globalmentor-core上找到。
  • 该库的最新版本可从Maven Central获得,网址为http://search.maven.org/search%7cga%7c1%7cg%3a%22com.globalmentor%22%20和%20a%3a%22globalmentor core%22。


有一个非通用后缀树的Java实现可在:HTTP:/ILYA KEEPLLIN .BLGSPOT.COM/200 9/04/EXIX-TIEES-JAVA UKONSCNEN算法.HTML


您可以在Java中找到一个通用后缀树的实现。我尽量把它记录下来,这样你会发现它很有用。


以下是我对suffixtree的实现:https://github.com/losvald/sglj/blob/master/src/main/java/org/sglj/util/pattrie.java

此外,它还支持在节点中存储任意数据,并查找与前缀关联的一组值。