关于聚类分析:在哪里可以找到可靠的 K-medoid(不是 k-means)开源软件/工具?

Where to find a reliable K-medoid(Not k-means) open source software/tool?

我正在学习 K-medoids 算法,如果我问了不恰当的问题,我很抱歉。据我所知,K-medoids 算法实现了 K-means 聚类,但使用实际数据点作为质心而不是数学计算的平均值。

当我在网上搜索时,我发现了很多 k-means 工具,例如 GenePattern、geWengh 等,但没有发现 k-medoids 工具。一些好朋友向我展示了在 Matlab 中,也有一个用户编写的。但是,恐怕个人实现的工具可能仍然存在一些错误或限制。因此,我想知道是否有一些广泛使用的可靠开源软件/工具使用实际数据点作为质心进行聚类。我需要找出有关实际质心的信息,因此仅返回聚类结果是不够的。我更喜欢网站在线的,但如果不是这种情况,我可以将它安装到我的本地机器上。非常感谢,


  • C 聚类库(源代码,手册)中提供了 C 中的 k-medoid 实现。 (注意,Cluster 3.0 是这个库的扩展,可能不提供 k-medoids)

    来自手册:

    In the C Clustering Library, three partitioning algorithms are available:
    a€¢ k-means clustering
    a€¢ k-medians clustering
    a€¢ k-medoids clustering

  • mlpy 中的 k-medoids,Python 中的机器学习库

  • Matlab 中的 k-medoids

  • Java 中的 k-medoids

  • C 中的 k-medoids


  • 软件:

    • ELKI 包括几个 k-means 变体,包括 K-medoids 和 PAM。
    • GNU R 包含在 k-means 的 "flexclust" 包变体和 "cluster" 包中。

    来源:http://en.wikipedia.org/wiki/K-medoids


    对于 Python,我找到了一个实现 PAM 和 Clara 的包:PyCluster