关于nlp：LDA主题模型性能-scikit-learn的主题一致性实现

LDA Topic Model Performance - Topic Coherence Implementation for scikit-learn

我对围绕scikit-learn构建的LDA模型测量/计算主题一致性有疑问。

主题一致性是衡量给定LDA主题模型的人类可解释性的有用度量。 Gensim的CoherenceModel允许针对给定的LDA模型(包括多个变体)计算主题相关性。

我有兴趣利用scikit-learn的LDA而不是gensim的LDA来简化易用性和文档编制(请注意：我想避免使用gensim来进行scikit-learnpackage器，即实际上是利用sklearna的LDA)。根据我的研究，似乎没有与Gensima的CoherenceModel等效的scikit学习。

是否有办法：

1-将scikit-learna的LDA模型输入gensima的CoherenceModel管道，方法是通过手动将scikit-learn模型转换为gensim格式，或者通过scikit-learn转换为gensimpackage器(我已经看到了package器其他方法)以生成主题连贯性？

或

2-从scikit-learna的LDA模型和CountVectorizer / Tfidf矩阵手动计算主题一致性？

我已经对该在线用例的实现进行了大量研究，但是还没有找到任何解决方案。我仅有的线索是科学文献中记录的方程式。

如果任何人都对任何类似的实现有任何了解，或者如果您可以为我指出为此创建手动方法的正确方向，那就太好了。谢谢！

*侧面说明：我了解scikit-learn中提供了困惑度和对数似然性来进行性能测量，但是从我所阅读的内容来看，这些并不能作为预测性内容。