如何在R中实现成本敏感型学习以进行逻辑回归

how to implement cost sensitive learning for logistic regression in R

我有一个高度不平衡的数据集。多数与少数族裔比率为99:1。我想建立一个模型,可以准确地预测少数群体。简而言之,我想进行成本敏感的学习,其中假阴性的成本应高于假阳性的成本。
但是我没有在R中找到任何可以进行逻辑回归的软件包。

任何人都可以推荐具有R代码示例的站点的某些文件来这样做。预先感谢。


对于任何不提供成本选项的算法,您都可以对少数类进行过度采样。例如,如果您想将它们加权5倍,则只需对其采样5倍即可。

关于如何处理不平衡数据的文献很多。通用方法包括对少数群体进行过度采样或对多数群体进行欠采样。此外,您可以使用SMOTE等更高级的技术,该技术将根据您的少数群体类别创建综合观察。

在诸如您这样的高度失衡的情况下,我发现多次对多数采样过高而对少数采样率过低的组合使您可以获得可以平均在一起的多个模型,从而可以得出良好的结果。 (基本上,这是修改过的套袋)