召回率/正例/负例_关系预测模型正例负例-CSDN博客

类别	含义
真正例（TP）	模型预测为正例，且实际是正例。
假反例（FN）	模型预测为负例，但实际是正例（漏报，模型漏掉了正例）。
假正例（FP）	模型预测为正例，但实际是负例（误报，模型错误地认为是正例）。
真反例（TN）	模型预测为负例，且实际是负例。

假设你参加了一次判断题考试，共有 100 道题，题目分为两类：

你回答后，老师统计了以下结果：

你的回答结果如下：

类比：你认为自己答对的题目中，实际真正确题的比例。
公式：
Precision=TPTP + FP=7070+5=93.3%Precision=TP + FPTP=70+570=93.3%
含义：
- 你一共认为自己答对了 75 题（TP=70 + FP=5）。
- 其中 70 题 是真正确题，5 题 是误判的错误题。
- 精确率 93.3% 表示：“你认为答对的题中，约 93% 是真正确题”。

类比：所有真正确题中，你正确答对的比例。
公式：
Recall=TPTP + FN=7070+10=87.5%Recall=TP + FNTP=70+1070=87.5%
含义：
- 总共有 80 道真正确题。
- 你正确答对了 70 题，漏掉了 10 题。
- 召回率 87.5% 表示：“所有真正确题中，你找到了 87.5%”。

提高召回率的核心目标是尽可能多地捕捉所有实际存在的正例（Positive Examples），即使这意味着会增加一些误判的负例（False Positives）。以下是具体方法和策略，结合理论和实践示例，帮助你系统性地提升召回率：

当正例（目标类别）远少于负例时，模型容易偏向预测多数类（负例），导致召回率低。以下是解决方案：

# 使用SMOTE过采样
from imblearn.over_sampling import SMOTE
X_resampled, y_resampled = SMOTE().fit_resample(X_train, y_train)

调整类别权重（Class Weight）：在训练时给正例更高的权重，迫使模型更关注正例。

# 示例：在Scikit-learn中设置class_weight
model = LogisticRegression(class_weight='balanced')
model.fit(X_train, y_train)

模型侧面我后面再补充