-
通过探索性异常检测分析了解异常 -
设置 PyCaret 环境并尝试准备任务的各种数据 -
比较性能并可视化不同的异常检测算法
介绍
-
网络安全 — 监控网络流量并确定异常值 -
欺诈检测—— 可以识别信用卡欺诈 -
IT 部门 —发现并应对意外风险 -
银行业务—— 确定异常交易行为
为什么是 PyCaret?
-
它是一个灵活的低代码库,可以提高生产力,从而节省时间和精力。 -
PyCaret 是一个简单易用的机器学习库,使我们能够在几分钟内执行 ML 任务。 -
PyCaret 库允许自动化机器学习步骤,例如数据转换、准备、超参数调整和标准模型比较。
学习目标
-
执行探索性异常检测分析 -
PyCaret 环境介绍 -
创建和选择最佳模型 -
比较模型中的异常 -
可视化和解释模型
PyCaret 安装
数据导入
导入必要的库
import seaborn as sns
import pandas as pd
import numpy as np
导入数据集
all_datasets = get_data(‘index’)
df.head()
df.info()
探索性异常检测分析
Swarm 图
sns.swarmplot(x=”variable”, y=”value”, data=pd.melt(df))
plt.show()
箱形图
plt.show()
散点图
g = sns.factorplot(x=”Col1″, y=”vals”, hue=’cols’, data=df1)
异常检测
setup = setup(df, session_id = 123)
模型创建
隔离森林
print(iforest)
局部异常因子
print(lof)
K最近邻
print(knn)neighbours
比较模型中的异常
iforest_results.head()
lof_results.head()
knn_results.head()
iforest_anomaly.shape
lof_anomaly.shape
knn_anomaly.shape
解释和可视化
dfr = iforest_results[‘Anomaly’]
viz = Manifold(manifold=”tsne”)
viz.fit_transform(df, dfr)
viz.show()
异常并不总是坏兆头!有时它们在解释结果或数据分析方面非常有用。这些可用于解决不同的数据科学用例。
尾注
本文来自proginn.com,观点不代表一起大数据-技术文章心得立场,如若转载,请注明出处:https://jishuin.proginn.com/p/763bfbd60840
更多内容请访问:IT源点
注意:本文归作者所有,未经作者允许,不得转载