当前标签: sklearn
Python之机器学习-sklearn生成随机数据
sklearn-生成随机数据 import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties from sklearn import d...
2019-05-07 15:59
阅读(508)
运用sklearn做逻辑回归预测
逻辑回归算是机器学习中最基础的模型了,回归模型在做分类问题中有着较好的效果。下面介绍下利用sklearn做逻辑回归模型 做模型一般分为:提取数据---->了解数据(所谓的探索性数据)---->数据预处理(包括但不限于填充缺失值,特征提取,转换哑变量)---->选择模型---->验证模型---->模型优化 ...
2018-07-16 21:43
阅读(894)
ML之Sklearn:利用八种ML算法对根据糖尿病数据集预测新个体是否患糖尿病(利用糖尿病数据集中的八个参数特征预测一个0或1结果)
ML之Sklearn:利用八种ML算法对根据糖尿病数据集预测新个体是否患糖尿病(利用糖尿病数据集中的八个参数特征预测一个0或1结果) 1、预测 2、k-NN k-NN:Accuracy of K-NN classifier on training set: 0.79 k-NN:Accuracy ...
2018-06-19 11:55
阅读(542)
sklearn实战:SVM(线性核函数,多项式核函数,高斯核函数比较)
%matplotlib inline import matplotlib.pyplot as plt import numpy as np def plot_hyperplane(clf, X, y, h=0.02, draw_sv=True, title='hyperplan'): # create a mesh...
2018-06-08 14:25
阅读(2170)
鸢尾花决策树/随机森林实例——sklearn
本次实践主要通过 DecisionTreeClassifier 熵/gini系数决策树模型、以及RandomForestClassifier随机森林模型进行分类; 训练集:测试集=8:2 结果:返回模型评价结果、导出DecisionTreeClassifier 熵/gini系数决策树模型生成的决策树.dot...
2018-05-16 16:10
阅读(740)
【机器学习】异常点检测_sklearn
异常值检测方法可以用于寻找/判断outlier和样本极度不平衡二分类 sklearn提供了几种异常值检测方法 说明:2.7. Novelty and Outlier Detection <http://scikit-learn.org/stable/modules/outlier_detection.html...
2018-04-24 17:51
阅读(1004)
Python之Sklearn使用教程
<>1.Sklearn简介 Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机器...
2018-04-15 19:49
阅读(254)
基于sklearn同时处理连续特征和离散特征
核心思路: 先用LabelEncoder对离散特征编码,因为onehotencoder只能处理数值 然后使用OneHotEncoder编码,生成稀疏表示的特征 再使用sparse.hstack连接连续特征和稀疏特征 为什么不使用pd.get_dummy呢,因为这样是直接生成的稠密矩阵,内存开销太大 # c...
2018-04-12 12:10
阅读(806)