保存和加载模型
在新版的python中,可以借助joblib库实现对训练得到的模型进行保存和加载。
对模型的保存需要利用到该库里的dump
函数,加载的话则借助load
函数:
文章作者: 爱编程的小明
文章链接: https://kebuaaa.github.io/%E6%A8%A1%E5%9E%8B%E7%9A%84%E4%BF%9D%E5%AD%98%E4%B8%8E%E5%8A%A0%E8%BD%BD/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 小明的博客!
相关推荐
2022-07-31
PyCaret
PyCaret是Python中的低代码机器学习开发平台,能够自动完成机器学习的整个工作流。 这个库提供了借助相对工整的数据(无缺失值、类型明确)对一类的机器学习模型(分类、回归、聚类)进行训练,该库能够自己对数据集进行处理,并且能够自动生成模型,除此以外还能进行模型的评价和在测试集上的训练,这些都可以在官方文档中的QuickStart中查看。 这个库非常好的一点在于可以直接根据输入数据来判断数据类型然后作相应的数据处理操作,除此以外它也支持自定义的数据处理操作,这些操作可以在官方文档中的Preprocessing中查看。 最后,这个库也支持对于某一个特定的模型进行调优,这些调优可以在官方文档中的Hyperparameter Tuning中查看。
2022-03-09
sklearn
介绍 Scikit-learn项目始于scikits.learn,这是David Cournapeau的Google Summer of Code项目。它的名称源于它是“ SciKit”(SciPy工具包)的概念,它是SciPy的独立开发和分布式第三方扩展。原始代码库后来被其他开发人员重写。2010年费边Pedregosa,盖尔Varoquaux,亚历山大Gramfort和Vincent米歇尔,全部由法国国家信息与自动化研究所的罗屈昂库尔,法国,把该项目的领导和做出的首次公开发行在二月一日2010在各种scikits中,scikit-learn以及scikit-image在2012年11月被描述为“维护良好且受欢迎” 。Scikit-learn是GitHub上最受欢迎的机器学习库之一。 scikit-learn.pdf 8 Scikit Learn 速查表.pdf Python数据科学速查表 - Scikit-Learn.pdf
2022-04-05
如何使用机器学习神器sklearn做特征工程?
使用 sklearn 做特征工程 特征工程是什么? 本文中使用 sklearn 中的 IRIS(鸢尾花)数据集[1]来对特征处理功能进行说明。IRIS 数据集由 Fisher 在 1936 年整理,包含 4 个特征(Sepal.Length(花萼长度)、Sepal.Width(花萼宽度)、Petal.Length(花瓣长度)、Petal.Width(花瓣宽度)),特征值都为正浮点数,单位为厘米。目标值为鸢尾花的分类(Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),Iris Virginica(维吉尼亚鸢尾))。导入 IRIS 数据集的代码如下: from sklearn.datasets import load_iris #导入IRIS数据集 iris = load_iris() #特征矩阵 iris.data #目标向量 iris.target 数据预处理 我们使用 sklearn 中的 preproccessing 库来进行数据预处理,可以覆盖以上问题的解决方案。 2.1...
2022-03-01
sklearn生成数据集
生成数据集 为了方便用户学习机器学习和数据挖掘的方法,机器学习库scikit-learn的数据集模块sklearn.datasets提供了20个样本生成函数,为分类、聚类、回归、主成分分析等各种机器学习方法生成模拟的样本集。 分类、聚类问题样本生成器 make_blobs()方法 sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None) center_box表示中心由随机数产生时的随机数产生的上下界 random_state表示样本数据的随机数产生方法 sklearn.datasets.make_blobs()函数能够生成指定样本数量、特征数量、类别数量、类别中心、类别样本标准差的分类样本集。 from sklearn.datasets.samples_generator import make_blobsX, y =...
2022-01-06
产生和加载数据集
速查表pdf 文本数据读写 python 读取文件常用的一种方式是 open()函数,open 里写文件的路径,读取后返回一个文件对象,借助 file_obj.read()函数可以调取出文件对象的数据(返回字符串),这种情况下要记得使用 close 函数把读取的文件关闭,以免造成损害。 另外一种读取文件的方法是利用 with 关键词来打开文件建立对象,打开的文件对象会在 with 区块内跳出时关闭文件对象。 逐行读取文件 逐行读取的第一种方法是直接通过循环对文件对象进行操作,每次读取出的一行行末的换行符可通过 restrip()函数删除 第二种方法是直接调用文件对象的 readline()方法,该方法将会返回一个字符串组成的列表,列表中每一个字符串包含一行,且有结尾换行符。通过对返回列表的操作可以实现对数据的组合 file_obj=open("D:/test.txt")data=file_obj.read()print(data)for line in file_obj: print(line) ...
2022-07-03
使用神经网络解决鸢尾花分类问题
#例12-8 使用训练集和测试集,对iris数据进行分类import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.neural_network import MLPClassifierimport pandas as pdfrom sklearn.model_selection import train_test_splitimport joblibiris = datasets.load_iris()# 为可视化方便,取前2列作为特征属性#print('iris的内容为:\n',iris)X = iris.data[:, :2]#不包括上限2y = iris.target# 划分训练集,测试集X_train,X_test, y_train,y_test = train_test_split( X,y,train_size = 0.8,random_state =...