PyCaret是Python中的低代码机器学习开发平台,能够自动完成机器学习的整个工作流。
这个库提供了借助相对工整的数据(无缺失值、类型明确)对一类的机器学习模型(分类、回归、聚类)进行训练,该库能够自己对数据集进行处理,并且能够自动生成模型,除此以外还能进行模型的评价和在测试集上的训练,这些都可以在官方文档中的QuickStart中查看。
这个库非常好的一点在于可以直接根据输入数据来判断数据类型然后作相应的数据处理操作,除此以外它也支持自定义的数据处理操作,这些操作可以在官方文档中的Preprocessing中查看。
最后,这个库也支持对于某一个特定的模型进行调优,这些调优可以在官方文档中的Hyperparameter Tuning中查看。
文章作者: 爱编程的小明
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 小明的博客!
相关推荐
2022-03-09
sklearn
介绍 Scikit-learn项目始于scikits.learn,这是David Cournapeau的Google Summer of Code项目。它的名称源于它是“ SciKit”(SciPy工具包)的概念,它是SciPy的独立开发和分布式第三方扩展。原始代码库后来被其他开发人员重写。2010年费边Pedregosa,盖尔Varoquaux,亚历山大Gramfort和Vincent米歇尔,全部由法国国家信息与自动化研究所的罗屈昂库尔,法国,把该项目的领导和做出的首次公开发行在二月一日2010在各种scikits中,scikit-learn以及scikit-image在2012年11月被描述为“维护良好且受欢迎” 。Scikit-learn是GitHub上最受欢迎的机器学习库之一。 scikit-learn.pdf 8 Scikit Learn 速查表.pdf Python数据科学速查表 - Scikit-Learn.pdf
2022-04-01
Matplotlib库
将本文结合代码使用效果更佳哦❤️❤️ matplotlib is a desktop plotting package designed for creating (mostly twodimensional) publication-quality plots. The project was started by John Hunter in 2002 to enable a MATLAB-like plotting interface in Python. Over time, matplotlib has spawned a number of add-on toolkits for data visualization that use matplotlib for their underlying plotting. One of these is...
2022-03-27
Numpy
numpy(numerical Python) 是 Python 数值计算最重要的基础包,大多数提供科学计算的包都是用 NumPy 的数组为构建基础。 NumPy 可以用于数值计算的一个重要原因是因为他能处理大数组的数据: 在连续的内存块储存数据,独立于其他 Python 内置对象(C 语言编写的算法库,在 C 的基础上封装) 可以在整个数组上执行复杂的计算,不需要 for loop 速查 图片对应pdf.pdf 介绍 基本用法 NumPy 最重要的一个特点就是 ndarray(n 维数组对象,一个快速而灵活的大数据集容器) Creating ndarray python 默认创建数组的数据类型是浮点数(方便科学计算) np.array(): 支持任何序列对象 np.zeros() np.empty()创建一个数组,值可能为 0 有些情况下为垃圾值 np.arrange():类似于内置的 range 返回一个 数组的数据类型 类型转换–np.astype 可以在创建数组时指定数值类型,也可以通过...
2022-09-02
Pandas
放一个目录做的的思维导图 一场数模国赛下来发现对于pandas里的一些基础操作还不是很熟练,整个建模过程中用到了许多pandas中对DataFrame的索引,切片访问,分组交叉透视等功能,除此以外稍微高级一点的就是用了几次apply函数来对某一行的值进行一个计算输出,虽然知识描述统计这部分的内容,但是能明显的感觉到对于这些基本功能有些生疏。坦白来讲,pandas的描述统计相关的这些工作其实借助excel也能够实现,但是当考虑到可迁移性这些方面的内容时,使用编程语言的优越性也就自然而然地体现出来,当然,如果对相关的函数不能做到很熟悉的话,其实反而加大了工作量。 简介 Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。 虽然 pandas 采用了大量的 NumPy 编码风格,但二者最大的不同是...
2022-09-21
Seaborn库简介
将本文结合代码使用效果更佳哦❤️❤️ 速查 example gallery: Seaborn 库简介 特点: Seaborn, a statistical graphics library created by Michael Waskom. Seaborn simplifies creating many common visualization types. Unlike when using matplotlib directly, it wasn’t necessary to specify attributes of the plot elements in terms of the color values or marker codes. Behind the scenes, seaborn handled the translation from values in the dataframe to arguments that matplotlib understands. This declarative approach lets you...
2022-04-02
datetime模块
字符串和 Datetime 之间的转换 对于 datetime 模块的所有与时间点相关的对象: 这些对象转化成字符串只需要利用 str 函数(格式化) 也可以利用对象的 strftime()方法,该方法需要传入参数来指定格式化的形式,规范遵循 ISO C89 compatible(详见 time 模块的时间对象格式化方法)。 通过字符串得到这些对象一般要借助对应类的方法 strptime,这个方法需要传入两个参数,一个参数是要解析的字符串,一个参数是规定了字符串的格式。datetime.strptime('2022-02-10','%Y-%m-%d')需要注意的是两个参数的形式必须完全一致否则会解析错误。 考虑到 strptime()方法不适用于格式不相同的字符串转化为时间对象,这里可以使用dateutil.parser.parse()函数对一些常见的时间字符串进行自动解析(这个库会在安装 pd 时自动安装),另外也可以调节参数对解析方式微调 from dateutil.parser import...