特征工程
机器学习中的特征工程到底是在说什么
help大法
对Python中出现的各种help方法做一个简单介绍,也作为一个速查手册来使用。
量化交易入门
量化投资没有确切的定义,它泛指通过数学分析、挖掘价格波动规律,或者通过对相关宏观经济、财务数据、量价关系、资金交易等数据进行建模,寻找数据之间的关系,以获得稳定利润为目标,持续计算生成定量化的投资信号,并通过计算机严格执行。
如何得到一条稳步上升的资金曲线
强壮稳定的投资逻辑:基于对交易市场的了解和市场的特性的认识提出各种假设,构建投资逻辑。这个过程中可以以金融行业的服务研究报告,但是要清醒地、有针对性性地看待这些报告
相信时间的作用:效果再好的资金曲线在某个局部也会出现各种波动,这是不可避免的,个人投资者相较而言能够忍受更长的回撤期,没有固定的开发成本,在建立好自己的模型后,可以充分相信模型,相信时间会证明我们的模型
多资产多策略配置: 对冲风险更高收益
技术信息理论的三大假设
市场行为包容消化一切信息
市场运行以趋势方式演变
历史会重演(我们可以通过历史数据来推断未来走势
绩效评估指标
绩效指标也被称为风险指标,它们也是量化投资的基石,正因为有这些指标我们可以横向对比不同模型。
Annualized Returns策略年化收益率
\begin{equation}
\le ...
博客字体配置
更改字体
更改字体主要通过引入css实现,具体的代码如下所示:
@font-face{font-family: '字体名字';src: url('/font/文件名字.ttf') format("truetype");}body { font-family: '字体名字';}
其中@font-face相当于创建一个字体族,然后下边body部分是在应用字体族,那个名字其实就是在前边创建的字体的名字。
通过在网络上的查找,我首先选择使用的是Robot字体,这个字体族写的英文字体相当漂亮:
Robot字体本身是一款非常漂亮的英文字体,Roboto-Medium 字体被广泛用于广告、海报、画册、包装的设计及印刷中。
考虑到该字体并不支持中文形式,因此在中英文混排时看起来不是那么美观,出于这点考虑,我又加入了自己比较喜欢的一款思源字体来作为中文字体:
二者混排的效果整体来看还算满意,这也本网站当前的显示效果。
另外在寻找字体时我在谷歌字体上发现了一款比较美观的中文字体 ...
线程&进程
线程和进程是计算机任务处理中的两个概念,一个进程相当于计算机处理的一个任务,一个任务可以找通过多种方式或者找多个不同的人去执行,每一个人或者每一种方式就是一种线程。
多进程问题涉及的是任务的分工问题,一般来说是将一个复杂的任务拆分成多个子任务,每一个子任务执行的时候其它子任务也可以同时执行,例如分布式计算。这种分工的好处是可以保证资源的充分利用,但是如果父任务的执行出现错误或者计算错误,那么后边的任务也会受到影响。多进程问题的优化主要是一个多任务管理的方式问题,一般常用的一种方法是队列。
多线程问题主要涉及到的是协作问题,通过建立多个可以独立完成任务的线程来完成任务,很明显的一个优势是运行的效率会比较高。但是当线程之间如果使用同样的变量时则会存在并发的风险,这会大大降低多线程工作的效率,一般来说多线程的优化问题主要是如何减少线程之间的相互影响,一种比较有效的方式就是加一层锁,限制做个线程同时对一个变量进行更改的权利
在 Python 中,线程不能加速受 CPU 限制的任务,原因是标准 Python 系统中使用了全局解释器锁(GIL)。 GIL 的作用是避免 Python 解释器中 ...
Python中的下划线
Python里经常会出现的下划线的用法汇总
使用神经网络解决鸢尾花分类问题
#例12-8 使用训练集和测试集,对iris数据进行分类import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.neural_network import MLPClassifierimport pandas as pdfrom sklearn.model_selection import train_test_splitimport joblibiris = datasets.load_iris()# 为可视化方便,取前2列作为特征属性#print('iris的内容为:\n',iris)X = iris.data[:, :2]#不包括上限2y = iris.target# 划分训练集,测试集X_train,X_test, y_train,y_test = train_test_split( X,y,train_size = 0.8,random_state = 42)hidden_n,hidden_m=10,6#隐层大小,2层,神经元数 ...
线性规划
线性规划最先在第二次世界大战时被提出,用于最大化资源的利用效率。其中的“规划”也是一个军事词汇,指按照既定的时刻表去执行任务或者用最佳方式做人员部署。线性规划问题的研究很快得到了大家的关注。
基本形式
线性规划的一般形式为:
minx∈RnZ=CX=∑j=1ncTx, s.t. Ax=b,Gx⩽e,\begin{array}{cl}
\min _{x \in \mathbb{R}^{n}} & Z=CX=\sum\limits_{j=1}^n c^{\mathrm{T}} x, \\
\text { s.t. } & A x=b, \\
& G x \leqslant e,
\end{array}
minx∈Rn s.t. Z=CX=j=1∑ncTx,Ax=b,Gx⩽e,
这样的线性规划问题可以通过一些方法转化为一下 标准形线性规划问题(等式约束和决策变量非负)
minx∈RnZ=CX, s.t. Ax=b,x⩾0,bi⩾0\begin{array}{cl}
\min _{x \in \mathbb{R}^{n}} & {Z=CX} ...
Lecture 2-Putting Yourselves into Other People's Shoes
overview
At the start of the lecture, we introduce the “formal ingredients” of a game: the players, their strategies and their payoffs. Then we return to the main lessons from last time: not playing a dominated strategy; and putting ourselves into others’ shoes. We apply these first to defending the Roman Empire against Hannibal; and then to picking a number in the game from last time. We learn that, when you put yourself in someone else’s shoes, you should consider not only their goals, but al ...
一元线性回归
本章小结
一元线性回归(掌握)
回归方程及估计(经验)的回归方程(掌握)
参数的最小二乘估计一最小化残差平方和(掌握)
回归方程的拟合优度: 和估计标准误差(掌握)
回归模型的显著性检验(掌握)
回归方程总体的显著性检脸(线性关系检验,或 F 检验)
回归系数的显著性检验(回归系数检验,或 t 检验)
回归系数的区间估计(掌握)
利用回归方程进行估计和预测(理解)
点估计:个别值的,点估计、平均值的点估计
区间估计:平均值的置信区间估计、个别值的预测区间
相关和回归分析是用来度量数值型自变量和数值型因变量之间关系的分析方法。
相关分析
相关关系是指变量之间存在的不确定的数量关系。这种关系与函数关系最大的区别是一个变量的取值不能由另一个变量唯一确定。
相关是考察两个变量是否存在共同变化的趋势
两个变量共同变化的趋势在统计中用共变异数(covariance)来表示,即变量 A 的取值从低到高变化时变量 B 是否也同样发生变化。
线性相关关系的度量
相关系数(correlation coefficient)是根据样本数据计算的度量两个变量之间线性关系强度的统计量。可以根据计算数据来源 ...