下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

ai与a股……数学原理之二

20-12-06 22:18 1465次浏览
lihf05
+关注
博主要求身份验证
登录用户ID:
理论是理论,现实是现实。2点确定一条直线理论上没错,但是问题是仅凭2个样本点,你真的放心?万一2个样本点有一个有问题了怎么办?只要稍微受到点干扰,有点误差,结果可能就是失之毫厘,谬以千里。所以安全的做法,肯定采集的点越多越好。理论上来说,如果采集的点都没有问题,那么任取2个点,带入方程,然后求解二元一次方程组,求解得到(a,b)值对,其他的点带入到方程,应该都恰好满足方程。但是实际上这种情况极为罕见,我们获得的数据其实多多少少都有一些误差的,其实有专门探讨误差的理论。

好了,假定我们采集的数据多少有一些误差(其实这个才符合现实世界的实际情况),那么我们就不能从待定系数法求解了。原因至少2个,1个是本来数据有误差,y=ax+b这个等式本来就不成立。退一步说,就算等式成立,多个点的时候,方程组其实无法求解。2点确定一条直线是没问题的,问题是多个点的时候?如何选取2个点了?只要2个点选择了,

直观来说,直线就可以画出来,但是其他点怎么办?没有更多信息的时候,任意2个点的选择都不能符合要求,任意2个点的选择画成的直线都不能包括其他点。从代数角度说,你把n个样本点信息带入到y=ax+b中,得到的方程组其实无解的。

这个时候最小二乘法就派上用场了。既然无论选择哪2个样本点都不能让其他样本点满意。那么干脆谁都不选择好了。我们独立的画一条直线,只是这个直线到每个样本点距离的误差都不大,我们的总体目标让所有的点总的误差达到最小,这样应该所有的点都没有意见了。好了,假定有n个点,分别是(xi,yi),那么我们第i个点到直线的距离应该是axi+b-yi的绝对值,对每个点的误差总体求和,那么新得求和的误差函数为f(a,b)=0n|xi+b-yi|,求极值的问题,微积分是最擅长了,对变量a,b求偏导数,然后偏导数为0的时候,就是极值点位置。这个时候a,b就能解出来了。但是问题是对于绝对值,求偏导数麻烦,我们把绝对值换成
(xi+b-yi)的平方,那么新得误差函数为f(a,b)=0n(xi+b-yi)2,对这个函数求偏导就容易了。
然后偏导数为0,得到2个方程构成的方程组,就能得到(a,b)值对,也就是这个直线到每个点的误差的平方和最小,直觉上这个直线应该是最好的。这里(a,b)的值对取决(xi,yi)的值,不同的样本点,对应的(a,b)都不一样,这里就是学的意思了,也就是说规律取决历史数据,从历史数据中学到规律。
不过你较真的话,你会觉得为啥最小误差一定是每个点误差的平方和,而不能是其他,比如3次方不行?4次方不行?从直觉上来看,2次方,3次方,4次方都没有本质区别。唯一能解释得就是2次方得话,方程组求解方便。但是只有方便这点优势,总感觉还是牵强点。而且我们说过AI本质是基于概率统计,我们这个求解过程没有看到概率统计得内容啊。
既然说到了概率统计,我们就想到了概率统计中参数估计部分的内容。如果当成参数估计的话,我们的模型就可以看成是一次采样有n个点,我们想通过这次采样过程,估计参数值对(a,b)的值。假定每次的采样误差都是独立同分布的。那么我们能想到的是啥概率分布了?最先想到的肯定是正态分布,这个分布应用实在是太广了。好了那么误差(axi+b-yi)的值满足均值为0的正态分布。概率分布有了,然后采用极大似然估计就可以了,这个时候我们发现刚好极大似然估计函数变量部分包含的就是误差平方和。也就是极大似然估计和最小二乘法的求解结果是完全一样的。
这个时候我们就会发现,虽然很多地方介绍最小二乘法的时候直接给出了求解最小误差平方和的模型。这个模型直觉上有道理的。但是其背后其实是误差分布符合均值为0的正态分布,那么这个模型在统计意义上就有了解释了。用起来就很放心了。所以这个地方再一次验证2个结论,1个是所谓的学过程其实就是对于1个确定的模型,其参数的值依赖样本数据。1个就是一些表面上看不到概率统计的地方,其实背后至少有着基于概率统计的良好结果作为保证。
到现在的例子,用的都是最简单的直线模型。大家肯定觉得实际的模型肯定要比简单的直线模型复杂多了。接下来想从线性代数角度继续往下介绍。但是在介绍线性代数相关内容前。先介绍2个具体的例子来做过渡。1个是泰勒级数展开,1个是傅里叶变换

  

  
打开淘股吧APP
2
评论(41)
收藏
展开
热门 最新
拿起屠刀

21-04-04 19:35

0
还是接着讲ai吧,自动化交易反正就是搬砖嘛。。。
拿起屠刀

21-04-04 19:35

0
催个更
刘疯狂

20-12-28 11:47

0
兄 看下站内信
排队

20-12-25 23:22

0
@lihf05 楼主的系列文章还没发完吧?怎么就不发了?
排队

20-12-08 21:47

0
吧里讨论自动交易的帖子还是有一些的,不过自动交易有门槛,吧里的参与讨论的人并不多。
awbma

20-12-08 21:28

0
哈。删帖。
lihf05

20-12-08 21:24

0
我不参与自动化交易部分的讨论了哈
lihf05

20-12-08 21:24

0
我不参与讨论了哈
awbma

20-12-08 21:23

0
排单系统都能做,当然不能少了跟撤控件啊。
排队

20-12-08 21:17

0
@lihf05 这个没有办法,近期华鑫的自动打板屡屡上榜,引起了一些大佬的关注。
但目前最主要的问题的似乎是自动卖出策略不成熟,很多是竞价无脑砸,导致踩踏。 
后面还有可能出现的问题是撤单雪崩效应:一个大单撤单导致很多策略自动跟撤,我之前做的自动打板,一个优势就是自动判断砸盘和主力撤单跟撤。
刷新 首页上一页 下一页 末页
提交