主题:【原创】小虎纵横谈(10)虚实(下) -- 万里风中虎
另外你说已经成功作出了其他几个图,那么作600153应该很顺利。
你能贴一下你数据文件的一部分吗?还有能否把你的Gnuplot命令也贴一下。
感谢楼主这种实践精神。虎大原文是用Gaussian Kernel来估测的,但是KDE本质上并不局限于Gaussian(大家都喜欢Gaussian主要是因为它简单,以及大数定律下的保障,但是实际数据往往不满足这个要求)。刚刚看过一个计量学的文章,用的是Epanechnikov,因为它在最小方差意义上是最优的。不知道楼主可不可以用Epanechnikov来估计一下?多谢多谢
送花成功,可取消。有效送花赞扬。
参数变化,作者,声望:1;铢钱:0。你,乐善:1;铢钱:-1。本帖花:1
Kernel density其实就是数据平滑(smoothing)工具。你画个柱状图(histogram),PDF(Probability Density Function)看起来就差不多了。
用Kernel density平滑会好看一些,但也会有些失真。
Matlab,Mathematica,还有其它一些统计软件有内带的统计函数,直接调用统计函数就可以得出平滑后的数据。
Excel的统计插件我给你找找。 AMC technical Brief 里面有讲Excel 插件。不过建议还是用Matlab来搞,处理数据方便。
关键是窗宽如何确定。
用高斯分布也是为了简单。如果用Epanechnikov,那么就要用到专业软件了,比如SAS,matlab了。
不过确实值得继续深入研讨一下。
另外,我觉得用KDE来估分布是很粗糙的模型,应该局限性很大。但是具体还没有想清楚。还是请虎大来点播一下吧。
我用的是Gnuplot自动算出的bandwidth。
它的算法应该是根据AMISE(h)最小来计算出来的吧。
我也有用Matlab来试试的兴趣。或者使用免费的Octave来实现。
技术讨论,献花。
(1)加权均价:你用的是“每日收盘价X每日交易量”,应该是“每日成交均价*每日交易量”,其实应该就是每日成交金额。这个可能是误差来源。
(2)如果用matlab计算的话,你上File exchange上找一个kde2d.m的matlab文件,它假定kernel is assumed to be Gaussian.可以得到一个三维或者二维等值线图。但是得到的结果和虎大有些小差别,但是无原则性差别。
(3)用上面的程序得到的结果的bandwidth与虎大的结果不一样。
不会贴图。先讨论到这里,有啥心得,一起讨论。
能不能算算其它三个,尤其是LTMY和ynby000538,好象有差距啊,还挺大,不知是不是我算错了,000538我算出来有62?
同意第一点。
回头试一下第二点。
送花
plot 'C:\Users\Administrator\Desktop\600153.txt' using 1:2 smooth kdensity
数据前部分如下
close weight
6.87 0.003964592
6.77 0.004632495
6.78 0.003020066
6.65 0.00372259
6.64 0.00303693
6.51 0.003760837
6.63 0.004844106
6.5 0.004504226
6.64 0.003010022
6.66 0.004298255
6.74 0.004329624
不知道是哪里有问题了?
另外,虎大的数据里面涉及复权的数据和我们差别还是挺多的,你可以比较一下他引用的数据分析结果中min和max的数值,和我从飞狐软件中得到的极值都不一样。
短期一年内还好说,超过一年以上尤其是涉及股改的复权就很麻烦了,最后算出来的加权平均成本和虎大的结果差异很大,例如中信证券。
老虎出图后大家都兴趣十足的找相关软件,看到讨论的许多软件门槛太高,所以昨晚放狗弄到一个excel插件。插件安装方便,出图给力。不敢藏私,和大家共享。
先讲一下如何安装
1. 把插件释放在一个文件夹
2. 打开excel,找到工具-选项-调低宏的安全等级
3. 工具-插件-找到插件的文件夹-安装宏
4. excel打开手上的股市数据,选一年的时间段,选择对应的价格然后运行宏.
5. 得到图,和老虎的图以及其他软件出的图一摸一样
您好像忘了。
Thomson One Banker的数据。
另外你的数据文件第一行 “close weight”
要不删掉,要不用#注释掉。估计是这个造成Gnuplot表现不正常。