西西河

主题:【原创】小虎纵横谈(10)虚实(下) -- 万里风中虎

共:💬192 🌺600
分页树展主题 · 全看首页 上页
/ 13
下页 末页
      • 家园 怎么看不图啊
      • 家园 技术贴,一定要花,顺便探讨一下kernel的选择

        感谢楼主这种实践精神。虎大原文是用Gaussian Kernel来估测的,但是KDE本质上并不局限于Gaussian(大家都喜欢Gaussian主要是因为它简单,以及大数定律下的保障,但是实际数据往往不满足这个要求)。刚刚看过一个计量学的文章,用的是Epanechnikov,因为它在最小方差意义上是最优的。不知道楼主可不可以用Epanechnikov来估计一下?多谢多谢

        送花成功,可取消。有效送花赞扬。

        参数变化,作者,声望:1;铢钱:0。你,乐善:1;铢钱:-1。本帖花:1

        • 家园 确实Kernel的选择有多种

          用高斯分布也是为了简单。如果用Epanechnikov,那么就要用到专业软件了,比如SAS,matlab了。

          不过确实值得继续深入研讨一下。

          另外,我觉得用KDE来估分布是很粗糙的模型,应该局限性很大。但是具体还没有想清楚。还是请虎大来点播一下吧。

          • 家园 你的思考很好,需要想清楚KDE的应用前提

            KDE是假设观测值是IID(独立同分布的),这个要求在具体的实践中意味着什么?

            1) 要求时间序列是平稳的:所以老虎才在自己的帖子中声明自己首先做了稳定性检验。

            2)由此衍生出,为什么老虎选择的是这个股票?或者说什么样的股票的数据符合1)的要求(或者简单处理后就可以符合)。

            我自己能想到的:公司结构稳定,成长性可预测(可以从历史数据中预测)。据此,这个基本上不太适合成长性很高的小盘股。(想想老虎的股票都属于那个类型的?)

            3) KDE是估计随即变量的概率分布,根据此来判断增减你的持股多少,这实际上是价格回归的交易策略。如果你要采用趋势交易,这个KDE对你的帮助就不大了。

            先写这些吧,觉得还是有很多深层的内涵的,想到了再补充。

            • 家园 兄台,受教了!

              非常感谢你又从理论上点拨了我一下,这年头遇到高人不易啊。

              我见识浅薄,连民科都算不上,没有想得这么深远。也就是靠着Wikipedia,再结合自己早年学过的粗浅的概率统计知识来搞的。

              兄台提到的几点我会好好想想。再次感谢一下,希望以后多多交流。

        • 家园 用高斯核倒不是什么问题

          关键是窗宽如何确定。

      • 家园 先花再提问

        我用你的方法测算了虎大文中其他几只票的数据,出图都没有问题,的确很给力。

        但是在使用600153的数据作图的时候,图像上没有任何线条出现,程序对话框中也没有提示错误,仅仅是不出图,不知道这是什么原因?

        我是今天早上才下载了这个软件学着使用,其他设置都是默认的。

        • 家园 大概是数据文件的问题

          另外你说已经成功作出了其他几个图,那么作600153应该很顺利。

          你能贴一下你数据文件的一部分吗?还有能否把你的Gnuplot命令也贴一下。

          • 家园 gnuplot报这样的错

            warning:skipping unreadable file"600519.dat"

            no data in plot

            用的是刚下载的gnuplot 4.4

            600519.dat文件是放在demo文件夹下

            命令也是复制的帖子里面的

            昨天晚上试了一遍成功了

            今天下午再分析别的股票时就不行了

            请北府帮忙分析下,有可能是哪出了问题

            我是将excel保存为txt,在把txt文件直接命名为dat文件

            • 家园 问题已解决

              文件放在binary文件夹就可以了

              • 家园 你这个是文件路径问题了

                Windows版的gnuplot启动后默认路径就是设在gnuplot安装路径下的binary目录。所以如果你的数据在其他路径,一开始你要先进入那个路径。

                cd ‘C:\\Documents and Settings\\user\\Desktop\\stock.dat'

                切忌,路径一定要用单引号或者双引号引起来。反斜杠(\)可以用两个反斜杠(\\)转义,或是一个正斜杠/代替。

          • 家园 我的命令行就是照抄你给出的

            plot 'C:\Users\Administrator\Desktop\600153.txt' using 1:2 smooth kdensity

            数据前部分如下

            close weight

            6.87 0.003964592

            6.77 0.004632495

            6.78 0.003020066

            6.65 0.00372259

            6.64 0.00303693

            6.51 0.003760837

            6.63 0.004844106

            6.5 0.004504226

            6.64 0.003010022

            6.66 0.004298255

            6.74 0.004329624

            不知道是哪里有问题了?

            另外,虎大的数据里面涉及复权的数据和我们差别还是挺多的,你可以比较一下他引用的数据分析结果中min和max的数值,和我从飞狐软件中得到的极值都不一样。

            短期一年内还好说,超过一年以上尤其是涉及股改的复权就很麻烦了,最后算出来的加权平均成本和虎大的结果差异很大,例如中信证券。

            • 家园 数据是一个问题。不知哪位可以搞到

              Thomson One Banker的数据。

              另外你的数据文件第一行 “close weight”

              要不删掉,要不用#注释掉。估计是这个造成Gnuplot表现不正常。

分页树展主题 · 全看首页 上页
/ 13
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河