当前位置： ag凯发k8国际 > 人工智能 > chatgpt >内容正文

chatgpt

评估数据源是否回溯-ag凯发k8国际

发布时间：2024/10/8 chatgpt 0 豆豆

ag凯发k8国际收集整理的这篇文章主要介绍了评估数据源是否回溯_iai trade：蒙特卡洛模拟在回溯检验中的应用小编觉得挺不错的,现在分享给大家,帮大家做个参考.

iai trade致力于降低量化交易门槛，在iai trade用户可以使用“可视化策略生成器”0代码生成ea策略，并一键接通模拟交易及真实交易。

蒙特卡洛模拟和回溯检验

考虑一个随机过程，它会产生不同的结果，研究员想知道不同结果发生的可能性，以帮助解决实际问题，蒙特卡洛模拟就是常用的概率分析方法。

在开发策略的过程中，通过优化参数得到“最优”模型是否意味着回溯检验的结束？答案毫无疑问是否定的，这仅仅是第一阶段的结束，接下来需要对交易记录和净值曲线进行深度分析，主要目的是评估模型的预测能力，我们必须回答一个问题：回溯检验的优秀表现能否在交易中重现？

蒙特卡洛模拟可以评估策略运行面临的潜在风险，不管如何小心谨慎地优化参数，都不可避免地挖掘了样本数据，一旦部署策略，真实回撤可能显著大于回溯检验的结果，如何能够判断潜在回撤的概率分布？蒙特卡洛模拟解决了这个问题。首先我们要准备交易纪录，即每一笔交易的pnl，然后进行重复抽样，既可以有放回抽样，也可以是不放回抽样，然后计算每一条模拟的净值曲线的样本统计量，如最大回撤和年化收益率，根据中心极限定理，年化收益率的抽样分布渐进服从正态分布。最后进行概率推断，如计算抽样分布的置信区间，这些信息有助于判断策略运行的潜在风险。

案例分析

library(tidyverse)
library(quantmod)
library(performanceanalytics)
library(quandl)

从quandl下载标普500指数期货的历史价格，计算日收益率。假设使用买入并持有策略。这里把日收益率作为日pnl。

stock <- quandl("chris/cme_es1/6", type = "xts", collapse = "daily")
rets <- stock/lag.xts(stock) - 1
colnames(rets) <- "returns"
head(rets)

## returns
## 1997-09-09 na
## 1997-09-10 -0.020342612
## 1997-09-11 -0.007650273
## 1997-09-12 0.017621145
## 1997-09-15 -0.002164502
## 1997-09-16 0.027114967

笔者创建了一个自定义函数：monte_carlo_simulation，接受3个参数：

pnl: 要求是xts对象，代表pnl，很容易扩展到普通的数值向量，之所以使用xts，是因为笔者想使用performanceanalytics包计算常用业绩指标
n：正整数，模拟次数，默认值为100
replace: 布尔值，true代表有放回抽样，false代表不放回抽样，不放回抽样会导致相同的收益率，因为只是对交易顺序重新排列，只有最大回撤是不同的，有放回抽样是一种更加严格的检验，因为只抽取了部分交易，收益率和最大回撤都不同。

monte_carlo_simulation计算了5个常用的业绩指标：累积收益率，年化收益率，年化标准差，年化夏普比率和最大回撤。返回结果是一个列表，方便后续计算。

monte_carlo_simulation <- function(pnl, n = 100, replace = false) {
# pnl: xts, trading results
# n: positive integer, number of simulations
# replace: logical, sampling with replacement or without replacement
if(!is.xts(pnl)) {
stop("pnl must be xts object")
}
ex_na <- na.omit(pnl)
dt <- index(ex_na)
x <- coredata(ex_na)
size <- length(x)
if(factorial(size) < n) {
stop("n exceeds limit of possible sampling size")
}
m <- replicate(n = n, sample(x, replace = replace))
m_ts <- xts(m, order.by = dt)
equity_curve <- xts(apply(m, 2, function(x) cumprod(1 x) - 1), order.by = dt)
cum_rets <- return.cumulative(m_ts)[1, ] # result is matrix, need to convert it to numeric vector
ann_rets <- return.annualized(m_ts, scale = 252)[1, ] # change frequency if needed
ann_stds <- stddev.annualized(m_ts, scale = 252)[1, ]
ann_sharpe <- sharperatio.annualized(m_ts, scale = 252)[1, ]
mdd <- maxdrawdown(m_ts)[1, ]
out <- list(equity_curve = equity_curve, cum_rets = cum_rets,
ann_rets = ann_rets, ann_stds = ann_stds,
ann_sharpe = ann_sharpe, mdd = mdd)
return(out)
}
sim_results <- monte_carlo_simulation(pnl = rets, n = 500, replace = true)

## warning in factorial(size): 'gammafn'里的值在范围外

这里进行了500次不放回抽样，出于示范目的，500次已经足够，在计算能力充足的情况下可以进行500-10000次模拟。部分研究员指出，1000次模拟的结果已经非常逼近正态分布。让我们绘制500条模拟的净值曲线的波动轨迹。

plot(sim_results$equity_curve, main = "simulations of equity curve")

接下来看业绩指标的抽样分布，首先看年化收益率。

ar <- sim_results$ann_rets
ggplot(null, aes(x = ar, y = ..density..))
geom_histogram(bins = 30)
geom_line(aes(x = ar, y = dnorm(ar, mean = mean(ar), sd = sd(ar))), col = "red",
size = 1.0)
labs(title = "sampling distribution of annualized returns",
x = "annualized returns", y = "density")
theme_bw()

年化标准差。

as <- sim_results$ann_stds
ggplot(null, aes(x = as, y = ..density..))
geom_histogram(bins = 30)
geom_line(aes(x = as, y = dnorm(as, mean = mean(as), sd = sd(as))), col = "red",
size = 1.0)
labs(title = "sampling distribution of annualized standard deviations",
x = "annualized stdev", y = "density")
theme_bw()

年化夏普比率。

sr <- sim_results$ann_sharpe
ggplot(null, aes(x = sr, y = ..density..))
geom_histogram(bins = 30)
geom_line(aes(x = sr, y = dnorm(sr, mean = mean(sr), sd = sd(sr))), col = "red",
size = 1.0)
labs(title = "sampling distribution of annualized sharpe ratio",
x = "annualized sharpe ratio", y = "density")
theme_bw()

最大回撤。

mdd <- sim_results$mdd
ggplot(null, aes(x = mdd, y = ..density..))
geom_histogram(bins = 30)
geom_line(aes(x = mdd, y = dnorm(mdd, mean = mean(mdd), sd = sd(mdd))), col = "red",
size = 1.0)
labs(title = "sampling distribution of maximum drawdown",
x = "max drawdown", y = "density")
theme_bw()

除了最大回撤外，年化收益率，年化标准差和年化夏普比率都非常接近正态分布。最大回撤呈现温和右偏分布，有极大值的存在。

接下来计算样本统计量的置信区间。

sim_results[[1]] <- null
ci <- sapply(sim_results, function(x) quantile(x, probs = c(0.5, 0.6, 0.7, 0.8, 0.9, 0.95, 0.99, 1.0)))
stats <- data.frame(cum_rets = return.cumulative(rets)[1, ],
ann_rets = return.annualized(rets, 252)[1, ],
ann_stds = stddev.annualized(rets, 252)[1, ],
ann_sharpe = sharperatio.annualized(rets, scale = 252)[1, ],
mdd = maxdrawdown(rets))
rownames(stats) <- "backtest"
rbind(stats, ci)

## cum_rets ann_rets ann_stds ann_sharpe mdd
## backtest 1.941649 0.05332191 0.1959935 0.2720595 0.5711340
## 50% 1.982086 0.05401410 0.1958034 0.2768144 0.5077284
## 60% 2.674193 0.06465941 0.1972487 0.3253984 0.5367205
## 70% 3.768695 0.07810906 0.1986608 0.3964761 0.5748254
## 80% 5.176337 0.09161906 0.2000416 0.4645394 0.6277824
## 90% 7.060499 0.10569998 0.2025783 0.5500235 0.6940598
## 95% 9.670987 0.12073953 0.2042243 0.6174111 0.7312092
## 99% 21.347121 0.16134220 0.2071967 0.8207452 0.8178700
## 100% 45.884982 0.20352417 0.2098272 1.0446744 0.8918892

结果显示，有95%的可能性年化收益率会小于等于13.1%，有95%的可能性最大回撤会小于等于71.6%，显著高于回溯结果的57%。蒙特卡洛模拟更多用于评估潜在风险，所以我们应该更多地关注最大回撤和类似的风险度量指标，一般情况下，最大回撤的95%置信上限不应该超过原始策略的2倍，否则认为策略无法通过检验，当然这仅仅是经验之谈，并不是客观准则。

总结

以上是ag凯发k8国际为你收集整理的评估数据源是否回溯_iai trade：蒙特卡洛模拟在回溯检验中的应用的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得ag凯发k8国际网站内容还不错，欢迎将ag凯发k8国际推荐给好友。