当谈论量化分析预测未来时,我们在谈什么

简介:

量化分析投资公司在使用数学及计算机来预测价格趋势以及其它经济指标的同时,正越来越注重通过现实世界的数据–“大数据”来找到各种“信号”,而这“大数据”的信息源范围则较为广泛,不仅会来自于社会媒体,甚至会来自于天气预报。然而根据华尔街日报报道,面对的最大的挑战在于实时的找到相关性并进行交易。


本文将告诉大家如何通过量化分析来预测未来。



第一步:最好的与最聪明的


总部在SoHo且价值240亿美金的定量对冲基金Two Sigma 投资公司在招聘员工时,希望寻找最好的数学家,计算机科学家和专家来设计交易系统,以便于可以更好的进行市场预测。公司在很大程度上希望避免雇佣具有典型金融背景的员工,而更期望雇佣那些有从大规模数据中找到相关性的有分析经验的员工。Two Sigma投资公司鼓励员工们在交易外花时间在脑力活动项目上,例如在公司的“Hackers Lab.”工作时,将精力投入到机器人项目以及其他的公司技术项目中。


第二步:海量数据


传统的定量分析投资者会依赖延时的市场数据对安全价格进行下注,但一些公司现在正探索新的方法,即自动的通过新闻、社会媒体、天气预报以及一些真实社会环境中的数据组合来形成交易方法。


第三步:技术的力量


通过实时处理大量的真实数据,这些公司建设了大量的分布式技术系统,来快速找到相关性和方法模式。例如Two Sigma投资公司已经建设了一个分布式

计算系统,拥有了超过100万亿次浮点运算能力,这也意味着它能每秒处理100万亿次计算,有超过11PB的内存,这是5倍于全美学术图书馆的数据存储量


第四步:使用前沿数学理论


每日这个世界会产生的海量数据,然而要从中发现“信号”必须需要深度的数学技能。定量分析投资公司为了发现拓展模式的新方法,在数学领域中钻研最新的趋势。


第五步:最优化交易


一个成功使用大数据的定量交易员,他的真正诀窍在于找到一个方法来优化不同的交易想法。一些公司已经开发了自动化系统来权衡各种模型。例如在发现某公司CEO在卖出其公司股票的同时,通过社会媒体又发现其公司产品的关注度在提升,前者代表着售出,后者模型代表着买入该股票。两种模型的结果是相矛盾的,但是一旦找到平衡点,系统就可判断出可能成功的方法,系统就能立刻提交交易。



原文发布时间为:2015-04-29

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
7月前
|
物联网 虚拟化 Windows
Windows 10 version 22H2 中文版、英文版下载 (2025 年 7 月更新)
Windows 10 version 22H2 中文版、英文版下载 (2025 年 7 月更新)
1058 0
|
12月前
|
人工智能 数据可视化 UED
DragAnything:视频PS来了!开源AI控制器让视频「指哪动哪」:拖拽任意物体轨迹,多对象独立运动一键生成
DragAnything 是快手联合浙江大学和新加坡国立大学推出的基于实体表示的可控视频生成方法,支持多实体独立运动控制、高质量视频生成,并在 FID、FVD 和用户研究等评估指标上达到最佳性能。
551 10
DragAnything:视频PS来了!开源AI控制器让视频「指哪动哪」:拖拽任意物体轨迹,多对象独立运动一键生成
|
12月前
|
数据挖掘 Android开发 数据安全/隐私保护
Cellebrite Inseyets PA 10.4 - 取证数据分析软件
Cellebrite Inseyets PA 10.4 - 取证数据分析软件
399 10
Cellebrite Inseyets PA 10.4 - 取证数据分析软件
|
JSON API 开发者
ebay 商品列表数据接口(ebay API 系列)
eBay 商品列表数据接口为电商从业者、开发者和研究人员提供了宝贵的数据资源,助力市场分析与应用开发。通过注册 eBay 开发者平台并遵循 OAuth 2.0 认证流程获取访问令牌,用户可以使用 HTTP GET 请求调用 API,根据关键词、价格范围等参数筛选商品,并获取商品标题、价格、图片链接等信息。Python 示例代码展示了如何发送请求、处理响应并解析 JSON 数据,帮助用户快速上手。注意合法合规使用数据。
578 14
onnxruntime cmake配置
onnxruntime cmake配置
619 2
|
12月前
|
机器学习/深度学习 缓存 自然语言处理
《DeepSeek推理加速术:高效响应的秘密武器》
DeepSeek是一款备受瞩目的语言模型,通过架构优化、量化技术、缓存机制及分布式推理等手段,在推理速度上取得显著优势。它在文本生成、智能客服等任务中表现出色,极大提升了用户体验和效率。特别是在处理长序列文本时,DeepSeek的优化注意力机制大幅降低了计算复杂度,使其在新闻写作、舆情分析等场景中能够快速生成高质量内容。此外,量化技术和分布式推理进一步减少了计算开销,拓展了计算能力,为自然语言处理的广泛应用奠定了坚实基础。
681 0
|
机器学习/深度学习 人工智能 算法
人工智能平台年度技术趋势
阿里云智能集团研究员林伟在年度技术趋势演讲中,分享了AI平台的五大方面进展。首先,他介绍了大规模语言模型(LLM)训练中的挑战与解决方案,包括高效故障诊断和快速恢复机制。其次,探讨了AI应用和服务的普及化,强调通过优化调度降低成本,使AI真正惠及大众。第三,提出了GreenAI理念,旨在提高AI工程效率,减少能源消耗。第四,讨论了企业级能力,确保数据和模型的安全性,并推出硬件到软件的全面安全方案。最后,介绍了整合多项核心技术的Pai Prime框架,展示了阿里云在自主可控AI核心框架下的整体布局和发展方向。
|
搜索推荐 数据挖掘 API
淘宝商品API接口的对接及收益
淘宝商品API接口是淘宝开放平台提供的数据服务,支持商品搜索、详情、评价等功能,帮助开发者快速获取商品数据,提升用户体验,降低运营成本,增强市场竞争力,并支持数据分析和业务决策。对接流程包括注册账号、获取API密钥、阅读文档、编写请求代码、发送请求、解析数据、错误处理和日志记录等步骤。通过实际案例,如价格比较网站、库存管理工具、个性化推荐系统等,展示了API接口的应用价值。
450 5
|
安全 虚拟化 数据中心
VMware
VMware
621 3
|
计算机视觉 网络架构
CVPR 2024:基于MoE的通用图像融合模型,添加2.8%参数完成多项任务
【5月更文挑战第9天】CVPR 2024上的TC-MoA模型通过MoE策略改进通用图像融合,添加少量参数实现多任务处理。该模型使用适配器共享和相互信息正则化提升跨任务兼容性,动态路由网络适应不同任务需求。实验显示其在多模态、多曝光和多聚焦融合中表现出色,但依赖预训练基础模型且可能无法完全捕捉所有任务特定信息。[[arxiv.org/abs/2403.12494](https://arxiv.org/abs/2403.12494)]
555 1