本书围绕股票大数据挖掘技术展开,主要介绍数据挖掘的方法及其在股票大数据上的实战应用。
本书是国内少有的、甚至是首本关于股票大数据应用的著作。不同于一般的量化投资方法,本书更着重于数据挖掘方法、机器学习方法的创新改进和应用实战。本书始终以实际案例来讲解应用之下的技术和理论,让读者明白来龙去脉。
本书围绕股票挖掘所构建的知识体系非常全面完善。在技术上,不仅包含了数据挖掘中常见的方法,如匹配方法、关联分析、分类、聚类、预测、时间序列分析等,还包括自然语言处理方法、深度学习方法、舆情分析方法、行为金融学心理学等方法。在数据应用上,不仅包含了对场内每笔成交数据的分析,还包括财务数据、新闻数据、股吧论坛、机构研报、用户行为等方面的分析。
第1章 股票基础 1
1.1 股票投资入门 1
1.1.1 股票市场 1
1.1.2 常用名称解释 2
1.1.3 股票交易规则 5
1.2 影响股价的因素 6
1.3 股票的基本面分析 9
1.3.1 基本面分析概述 9
1.3.2 企业基本面分析 10
1.3.3 主要财务指标 10
1.3.4 杜邦分析法 11
1.4 股票的技术分析方法 13
1.4.1 技术分析概述 13
1.4.2 经典技术理论分析法 15
1.4.3 K线图分析法 20
1.4.4 技术指标分析法 21
1.4.5 量价结合分析法 22
1.4.6 主力动向分析法 22
1.5 两类方法的区别与联系 23
1.6 股市风险 23
第2章 股票分析技术指标与买卖点计算 26
2.1 目标概述 26
2.2 股票分析技术指标 26
2.2.1 移动平均线 27
2.2.2 MACD平滑异同移动平均线指标 29
2.2.3 KDJ随机指标 31
2.2.4 DMI动向指标 33
2.2.5 OBV累积能量线指标 36
2.2.6 RSI相对强弱指标 37
2.2.7 BIAS乖离率指标 39
2.2.8 CCI顺势指标 41
2.2.9 DMA平行线差指标 42
2.2.10 TRIX三重指数平滑移动平均线指标 43
2.2.11 WR威廉指标 45
2.2.12 BOLL布林带 46
2.2.13 ADL腾落指数 47
2.2.14 ADR涨跌比率指标 47
2.2.15 OBOS超买超卖指标 48
2.3 新方法:基于长短期线的买卖点计算 49
2.3.1 主要思想 49
2.3.2 计算步骤 50
2.3.3 方法步骤与创新特征 54
2.3.4 平台实战解析 55
第3章 股票时间序列的特征表示方法 59
3.1 目标概述 59
3.2 股票时间序列 59
3.2.1 时间序列的基本概念 59
3.2.2 时间序列的影响因素 60
3.2.3 时间序列的分类 61
3.2.4 时间序列分析概述 62
3.2.5 确定性时间序列分析 63
3.2.6 随机性时间序列分析 69
3.3 股票时间序列的特征表示方法 71
3.3.1 方法概述 71
3.3.2 时间序列特征表示 71
3.3.3 基于斜率提取特征点的时间序列分段线性表示 73
3.3.4 基于趋势转折点的时间序列模式表示 76
3.4 新方法:基于拐点检测的股票历史数据分段方法 78
3.4.1 主要思想 78
3.4.2 计算步骤 79
3.4.3 方法步骤与创新特征 81
3.4.4 结果及分析 81
3.5 新方法:基于精准高低点分段匹配的股票预测方法 82
3.5.1 主要思想 82
3.5.2 计算步骤 83
3.5.3 方法步骤与创新特征 86
3.5.4 结果及分析 86
第4章 股票资金流向与主力控盘分析 88
4.1 目标概述 88
4.2 聚类分析 88
4.2.1 聚类与聚类分析简介 88
4.2.2 聚类算法的分类 90
4.2.3 层次聚类算法 92
4.2.4 K-Means聚类算法 95
4.2.5 FCM聚类算法 99
4.3 资金流向分析 101
4.3.1 资金流向分析法简介 101
4.3.2 资金流向分析法的内容 106
4.3.3 在实际应用中的适用性问题及解决方案 108
4.4 新方法:基于资金流向分析的主力控盘能力计算方法 111
4.4.1 主要思想 111
4.4.2 计算步骤 111
4.4.3 方法步骤与创新特征 115
4.5 平台实战解析 115
4.5.1 主力资金与散户资金的博弈 115
4.5.2 主力参与度和主力的控盘能力 122
4.5.3 如何站在股市的风口 126
4.5.4 诊断个股的全局风口位置 131
第5章 股票筹码分析技术与实战 134
5.1 目标概述 134
5.2 筹码分析技术 134
5.2.1 成本转换原理 134
5.2.2 筹码分布的原理 136
5.2.3 筹码分布的形态 139
5.2.4 筹码分布的使用 144
5.2.5 筹码理论的优缺点 147
5.3 新方法:基于涨跌幅排序的股票异动跟踪方法 149
5.3.1 主要思想 149
5.3.2 计算步骤 149
5.3.3 方法步骤与创新特征 151
5.3.4 输出结果示例 151
5.4 平台实战解析 152
5.4.1 买卖盘价量分布下的填坑式变动趋势 152
5.4.2 持仓筹码的集中度与成本获利解析 154
5.4.3 跟随超级大股东的动向并与“王”共舞 156
第6章 财务数据分析与股票估值 160
6.1 目标概述 160
6.2 股票财务指标 160
6.2.1 盈利能力指标 160
6.2.2 偿债能力指标 164
6.2.3 成长能力指标 167
6.2.4 营运能力指标 168
6.3 股票定价理论 169
6.3.1 股票的价格 169
6.3.2 传统股票定价理论 170
6.3.3 现代股票定价理论 173
6.3.4 现代金融工程 175
6.4 正态分布 175
6.4.1 参数与统计量 175
6.4.2 正态分布性质 176
6.4.3 经验规则的运用 178
6.5 新方法:基于自身历史相似收益的股票估值方法 178
6.5.1 主要思想 178
6.5.2 计算步骤 179
6.5.3 方法步骤与创新特征 181
6.5.4 平台实战解析 182
6.6 财务指标可视化 186
6.6.1 财务指标可视化概述 186
6.6.2 主要财务指标 186
6.6.3 维度财务指标 188
6.6.4 财务综合打分 189
第7章 券商研报评级及其有效性分析 191
7.1 目标概述 191
7.2 对券商研究报告进行研究 191
7.2.1 券商研究报告的内容组成 191
7.2.2 研究报告与股市关系的研究方法 193
7.2.3 研究报告现状 196
7.3一致性预期 197
7.3.1 一致性预期概述 197
7.3.2 一致性预期的计算 197
7.3.3 一致性预期的用法 199
7.4 平台实战解析:研报评级及其有效性分析 199
7.4.1 机构研报的评级 200
7.4.2 机构评级的有效性 200
7.4.3 机构研报聚合 201
7.4.4 个股热度分析 202
第8章 股票舆情分析 204
8.1 目标概述 204
8.2 文本挖掘 204
8.2.1 文本挖掘技术简介 204
8.2.2 文本挖掘分类 205
8.2.3 文本挖掘的过程 206
8.3 新闻文本分类 207
8.3.1 文本分类简介 207
8.3.2 文本分类过程 207
8.3.3 互联网股票新闻文本分类实验 214
8.4 股吧情感分析 217
8.4.1 情感分析概述 217
8.4.2 情感分析方法 217
8.4.3 股吧股评情感分类实验 222
8.5 平台实战解析 228
8.5.1 聚合众股吧帖子的人气与涨跌分析 228
8.5.2 实时跟踪企业和行业动态 230
8.5.3 深度挖掘潜在的隐藏信息 232
第9章 股民行为分析与应用 237
9.1 目标概述 237
9.2 行为金融学 237
9.2.1 行为金融学概述 237
9.2.2 行为金融学的心理研究 238
9.2.3 股民心态 244
9.2.4 行为金融学的四大成果理论 248
9.2.5 行为金融学在投资方面的实践意义 252
9.2.6 行为金融学主张的投资策略 253
9.3 协同过滤 255
9.3.1 个性化推荐服务 255
9.3.2 协同过滤概述 256
9.3.3 基于用户的协同过滤推荐 257
9.3.4 基于物品的协同过滤推荐 258
9.3.5 两种协同过滤算法的比较 258
9.3.6 其他推荐技术 259
9.4 平台实战解析:用户潜在行为分析与热门股发现 262
9.4.1 用户的自选股分析 262
9.4.2 用户的点击热度分析 264
第10章 股票交易决策模型 267
10.1 目标概述 267
10.2 经典的股票交易决策模型 267
10.2.1 沃伦·巴菲特交易决策模型 267
10.2.2 威廉·欧内尔交易决策模型 269
10.2.3 彼得·林奇交易决策模型 271
10.2.4 约翰·内夫的交易决策模型 273
10.3 新方法:股票数据挖掘模型 274
10.3.1 模型思路 274
10.3.2 模型介绍 275
10.3.3 模型构建步骤与创新特征 280
10.4 股票大数据挖掘平台简介 281
10.5 平台实战解析 283
10.5.1 股票雷达与多维分析 283
10.5.2 超短线攻略:抓住突变的逆转特征玩偷袭 287
10.5.3 短线攻略:资金筹码助力技术特征建仓位 292
10.5.4 中长线攻略:寻找待填平的估值洼地做价值投资 300
参考文献 304
洪志令,美国加州大学尔湾分校访问学者/助理科学家、北京大学心理学/北京大学机器感知与智能教育部重点实验室博士后,厦门大学人工智能专业博士。先后曾任职于IBM、美国Comodo、厦门大学软件学院,现为股票挖掘网(stocktobe.com)创始人。厦门市高层次引进人才,厦门市思明区思明英才,厦门市思明区政协委员。近年以第一或通讯作者发表SCI/EI检索学术论文32篇。目前拥有11项授权的国家发明专利和超过32项的公开实审国家发明专利。
吴梅红,厦门大学副教授;美国加州大学洛杉矶分校与厦门大学联合培养博士,师从图灵奖获得者Judea Pearl教授;北京大学博士后,美国加州大学尔湾分校访问学者。福建省新世纪优秀人才,厦门市高层次引进人才。在智能科学领域有较深入的研究,并在国内外一流期刊发表多篇文章。
厦门大学软件学院 副院长、教授、博导 王备战
中国科学院深圳先进技术研究院 教授、博导 姜青山
厦门市鑫鼎盛控股有限公司 总经理、执行董事 陈洪生
天云大数据 首席执行官 雷涛
福建通信信息报社 总编辑 刘红权
泉州金控集团 党委书记、董事长 蔡洪潮