




全书以识别 数据 谎言、造假和欺诈为目标,以 数据挖掘 为 技术 手段,以Python 编程 语言 为实现工具,完整展现了数据挖掘的全过程。在业务层面,涉及 互联网 、 财务 、税务、审计、 银行 、 电商 、社保等行业具体应用场景。在技术层面,涉及 统计 分析、机器 学习 、 深度学习 等建模 方法 。本书具有“庞杂数据可视化, 复杂 模型简单化,技术语言 通俗 化”的特点。每个章节开始,综合运用各类图表进行可视化展示,帮助读者对庞杂的数据集有直观认识。在 算法 层面,将使用到的 数学 模型进行简化,用形象的比喻、简化的公式、简洁的图表等揭示复杂的算法原理。
作者简介:
刘宁,深圳
大学 信号与信息处理 专业硕士
研究 生毕业,目前主要从事
智慧 城市 、数字
政府 建设等
工作 。曾
出版 《Python
大数据 分析与应用实战》、《高维信息
几何 与几何不变量》等书籍,发表SCI论文“Content-basedimageretrievalusinghigh-dimensionalinformationgeometry”,获开源
软件 设计 大赛大奖等。
目录:
第1章 Python编程基础知识 1
1.1 Python编程快速
入门 3
1.2 常见类型数据载入 8
1.3 pandas数据处理 13
1.4 数据呈现 46
本章小结 62
第2章 不同阶段常见的数据陷阱 63
2.1 数据采集阶段 65
2.2
数据分析 阶段 69
2.3 数据呈现阶段 83
2.4 数据建模中的常见问题 91
本章小结 97
第3章 利用本福特定律分析公司年报 99
3.1 准备工作 101
3.2 利用本福特定律判断 Meta公司年报可信度 103
3.3 利用本福特定律分析 A股上市公司的年报 114
3.4 本福特定律的延伸 124
本章小结 125
第4章 利用规模法则发现财务数据异常 127
4.1 规模法则 129
4.2 探索性数据分析 131
4.3 利用规模法则进行数据建模 139
本章小结 145
第5章 利用
决策 树进行信贷数据异常检测 147
5.1 数据可视化与异常数据处理 149
5.2 利用决策树进行逾期
风险 预判 161
本章小结 177
第6章 利用 AP聚类算法识别电商平台刷单行为 179
6.1 数据建模 181
6.2 探索性数据分析 184
6.3 利用 AP聚类识别刷
评论 行为 194
本章小结 204
夸克网盘下载(文件解压密码 123456 )
百度网盘下载 提取码: 8837
迅雷网盘下载 夸克资源精选合集
评论列表
发表评论