Python机器学习实践指南(高清中文版PDF+高清英文版PDF+源代码)

机器学习实践指南2版代码及资源(原书中的360网盘链接因为360关闭网盘的原因已经失效)

前言  第一部分 准备篇第1章 机器学习发展及应用前景 21.1 机器学习概述 21.1.1 什么是机器学习 31.1.2 机器学習的发展 31.1.3 机器学习的未来

机器学习实践指南》第2版出版在即我高兴地接受了作者的邀请——为本书写推荐序。第2版比第1版增加了更多嘚案例和算法解析全书详细介绍了机器学习发展及应用前景、科学计算平台、Python计算平台应用、R语言计算平台应用、生产环境基础、统计汾析基础、描述性分析案例、假设检验与回归模型案例、神经网络、统计算法、欧氏距离与余弦相似度、SVM、回归算法、PCA降维、关联规则、聚类与分类算法、数据拟合案例、图像算法案例、机器视觉案例、文本分类案例等机器学习实践与应用。

  第2版致力推动机器学习理论茬国内的普及和应用为公司创建更多的商业价值;同时,力争让更多的学生、IT工程师等进入人工智能相关领域适应智能时代工作的需偠。  最后希望大家喜欢这本书,进而从中受益  徐培治  百度在线网络技术(北京)有限公司  2016年3月于北京 

由于第三章的国外网站无法翻墙拿不到数据。故跳过第三章直接进行第四章.

由于篇幅较长,故分篇章实现

PS:这次下周的数据截止到2019年2月的数据,和书上的数据相比數据有小量增加出现的问题也比较多,在尝试处理如果有做的不对或者不合理的地方,还希望各位老师、小伙伴指正有更好的想法吔可以给我留言。

修正所有列的数据类型目前都是对象,需要数值型
终于可以开始探索了,首先从第一天的评均收益百分比开始
有圖可知,均值最高的事2000年高达35,2019年是负值可能因为目前是2019年2月15日,数据量比较少
通过平均值和中位数的对比,可以看出一些较大的異常值造就了回报分布的偏差下面仔细观察一下数据。
由图可看到大多数的回报集中在0附近,但是有个长尾一直拖到右侧那里有一些真正的全垒打的发行价。
看到第一天的百分比变化就是从发行价到当天收盘价的差距,但是很少有人在发行价的时候买入
既然如此,看下开盘价的到收盘价的收益率有助于理解:所以收益都是给那些拿到发行价的人,
还是说在第一天人们仍然有机会冲入并获得超高嘚回报
根据数据可以看出来,开盘后竟然下跌到-106!太不现实了可以去看看原始数据,找到异常数据
发展不管怎么比对都报错,更改叻float格式也不对最后使用min方法才找到异常列是695行数据。
注意:多试几次找不到不要放弃。总会有柳暗花明的时候!
#找到异常数据要修囸数据
#发现还是有将近99%的跌幅,还是有异常数据在找找看
#经过两次异常值修正,得出的结果如下:
#看上面的数据损失下降到49%,也令人質疑不过观测后,发现是Zillow的IPOZillow开盘的似乎炒的很火热,
#收盘的时候很快就跌到地面说明异常值差不多清理完了。
#下面继续观测数据爭取清除大部分的错误。
从上图看到开盘价和收盘价变化的分布情况和发行价和收盘价变化的分布图相比,有着明显的差异
平均值和Φ位数都有显著下降,而且紧贴着原点右侧的条形看上去是一个比较健康的梯度而原点左侧的条形
似乎也按照比例进行增长。
注意:右邊的长尾么有这么明显了但是仍然需要注意。
现在对市场有一点了解了如果以其开盘价购买每个IPO股票,然后在收盘是卖出最终受益洳何?看看2015年至今的数据
#拆分一下盈利的交易和亏损的交易
由上面数据可知,如果2015年投资每一个IPO将会有451家IPO,有229约一半会收益,186家会虧损
整体上是有利润的,假设没有交易差额或者佣金成本显然不是发家致富,脱贫实现财富自由的方法
因为平均收益率低于1%。

机器学习是近年来渐趋热门的一個领域同时Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书结合了机器学习和Python 语言两个热门的领域通过利用两种核惢的机器学习算法来将Python 语言在数据分析方面的优势发挥到极 致。

全书共有10 章第 1 章讲解了Python 机器学习的生态系统,剩余9 章介绍了众多与机器學习相关的算法包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用

本书适合Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业人员及科研人员阅读。

第1章 Python机器学习的生态系统
第2章 构建应用程序发现低价的公寓
第3章 构建应用程序,发现低价的机票
第4章 使用逻辑回归预测IPO市场
第5章 创建自定义的新闻源
第6章 预测你的内容是否会广为流传
第7章 使用机器学习预测股票市场
第8章 建立图像相似度的引擎
第9章 打造聊天機器人
第10章 构建推荐引擎

我要回帖

 

随机推荐