赤峰打印机价格协会

Python数据科学入门与网络爬虫案例实战研讨会【5月·北京】

陈堰平2020-03-25 13:39:06


Python作为一门面向对象的编程语言,简洁的语法使得编写十几行代码即可实现爬虫功能,获取海量互联网数据。使用Python来编写爬虫实现简单且效率高,同时爬取的数据可以使用Python强大的第三方数据处理库来进行分析,最重要的是学习成本低,如此之好的东西怎能不学习呢?

2017年,雪晴数据网举办了三期Python爬虫与机器学习应用案例研讨会,取得了非常好的效果。之后不断有人询问我们何时再次举办类似的研讨会,经过我们的反复调研,对原有的培训内容做全新升级,定于今年5月5日至6日再次举办一期研讨会。


会议主题 Python数据科学入门与网络爬虫案例实战研讨会


时间地点

2018年5月5日-- 6日  北京理工大学(具体地点报名后通知)

(时间安排:外地参会人员5月4日报到,5日~6日正式会议)


主办机构

主办方:雪晴数据网

协办方:

  • 北京友万信息科技有限公司

  • 北理工大数据创新学习中心


参会对象

从事金融、医疗、保险、生态、卫生、计量、统计、银行、通信、环境、基金等与数据分析统计相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员,以及广大Python爱好者。


讲师介绍

陈堰平,雪晴数据网创始人,北京理工大学大数据创新学习中心业界导师团成员,2017年1月获“微软最有价值专家”荣誉称号。曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为人保财险、国家统计局、微软、惠普、野村综研、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通等机构做过数据科学方面的培训和咨询。2017 年先后两次担任教育部高等学校计算机类专业教学指导委员会主办的“全国高校大数据系列课程高级研修班”主讲老师。

陈栋,雪晴数据网助理讲师,北京林业大学博士,北京理工大学大数据创新学习中心运营团队核心成员,曾任东方浩星(北京)传媒科技有限公司数据分析师。参与多个国家课题,发表SCI/EI/CSCD检索的论文10余篇。具有互联网公司就业实习经验,对餐饮、影视等行业的信息系统构建、数据分析与挖掘方面有丰富经验。


主题安排

  • 我们会根据学员的意愿从案例库里来选择案例讲解,学员也可以提供自己想要抓取数据的链接,老师现场讲解


第一天
案例一: 爬取电影票房数据,然后对数据进行整理汇总,可视化展示
案例二: 抓取各级行政区域的天气数据
案例三: 从东方财富网抓取基金数据
案例四: 抓取土地流转数据
案例五: 抓取历届政府工作报告,并绘制词云图
案例六: 抓取全国土地交易数据
案例七: 抓取北京交通委公布的交通指数
案例八: 批量下载上交所上市公司公告
第一讲
Python环境的搭建与基础语法
1. 安装anaconda套件
2. Jupyter Notebook的使用
3. 基本数据结构(列表、字典、元组)
4. 基本语法(条件、循环、函数、类)
第二讲
数据导入导出、数据整理与变换
1. 使用Pandas库导入/导出数据
2. 使用Pandas筛选、整理数据,分组汇总
3. 数据变换,重编码
第三讲
可视化与描述性统计
1. 饼图、柱形图、折线图、箱线图
2. 列联表与马赛克图
3. 文本的词云图
第四讲
Python爬虫技术初步
1. 网页结构分析
2. 网络协议
3. requests库介绍
4. Beautiful Soup库的介绍
5. 使用requests和Beautiful Soup写爬虫
6. 定时自动执行爬虫程序
第二天
案例九
获取电商网站的商品评论文本
案例十
获取微博上用户对指定关键词的评论文本
第五讲
Python爬虫技术进阶
1. Ajax异步加载页面的数据提取
2. XPath介绍
3. 正则表达式介绍
4. 使用requests结合selenium、phantomjs获取动态数据
6. 模拟浏览器登录网站、绕开验证码


为什么要学爬虫技术,学了以后有什么好处?

不论您是想要做市场调查、趋势分析、还是想要做科研,都需要从自己机构外部找数据,但是网站有千百种,从单纯的下载文件,到整理成干净的数据表,数据藏在哪里,要拿甚么钥匙去敲门,都是透过每个精心设计的范例去学习的。拿到数据之后,不同的数据类型有不同的处理方式,最后怎么有能力说出一个故事,都是这堂课的学习主轴。


网上有很多爬虫课程,为什么要选雪晴数据网?

市场上真的有各种爬虫课程,各有各的特色及优点,有的还是免费的,这里我们不比较各自的不同,就说说我们有什么优点吧:

  • 优秀的讲师团队:我们的讲师不但有多年的工作经验,也有丰富的教学经验,不但技术过硬,也善于用通俗的语言讲解复杂的知识点,更有耐心为学员解答学习过程中的问题。每次课程我们都会反复研究,花大量时间准备课程材料,力求用最适合的案例和方式为学员讲解。

陈堰平老师在2017年微软技术暨生态大会发表演讲


陈堰平老师出席2017年微软最有价值专家秋季峰会并做分享


陈堰平老师出席全国高校大数据系列课程高级研修班并演讲


  • 案例教学的方法:我们从2013年开始举办公开的技术培训,也曾多次给企业做内部培训,从多年的教学实践中,我们发现,用传统以知识点讲解为主线,案例为辅的方式,效果并不好。学员反映,听了后面忘前面,学了一堆东西却不知道怎么用。经过多次尝试,我们摒弃了这种教学方式,采用以案例为主线,在案例中讲解知识点的方法,在一个案例中串联多个知识点,利用遗忘曲线的原理,我们用多个案例重现数据分析的流程,学员自然会举一反三了。

  • 选取有实用价值的案例:iris数据集、titanic数据、NBA比赛数据跟我们的工作和科研有什么关系?基本没关系,那我们在讲课的时候就不会用这种数据。而且我们教的是如何使用数据分析技术,并不是教你怎么写代码,我们不培养码农的。所以我们选择的案例,都是有现实的商业意义,或者科研价值。在讲解过程中,不但告诉你代码怎么写,还会教你怎么解决问题,为什么要这么做。

  • 贴心的助教制度:我们每次开课都会有助教,因为是手把手的课程,助教的存在,就是为了能解答您的问题,确保您有学会,满载回家。而且我们的助教都有实战经验,有的来自业界,有的来自前几批的优秀学员,我们也欢迎您以后加入我们的助教或讲师团队。

  • 对课程品质的坚持:我们在不同场合讲解过课程的内容,不断调整打磨课程,即使是相近的主题,我们也会对课程内容和案例进行升级,挑选出最适合市场趋势的案例和技术来讲解。比如这次Python爬虫课程,较6月份的那次课程,我们升级了大量案例


没有学过Python,也可以来上课吗?

当然可以。我们的课程专门面向非计算机专业的学员,其实每次都有对编程一无所知的小白来参加我们的课程,他们甚至对电脑的很多知识都不甚了解,经过两三天的课程,不但跟下来了,还很有收获。对python有一点认识的朋友相信一定可以得心应手,针对完全没有碰过python的新手,报名之后我们会推荐您Python的基础在线课程进行课前的练习,也可以提前一天报到,参加我们的课前辅导。

截图已征得学员的允许,为保护学员隐私,头像和昵称都做了处理


参会费用

在职人员2300元,学生1800元(可开具正规发票),此价格含会议注册费、资料费、午餐费、场地费。食宿费用自理。

参与雪晴数据网奖学金计划,更可以减免大笔学费,只要你足够勤奋,可以免费学!!


奖学金计划

  1. 为雪晴数据网(www.xueqing.tv)投稿的用户(原创或翻译文章),可以获得代金券(按文章质量,奖励50到200元不等),以抵扣线上线下课程学费,投稿请联系管理员 contact@xueqing.tv

  2. 注册并登录雪晴数据网,进入用户中心,然后进入邀请页面(http://www.xueqing.tv/me/invite ),获得邀请链接后,转发给好友,如果对方成功注册,双方都可获得奖励,可抵扣学费。

  3. 累计五天(可不连续)转发本课程通知到自己朋友圈,并附上推荐理由,截图发给我们的工作人员,报名可优惠200元。


优惠政策

  1. 雪晴数据网、友万科技的老学员8折优惠

  2. 参与北理工大数据创新学习中心活动9折优惠

  3. 三人以上同时报名9折优惠

  4. 五人以上同时报名8折优惠


证书

与会者可申请工信部《数据挖掘与分析应用高级工程师》职业技术水平证书,通过考核后即可获得证书,需另交考试费、证书工本费共400元。


报名方式

请前往 http://t.cn/RmyEZvz 填写报名表(点击文本左下角阅读原文进入表单),我们的工作人员随后会联系您。确认报名后,请通过以下三种支付方式中的一种来缴费(请保留支付凭证,拍照或截图发给我们的工作人员 ):

方式一: 对公转账

开户名       绘辰科技(北京)有限公司              

开户银行   中国工商银行股份公司北京大钟寺东路支行       

账号        0200151609100034763 

方式二: 支付宝

账号     pay@xueqingtv.com

户名    绘辰科技(北京)有限公司

方式三: 现场缴费

外地学员请于5月4号提前报到,北京学员可于5号早上8点~8点半报到,缴费并领取发票和纸质邀请函,以及上课教材。

由于5号早上现场人比较多,鼓励北京学员也于4号报到。


往期研讨会

  • 2017年12月Python网络爬虫实战案例研讨会

  • Python+R培训同期完美收官,一起见证1+1>2

  • 第一届Python爬虫与机器学习实战研讨会

  • 2017年年第一期R语言研讨会


常见问题

问:是否能开正规发票?

答:我们是正规公司,可以开具增值税普通发票和增值税专用发票,用户根据需要来选择发票类型。


问:我是高校老师,是否可以到现场刷公务卡?

答:可以,我们有POS机,可以打印小票。


问:我是小白,完全不会编程,可以报名参加吗?

答:你可以先看看我们网站的视频课程入个门,再决定是否报名。


问:是否提供纸质版会议邀请函?

答:提供,请与我们的工作人员联系。


联系方式

联系人:张老师

电话/微信:186-0082-0966

Email:contact@xueqingtv.com



报名请先填写报名表单