免费预约试听
限时领取试听名额
课程简介
关于举办“Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术”培训的通知
各有关单位:
中国科学院计算技术研究所是国家专门的计算技术研究机构,同时也是中国信息化建设的重要支撑单位,中科院计算所培训中心是致力于高端IT类人才培养及企业内训的专业培训机构。中心凭借科学院的强大师资力量,在总结多年大型软件开发和组织经验的基础上,自主研发出一整套课程体系,其目的是希望能够切实帮助中国软件企业培养高级软件技术人才,提升整体研发能力,迄今为止已先后为国家培养了数万名计算机专业人员,并先后为数千家大型国内外企业进行过专门的定制培训服务。
随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,已经成为一个非常重要且紧迫的需求。
R是一个用于统计计算和统计制图的优秀工具,也是GNU的一个自由、免费、源代码开放的软件。R包括一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统,数组运算工具(其向量、矩阵运算方面功能尤其强大),完整连贯的统计分析工具,优秀的统计制图功能。
Python是一个数据分析和图形显示的程序设计环境,用于统计分析、绘图的语言和操作环境。Python有简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
本培训将对基于Python和R语言进行数据处理、数据探索的基本方法,利用R语言实现模型选择、Logistic回归及决策树算法,以及贝叶斯算法及支持向量机、神经网络等算法原理及实现进行讲解。具体事宜通知如下:
一、培训对象
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。
1,对IT系统设计有一定的理论与实践经验。
2,对数据挖掘和数据处理方法有一定的基础知识。
3,对Hadoop/Spark等大数据技术有一定的了解。
三、师资
由业界知名大数据专家亲自授课:
杨老师 主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
四、培训内容
第一讲 数据挖掘,Python和R简介
1.1数据挖掘
1.*****on语言
1.3 R语言
1.4 Iris数据集
1.5 Bodyfat数据集
第二讲 数据的导入与导出
2.1 R数据的保存与加载
2.2 CSV文件的导入与导出
2.3 通过ODBC从数据库中读取数据
2.4 从Excel中导入与导出数据
2.5 Python的数据操作
第三讲 数据可视化展现
3.1 查看数据
3.2 单个变量展现
3.3 多个变量展现
3.4 更多探索
3.5 将图表保存到文件中
第四讲 决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
4.4 Python中的决策树实现
4.5 Python决策树实例
第五讲 回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
5.5 Python中的回归实现
5.6 Python回归实例
第六讲 聚类分析
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类
6.5 Python中的聚类实现
6.6 Python聚类实例
第七讲 离群点检测
7.1 单变量的离群点检测
7.2 局部离群点因子检测
7.3 用聚类方法进行离群点检测
7.4 时间序列数据的离群点检测
7.5 Python中的孤立点实例
第八讲 时间序列分析
8.1 R中的时间序列数据
8.2 时间序列分解
8.3 时间序列预测
8.4 时间序列聚类
8.5 时间序列分类
8.6 Python中的时间序列实例
第九讲 关联规则
9.1 关联规则的基本概念
9.2 Titanic数据集
9.3 关联规则挖掘
9.4 消除冗余
9.5 解释规则
9.6 关联规则的可视化
9.7 Python中的关联规则实例
第十讲 社交网络分析
10.1 词项网络
10.2 推文网络
10.3 双模式网络
10.4 Python中的社交网络分析实例
五、培训目标
1, 全面了解Python和R语言数据挖掘的相关知识。
2,学习Python和R的数据挖掘核心技术方法以及应用特征。
3,深入使用Python和R在数据挖掘和分析中的使用。
六、时间、地点
时间: 2018年4月10日-4月12日 地点:北京
2018年5月16日-5月18日 地点:上海
七、证书
培训结束,颁发中科院计算所职业培训中心“Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术”结业证书。
八、费用
培训费:5800元/人(含教材、证书、午餐、学习用具)。住宿协助安排,费用自理。
评分
40课程数
43校区数
1
机构简介:中科院计算所培训学校(北京市海淀区中科院计算所职业技能培训学校)成立于1987年,是计算所根据国家普及计算机知识,培养专业计算机人才而创建的。培训中心依托中国科学院强大的技术背景,历经二十年的发展,为全国各企事业单位、部队、院校等累计培养了近十七万人次的计算机专业人才,并为多家企业提供了高质量的咨询服务,现已形成企业内训、高端公开课、GJB5000A/CMMI培训与咨询、企业全方位咨询服务四大业务模块,在业界具有良好信誉。“科学、高效、权威、品质”是北京市海淀区中科院计算所职业技能培训学校的经营宗旨,面向企业人是其明确的市场定位。中科院计算所针对企业的信息化建设具有悠久的历史,其IT技术培训是一个长期积累、与时俱进的过程。1987年,我国的信息化建设十分滞后,计算机相关设备仅见于政府、部队和部分大型国内企业,专业技术急待普及,中科院计算所适时创建了培训中心,从计算机的基本概念、原理和维护到Windows、unix、linux应用到Oracle、DB2、数据仓库、J2EE、.net,再到现在高端企业级需求分析、架构设计、系统设计及咨询、云计算、海量数据,始终与国际较前沿的IT技术接轨。25年,培训中心的服务广泛应用于全国各地电信、通信、电力、石化、金融、教育、部队、交通、医药、服务等各行各业,为我国的信息化建设做出了卓越的贡献,成为中国IT精英权威培训咨询机构。北京市海淀区中科院计算所职业技能培训学校拥有一批具有多年丰富实际开发与教学经验兼备的优秀专职教师队伍、咨询专家,有一支活跃于软件行业的研发团队。中心凭借强大的师资力量,把握当今世界较前沿的开发技术,在总结多年大型软件开发和组织经验的基础上,自主研发出百门课程体系,满足企业各层次的培训需求,其目的是希望通过有经验高水平教师的讲授来真正解决企业信息化建设中的问题,切实帮助中国软件企业培养高级软件技术人才,提升企业的整体研发能力。授课教师从思想、方法和技术三个层面系统讨论企业信息化建设及大型软件设计理论和方法,并且通过一些精心选择的案例,揉合教师的大型项目经验,以项目过程中的问题带动原理的描述,理论和实际相结合,重点讲清问题,从而使学员在企业信息化建设项目中发挥更大的作用。面对千变万化的IT技术,北京市海淀区中科院计算所职业技能培训学校不仅传授给学员当今IT潮流较核心的前沿技术和解决问题的方法,同时也为学员提供后续技术支持,更指导学员如何把握技术动态的方法和考虑问题、潜心学习的思维方式,旨在为国内外各企事业单位培养实用型、潜力型IT高端管理、创新人才,实现“与企业共发展,同携手开创未来”的美好愿景。我们承诺:充分的资源共享、完善的管理模式和立足潮头的前沿技术,必将使您在更广的领域享受到更佳的培训服务!为了明天,我们一起努力
更多点击获取距我最近校区
-
海淀校区
中关村958楼
电话咨询