【#第一文档网# 导语】以下是®第一文档网的小编为您整理的《数据科学与大数据技术专业导论学习总结 (1)》,欢迎阅读!
数据科学与大数据技术专业导论学习总结
数据科学与大数据技术是当前炙手可热的概念理论,是科技公司飞速发展和数字科技日益壮大的关键所在,大量数据亟待分析,衍生出了很多前所未有的业务需求,业界以及公司都急需大量拥有对口专业或者有相关领域技能的人才,大数据时代已经不可避免,未来对大数据人才的需要也日益强烈。 当前,大数据相关技术已基本成熟,逐步成为支撑型的基础设施,其发展方向也开始向提升效率转变,向个性化的上层应用聚焦。随着5G通信标准的落地,物联网、移动互联网、大数据、传统行业将深度融合,算力、模块、云数、数智等技术融合的趋势愈发明显,大量既懂大数据技术又懂其他相关行业技术的人才在大数据应用领域发挥着越来越多的作用。
数据科学与大数据技术专业旨在培养适应经济社会发展需要,德、智、体、美全面发展的,具有创新精神和强实践能力,熟悉计算机软件相关理论知识,具备一定的软件需求分析和系统设计能力,掌握本专业必需的基础理论、专业知识、基本技能和专业技术应用能力,能适应物联网产业发展需要,从事物联网络系统集成、网络工程项目的维护、管理、服务第一线需要的高端技能型专门人才。本专业是计算机硬件与软件相结合、面向系统、侧重应用的宽口径专业。通过基础教学与专业训练,培养基础知识扎实、知识面宽、工程实践能力强,具有开拓创新意识,在计算机科学与技术领域从事科学研究、教育、开发和应用的高级人才。计算机学科的特色主要体现在:理论性强,实践性强,发展迅速按一级学科培养基础扎实的宽口径人才,体现在重视数学、逻辑、数据结构、算法、电子设计、计算机体系结构和系统软件等方面的理论基础和专业技术基础,前两年半注重自然科学基础课程和专业基础课程,拓宽面向。后一年半主要是专业课程的设置,增加可选性、多样性、灵活性和方向性,突出学科方向特色,体现最新技术发展动向
由于学生本身这方面的基础不扎实,知识结构在这方面比较薄弱,所以不能在技术方面进行深入的研究,只能对一些理论性的知识做一些了解和认识,建立起大概的知识框架。在学习过程中,老师所提及的知识中有一点印象最为深刻,关于大数据 Big Data,方面的提及引起了我很大的兴趣,越是自己私下里做了一些阅读和查询(主要是维克托迈尔-舍恩伯格的《大数据时代》和网络上看的一些资料)。最后提交的这篇课程总结就着重报告一下自己在阅读了他人关于大数据的一些理论后自身的认识。术、新趋势人们往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少同学能说出一三来。究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“无知”,因为现在人们普遍都有以一种信息焦虑感,别人知道的东西我不知道,就会感到焦虑,无论这些信息对你有没有用;二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然。当然我也一样,虽然我希望能有些不一样,但是自己实在欠缺这方面的知识,所以也只能查阅一些资料,翻阅了最新的专业书籍,在自己局限的认识下把这些些零散的资料碎片或不同理解论述综合起来做一个类似于文献综述的报告,其实我很真诚的希望进入事物探寻本质。经过这几周的学习,对计算机网络的基础知识和大致结构有了一个粗浅的认识。数据科学与大数据技术专业,旨在培养具有大数据思维、运用大数据思维及分析应用技术的高层次大数据人才。掌握计算机理论和大数据处理技术,从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地培养学生掌握大数据应用中的各种典型问题的解决办法,实际提升学生解决实际问题的能力,具有将领域知识与计算机技术和大数据技术融合、创新的能力,能够从事大数据研究和开发应用的高层次人才。
下面是大数据与数据科学的整体课程体系:
数学/统计理论:微积分、线性代数、概率论、数理统计、统计学习
计算科学:计算机系统、编程语言、数据结构、信息系统架构(CS/BS等) 数据系统:分布式理论、Hadoop/Spark生态、数据库/数据仓库
模型分析:机器学习理论、优化建模、模式识别、知识表示/推理、可视化分析 行业应用:商务智能、智能金融、供应链分析、城市规划等 数据伦理:大数据管理与创新、大数据治理与政策
大数据与数据科学的主要课程内容 1、概率论与数理统计
数理统计的基本概念、抽样分布、参数估计、假设检验 2、多元统计分析
多元正态分布;聚类分析;判别分析;主成分分析;因子分析;对应分析;Logistic回归模型、偏最小二乘回归模型等。 3、微积分
基本的微积分概念、计算原理 4、线性代数
基本的线性代数概念、计算原理 5、时间序列分析
时间序列的基本概念、基本原理、基本方法、定量分析 6、程序设计/数据结构
编程语言(Python或R、C或Java)、主要的程序结构、基本的数据结构、常用算法 7、计算机系统基础
计算机系统架构的基本概念、常规信息系统的基本架构、主要的数据传输方法、数据解析和信息抽取技术
8、大数据导论
Hadoop大数据的基本概念、大数据分析基础、大数据挖掘基础、大数据可视化技术基础、大数据存储技术基础、大数据安全技术基础、数据科学基础、大数据与crm等 9、Hadoop大数据技术
Hadoop生态,介绍Hadoop的安装和配置,Hadoop的组件包括HDFS分布式存储系统,
MapReduce计算框架,海量数据库HBase,Hive数据仓库,Pig、ZooKeeper管理系统等知识 10、分布式数据库原理及应用 介绍分布式数据库的原理和应用,以及当前大数据行业主要的非结构化的数据库,内容包括分布式数据库设计,分布式查询的分解与优化,事务管理,分布式并发控制,分布式数据库管理系统的可靠性,数据复制等分布式数据管理技术的经典内容 11、数据建模分析
介绍数据挖掘/建模的主要流程以及除算法外的其它建模重点,包括数据探索性分析、建模(具体的建模算法放到数据挖掘课程)、实验设计、评估方法等 12、数据仓库与数据挖掘技术
经典以及最新的数据建模分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、进化算法、分/聚类分析、非结构数据的挖掘、离群数据挖掘。(分两个重点方向:算法设计原理和算法应用 13、数据可视化技术
从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介
本文来源:https://www.dy1993.cn/xSCG.html