跳转至

学习计划

数据科学与大数据技术学习计划表【优化中】

时间:2023年3月26日

1.数学基础

高等数学

线性代数

概率论与数理统计

工具书:【人工智能数学基础

2.计算机基础

计算机基础与组成原理【快速扫盲:教程1教程2

计算机网络

Linux操作系统【包括shell语言】

参考书:鸟哥的linux私房菜

3.编程语言

(1)C语言程序设计

小甲鱼的教程[基于Linux]

郝斌C语言自学教程(180集全)哔哩哔哩_bilibili

(2)Java语言程序设计

程序员小姐姐: 分享Java学习经验和Java教程, 解密初学Java的常见误区 | 编程入门

毕向东Java教程:B站百度网盘

(3)Python语言程序设计

【大数据分析和开发方向必须精通】

视频教程

前端开发

(4)R语言语言程序设计

【大数据分析和可视化方向掌握】

基础语法

相关在线电子书籍【英文版】:Bookdown:https://bookdown.org

R语言视频教程

4.专业基础课程

数据库原理与技术

机器学习

深度学习

神经网络

数据结构与算法

数据仓库与数据挖掘

大数据处理技术

大数据可视化


相关视频教程:

MySQL编码问题MySQL安装MySQL高级教程


5.大数据开发方向

具备一定的Python/Java基础

能力目标:

(1) 掌握大数据平台hadoop生态圈的常用工具与主流框架的使用方法;

(2) 掌握实际大数据项目的开发流程;

(3) 掌握实际项目中常用的基本技巧和常用算法;

核心技术点:

● Hadoop、Yarn、MapReduce、Zookeeper、Hive、数据仓库

● Flume、Kafka

● Spark、Flink、Redis

6.额外技能

git和github:项目管理

VSCode :万能的开发工具

Typora :开发者都知道的写作利器

VirtualBox :虚拟机软件

IntelliJ 系列:开发利器

DBeaver :通用的数据库客户端管理工具

XShell : Shell 工具

draw.io : UML 工具利器

Mitproxy :代理抓包工具

Postman : HTTP 请求测试工具

Jmeter :性能测试工具

Sonar :代码质量检测工具

Docker :虚拟技术

mRemoteNG :远程桌面链接工具

Sublime Text :轻量级文本工具

Xmind :脑图工具

PotPlayer :万能的视频播放工具

语雀:笔记工具

PowerDesigner :数据库设计工具

PLSQL : oralce 客户端工具

Axure :原型设计工具

Visual Studio :微软体系开发工具

finalshell :免费版 Typora

7.云计算

8.应用到特定领域【以生物医药方向为例】,

具备一定的Python、R基础。

(1)领域专业基础知识【了解为主】

基础生物学【细胞、基因、蛋白】

基础医学【比如免疫学】

各种生物组学技术的原理【基因组、蛋白组等】

生物信息学

(2)分析

Python中的Biopython,R中的Bioconductor

生物信息学算法

生物大数据分析

(3)开发

数据库、分析软件,R包、Python模块

9.在线电子图书

liveBook · Manning

Machine Learning with R, the tidyverse, and mlr