北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH

北京大数据研究院全国大学生人工智能AI实训招生简章——人工智能AI实习实训班

一、招生单位

北京大数据研究院在北京市委市政府的指导和中关村管委会、海淀区政府、北京大学、北京工业大学四方共同支持下,于2015年在北京大学成立。本单位是一家旨在建成国际一流的大数据教育、大数据共性关键技术研发创新和支持未来技术创业的大数据研究机构。

二、办班目的

通过贴近于现实工作场景的实训,提升受训学生在项目实践中独立解决问题的能力,促进学生将所学知识系统化和技能化,最终提升学生的求职竞争力。

、招生人数及招收学生应具有的素质
  • 具有较好的数理基础和逻辑思维

  • 有志于从事于Python开发的人员

  • 学费:3000/

、师资

外请目前具有丰富一线实际开发经验的研究人员,以其曾经主持过的现实项目为教学内容。

五、教学内容
课程名称技术关键点
科学计算库1、人工智能概述、机器学习定义、机器学习工作流程;机器学习算法分类、算法模型评估、Azure机器学习平台实验、机器学习基础环境安装与使用Matplotlib库使用:Matplotlib架构介绍、Matplotlib基本功能实现、Matplotlib实现多图显示、Matplotlib绘制各类图形
2、Numpy库使用:Numpy运算优势、数组的属性、数组的形状、Numpy实现数组基本操作、Numpy实现数组运算
3、Scipy使用:常数和特殊函数、拟合与优化、线性代数(含方程组求解)、数值积分和插值
4、pandas库使用:pandas基本数据操作、DataFrame、Series、MultiIndex、panel、pandas画图、文件读取和存储、缺失值处理、数据离散化、数据合并、交叉表和透视表、分组和聚合
机器学习(算法篇)1、sklearn介绍、sklearn获取数据集、seaborn介绍、数据可视化、数据集划分特征工程与模型优化:特征工程、特征预处理、归一化、标准化、特征选择、特征降维;交叉验证、网格搜索模型保存和加载、欠拟合、过拟合
2、KNN算法api及kd树及稀疏存储;欧式距离、曼哈顿距离、切比雪夫距离、闵氏距离、标准化欧式距离、余弦距离、汉明距离、杰卡德距离、马氏距离、KNN中k值的选择、kd树;
案例:鸢尾花种类预测
3、线性回归概念和api与原理剖析;损失函数:误差平方和,交叉熵;梯度下降算法:FGD、SGD、mini-batch、SAG;模型优化:数据归一化、优化器的选择;正则化线性模型:Lasso回归、岭回归、Elastic Net;线性回归算法
案例:波士顿房价预测
4、逻辑回归概念api和原理:判定边界、动态规划、sigmoid、对数似然损失;二分类问题:ROC曲线、AUC指标、ROC曲线的绘制;
案例:癌症分类预测
5、决策树算法原理和api使用:基本流程/划分选择、信息增益/增益率/基尼指数;决策树的构建和剪枝:剪枝处理/预剪枝/后剪枝/ID3/CART;条件熵和交叉熵:连续与缺失值处理、多变量决策树、熵的计算;
案例:泰坦尼克号乘客生存预测优化
6、集成学习与bagging:随机森林概述、训练算法AdaBoost算法和使用:训练误差分析、广义加法模型各种AdaBoost算法:离散型AdaBoost、实数型AdaBoost、LogitBoost、Gentle型AdaBoost;实现:弱分类器的选择、样本权重削减
案例实践:手写数字图片识别
神经网络神经网络基础:神经网络;感知机、与、或、异或问题;softmax
反向传播原理:批量学习和在线学习、反向传播算法、改善反向传播算法性能的试探法
案例:手写数字图片识别
图像与视觉处理介绍计算机视觉定义、计算机视觉发展历史;计算机视觉技术和应用场景、计算机视觉知识树和几大任务
目标分类和经典CV网络1、CNN:感受野、卷积、零填充、过滤器大小、多通道卷积、全连接层
2、卷积网络结构:LeNet5、AlexNet、VGG、Inception、GoogleNet、残差网络
3、深度学习正则化与算法优化:L1、L2、DroupOut、BN、SGD、RMSProp、Adagrad、Adam
4、TF分布式训练:TF Strategy;迁移学习:TensorFlow HUB
5、目标分类实战案例:ImageNet分类,目标检测任务与数据集介绍:检测任务目的、常见数据集、应用场景
6、RCNN:交并比、map、非极大抑制NMS、正负样本;SPPNet:SPP层映射
7、FastRCNN:ROI Pooling;FasterRCNN:RPN、代价函数、训练流程与结果分析、FPN与FasterRCNN结合
8、YOLOv1、YOLOv2、YOLOv3:结构与工作流程、代价函数、anchor、维度聚类、细粒度与多尺度特征、先验框与代价函数
9、SSD:Detector & classififier、SSD代价函数、特征金字塔
10、目标检测实战案例:COCO数据集上目标检测
目标分割和经典CV网络1、目标分割任务类型、数据集
2、全卷积FCN网络:网络结构、跳级连接、语义分割评价标准、结果分析
3、U-Net:拼接特征向量;Dilated Convolutions:聚合多尺度的信息、context module
4、PSPNet:金字塔池化模块;Deeplab:串行部署ASPP
5、Mask-RCNN:结构介绍、ROI Align与Pooling对比、代价函数介绍、端到端联合训练
6、目标分割实战案例
OpenCV库与 图像处理基础1、基本的OpenCV代码、IplImage数据结构、读写图像基本的灰度变换函数:灰度直方图、灰度的线性变换、灰度对数变换、伽玛变换、灰度阈值变换、分段线性变换
2、直方图处理:图像矩特征点度量特征、全局直方图、局部区域直方图、散点图和3D直方图、 OpenCV实践
3、几何变换:翻转、剪裁、遮挡、图像算数、图像金字塔、OpenCV几何变换操作
4、边缘检测技术:边缘检测的目的和模型、噪声、导数算子、Marr-Hildreth边缘检测器、基于模板的边缘检测、Canny Edge边缘检测器、Shen-Castan(ISEF)边缘检测器、彩色边缘、OpenCV边缘检测操作
5、特征检测和描述:哈里斯角点检测、Shi-Tomasi角落探测器、SIFT、SURF、FAST、ORB、霍夫变换
6、视频操作:读取摄像头、读取视频、视频写入
CV综合案例实训施工工地现场安全帽佩戴规范视频识别系统
、教学形式
  • 理论讲解(在校内专任教师授课基础上加强模型应用场景的分析)+案例分析(应对现实问题时如何使用相关技术+课堂练习(结合程序语言,带领学生完成项目实现)

  • 小组课后作业+老师作业讲解(课后答疑)

  • 知识运用,进行开发实践

、教学目标
  • 掌握机器学习常见算法,学习训练模型的过程,了解图像识别学习和视频识别学习的过程。

  • 提升职业素养与就业能力,具备人工智能领域良好的学习能力、解决问题能力

  • 项目、案例贯穿,主要是让学生更好的理解技术的应用

  • 经过此次培训,预计学生能达到在企业核心岗位全职实习12个月左右的水平

、所用学时
  • 每天3时,共计75时,授课时间为晚上或者周末在线教学

  • 课后下达任务,由学生完成下达的任务

  • 任课教师在线督促学生在规定时间内完成任务

  • 在师生约定时间,老师在线解答学生问题

、学生所学内容未来适用岗位
  • Python运维工程师

  • Python开发工程师

  • 机器学习算法开发工程师

  • 深度学习算法工程师

  • 计算机视觉分析工程师

十、管理与考核方式

1. 严格对学生出勤的考勤。有专门人员负责学生的考勤。

2. 设立专门的班级管理人员,管理学生,掌握并跟踪学生日常的学习状态及进度。管理人员负责建立实训班群,每天在群里公布学生的考勤状况。管理人员负责收集学生的在课堂上及课下遇到的各种问题,并及时反馈给授课讲师(授课老师会在指定的时间,针对学生的问题统一进行解答)

3. 学生的成绩考核分为三部分:

1)项目成绩(本部分成绩占整体成绩的60%,由授课老师对学生实训的项目完成情况进行考核打分)。

2)平时的考勤(占比10%

3)平时成绩,平时完成老师留的作业的情况(占比30%


联系人:吴强老师

联系方式:13520977876   010-62766930

北京大数据研究院

2021414