机器学习工程师需要预先掌握中级编程知识(如学过其他编程语言或者熟悉 Python 的基本语法)、中级统计学知识(如了解标准分布和概率等)、中级微积分(如求导)和线性代数(如向量和线性变换)知识。如果没有以上这些基础,建议先学习人工智能基础。
人工智能高级人才——机器学习工程师将能够掌握机器学习领域的监督学习、非监督学习、强化学习和深度学习的内容,能够将预测模型应用于金融、医疗、教育等领域的大数据处理,成为高薪、抢手的机器学习工程师。
一站式学习,系统掌握监督学习、非监督学习、深度学习、强化学习等热门技术,挑战实战应用。
学习机器学习的基础知识,并初步了解一些机器学习可以完成的任务,如分类与回归问题,包括机器学习涉及到的统计分析知识以及模型评估和验证知识。
预测商品价格
在这个实习项目中,将把机器学习应用到商品价格数据上,以预测商品的销售价格。首先,将分析数据以获取其重要特征和统计信息;其次,需要将数据拆分为训练和测试集,并确定评估指标;然后,将尝试不同的参数和训练集大小分析算法的性能;最终挑选出泛化力最佳的模型。
第二部分 监督学习
监督学习是通过已标注过的训练数据来完成分类或回归任务的一类机器学习方法。在这一部分中,将学习决策树、神经网络、支持向量机等监督学习算法。
为用户推荐感兴趣的产品
在这个实习项目中,将把监督学习算法应用到用户数据和产品数据中,来帮助电商平台为用户推荐感兴趣的产品,寻找潜在买家。首先,了解用户数据和产品数据;其次,将使用数据预处理技巧把数据转化为适当的形式,并将算法应用在数据集上,找出最适合的模型;最后,优化模型,把结果展示给用户。
第三部分 非监督学习
当数据样本没有标签的情况下,非监督学习是其解决问题的最佳方案。在这一部分中,将学习聚类,特征工程和降维等非监督学习算法。
创建客户细分
在这个实习项目中,将应用非监督学习来探索一家经销商的产品销售数据,找出客户群体。首先,分析产品之间的关联度,并处理异常值;其次,对完整的客户开支进行 PCA 降维,并对数据集使用聚类算法;最后,通过比较结果,展示这些信息给客户以帮助经销商找出客户群体及改善服务。
第四部分 深度学习
深度学习是当今世界上非常火热的一类机器学习方法,在许多领域比如国际象棋、围棋中甚至超过了人类的能力。在这一部分中,将学会使用 Tensorflow,并学习卷积神经网络等知识。
产品品种分类
在这个实习项目中,将设计并训练一个卷积神经网络(CNN)来分析产品的图像,并据此区分他们的品种类别,并使用迁移学习和其他架构来优化这一模型。
第五部分 强化学习
强化学习也是一类重要的机器学习方法,它是一个序列决策问题。在这一部分中,将学习马尔考夫决策过程、蒙特卡洛、时间差分方法等强化学习知识。
训练机器人走迷宫
在这个实习项目中,将使用强化学习中的 Q-Learning 算法,实现一个自动走迷宫机器人。在迷宫中,通过使用 Q-Learning 算法,机器人需要能成功学习策略来避开陷阱、尽快到达终点。
人才培养实战项目
从下列项目中选择一个感兴趣的内容,将所学的机器学习知识用于实战,并学习撰写报告。
A. 计算机视觉方向:猫狗图像识别
B. 自然语言处理:句子相似度匹配
C. 数据挖掘:预测未来的销售额