技术文章及通讯

为学生工程师配备数据科学技能

沃里克大学托马斯·波汉著


数据科学正在成为工程师非常需要的技能。目前,大多数工程学位在最后一年提供数据科学主题作为选择,通常是一个狭窄的研究领域。2018年,我们将数据科学作为华威大学所有本科工程流(包括土木、机械、电子和系统)的核心主题。根据我们的工业经验,我们知道数据分析几乎影响着工程开发和运营的每个领域。

数据科学和机器学习将很快成为所有工程师的基本技能,无论他们是应用机器学习算法,为这些算法提供数据,还是根据结果做出决策。这就是为什么我们在华威工程学位中将数据科学作为一个主线,从第一年引入编程和简单的统计模型开始,第二年转移到核心数据分析模块,然后在第三年和第四年提供更多特定于流的模块。

第一年:系统建模、仿真和计算

所有工程专业的一年级学生都参加ES197:系统建模,仿真和计算.在本模块中,学生将学习如何使用物理和(简单)数据驱动的方法来建模工程系统。这个模块也可以作为编程的介绍。

熟悉编程和MATLAB®,学生在网上完成课程MATLAB基础课程。从教育工作者的角度来看,这种方法非常有效,因为它允许学生通过完成各种编程练习并获得即时反馈来按照自己的节奏学习。

在将MATLAB技能应用于曲线拟合和从数据中推导简单模型和关系的作业后,学生将使用电气、热学和平移系统的示例来解决建模和仿真问题。不像计算机科学专业的学生,他们认为编程是一种必要的技能,许多工程专业的学生一开始可能不会意识到它的相关性。通过在建模和仿真的背景下介绍编程,我们的目标是向学生展示编程是一种在他们的职业生涯中都很有用的技能。

在以后的作业中,学生将噪声或其他随机效应纳入模型。例如,我们让他们在MATLAB中创建一个简单的模型,在这个模型中,粒子在随机力的作用下冲向空中,然后又掉下来。模拟产生了一个有趣的3D可视化(图1)。整个项目让学生对他们以编程方式创建自己的模型的能力充满信心。

图1。粒子响应随机力的MATLAB三维可视化。

图1。粒子响应随机力的MATLAB三维可视化。

二年级:工程数学和数据分析

第二年的模块ES2C7工程数学与数据分析专注于解决回归、分类和聚类问题。当我在工业界工作时,我发现一旦数据干净且格式合适,解决数据科学问题就相对简单了,但现实世界的数据很少是这样。考虑到这一点,我教学生如何识别和删除异常值,处理缺失值,并在表中组织数据。

MATLAB Live脚本在课堂上特别有用,因为我可以包括格式化的文本和图像来提醒我想要涵盖的内容,并且因为代码的输出与生成它的代码一起出现。与此同时,统计和机器学习工具箱™中的分类学习器和回归学习器应用程序使得教授回归和分类的广泛原理成为可能,而无需深入研究实现细节(图2)。

图2。分类学习者app

图2。分类学习者应用程序。

一旦学生们了解了应用程序的功能以及如何使用它们,我就会向全班展示MATLAB中的底层算法是如何工作的。

在完成关于回归、分类和聚类的实验作业后,学生们要进行一个小组项目,在这个项目中,我要求他们想象自己在一家工程咨询公司工作,负责评估制造的钢构件的质量。学生们必须使用两个数据集来预测哪些组件最有可能失败,一个是相当干净的,另一个是混乱而复杂的。

处理各种文件格式(包括Excel)中的噪声数据®, CSV和纯文本,学生删除异常值,执行连接,并准备用于训练模型的数据。大多数小组使用回归学习者应用程序或在MATLAB脚本中实现线性回归;有些人尝试两种方法。为了完成项目并展示他们在整个模块中开发的技能,每个小组都创建了一个视频,展示他们的发现和他们使用的方法。

三年级及以上

对于有兴趣进一步探索数据科学和机器学习的学生,华威提供了智能系统设计的三年级模块,涵盖计算机视觉和更先进的机器学习技术。在这个模块中,我向学生介绍了在许多自主控制系统应用中使用的感觉-感知-行为框架。Simulink中的四轴飞行器模型万博1manbetx®(图3)非常有助于展示这个基本框架,同时向学生介绍本模块稍后将涉及的主题,如卡尔曼滤波和光流。

图3。Simulink四轴飞行器模型的三维可视万博1manbetx化

图3。Simulink四轴飞行器模型的三维可视万博1manbetx化。

之后,学生们用MATLAB开发了一个结合了计算机视觉和机器学习的手势识别应用程序。在这个项目中,学生们开发了一个模型,能够解释网络摄像头中他们自己手的图像,并将它们分类为几种预先确定的手势之一。这个项目对学生来说特别吸引人,因为他们使用自己的数据,需要考虑诸如照明和需要多少不同的图像来训练一个准确的分类器等因素。

在学习早期学习如何将数据科学技术应用于现实世界问题的学生,不仅为随后几年的高级课程做好了充分的准备,而且还为实践工程师的职业生涯做好了充分的准备。我们已经从我们的学生那里得到了非常积极的反馈,他们发现他们能够在本科实习期间应用这些技巧,并在面试中谈论这些技巧。

随着设备连接使公司能够根据数据而不是直觉或以往的经验来进行设计决策,具有数据分析背景的工程师非常受欢迎。虽然很少有毕业生进入工作岗位后能够向高级工程师展示新工具,但我们有信心,他们将能够在任何情况下应用机器学习和数据分析。

作者简介

Thomas Popham是华威大学的副教授。他拥有华威大学(University of Warwick)计算机视觉博士学位,曾是捷豹路虎(Jaguar Land Rover)的机器学习技术专家。

2020年出版的

查看相关功能的文章