学生休息室

分享学生如何在日常项目中使用MATLAB和Simulink的技术和现实例子#studentsuccess万博1manbetx

Matlab,机器学习和电影..​​....完美的组合

他们说不要根据封面来评判一本书,但是没有人说任何关于电影的事情,对吗?在今天的帖子中,我很高兴在Tamu Datathon 2020.。Tamu Datavaton是世界上第一个也是唯一的大联盟黑客(MLH)数据科学Hackathon,旨在通过顶级公司连接顶级数据科学/机器学习人才。我们的客人博主当天 -维什纳维杜拉萨米酒店adhithiyaraj sankaranarayanan萨拉斯·坦加马尼上师Priyanka Karuppuch Samy将向我们的客座博主介绍他们基于海报的电影推荐黑客…

灵感

TAMU Datathon 2020是我们的第一个hackathon,由于问题陈述是通用的,我们对如何开始感到困惑!在思考了一段时间后,当被要求提出一个问题陈述时,所有帮助我们的就是前一天的电影之夜。我们发现很难选择一部电影,希望有一种方法可以根据我们的个人兴趣和Eureka获得电影推荐!事实上,我们对电影的认知受到海报的显著影响,这给了我们一个火花!我们刚刚找到了我们的hackathon创意!这启发我们设计和开发一个应用程序,根据我们输入的海报推荐一部类似的电影。考虑到这些事实,基于海报的建议似乎是一个公平的想法。不是吗??

解决问题

为了根据输入海报图像识别类似的电影,我们必须选择一种机器学习算法,该算法可以捕获输入海报的重要图像特征,检索具有类似特征的海报,并在处理图像输入时实现降维。因此,主成分分析(PCA)、t分布随机邻域嵌入(t-SNE)、一致流形逼近和投影(UMAP)以及自动编码器成为我们的潜在候选。我们决定为我们的实现选择自动编码器,因为自动编码器可以更好地捕获非线性特征,并且以其在有损图像压缩任务中的性能而闻名。自动编码器是尝试复制输入的网络。网络的设计使得输入层和输出层具有相同的大小。网络在中间层之前变小,然后朝输出方向再次变大。通过这种方式,它试图仅捕获在中间层重新创建输入所需的重要特征,从而提供了一种实现降维的方法。

我们是如何实施的?

编码器由多个2D卷积层组成,以捕获输入图像的空间特征,然后将最后一个卷积的输出滤波器映射变平并给予多个密集层以生成输入图像的编码向量。以这种方式,训练数据集中的所有图像都被映射到10D潜空间。解码器在培训过程中使用,以减少自动频率的重建损失。

在推荐期间,用户给出了输入图像(电影的海报),该算法基于在10D潜在空间中映射的欧几里德距离和作为推荐电影的输出的输出来检索最接近的图像。

后果

我们在Hackathon尽头的目标是制定了一个简单的验证申请。由于我们正在使用Matlab为我们的机器学习模式,我们决定使用同样的发展我们的GUI。正如我们所有人对该工具都非常新的,我们在有限的时间内提出了一个非常简单的用户界面,在其中我们必须在一个窗口上上传我们的输入海报映像,其中包含推荐给另一个窗口。

推荐的电影类似于用户输入。两者属于同一类型-恐怖!从上面的示例可以明显看出,该算法检索具有类似功能的海报。

与前面的例子一样,上面的例子还建议了类似的电影。这两部电影都是喜剧戏剧类型的。

为什么我们选择matlab?

这是我们的第一次Datathon,我们的重点是按时交付成果。在MATLAB中建立机器学习算法的原型是无需麻烦的,即使不使用gpu,所涉及的计算时间也很低。MATLAB的深度学习工具箱帮助我们快速解决问题,而不必担心编码语言的复杂性,使我们能够专注于解决问题,而不是在意大利面条式的代码中循环。由于我们的代码涉及到自动编码器的使用,处理尺寸和超参数是非常关键的,MATLAB提供了清晰、清晰的文档,帮助我们在非常有限的时间内高效地构建算法。最后,在MATLAB中开发应用程序是一个“点击”过程。因此,考虑到这些事实,我们一致选择MATLAB作为我们的工具来构建推荐系统。

未来的范围

尽管这些建议被证明是好的,但对这项工作的推断范围还是很大的。到目前为止,系统根据我们输入的海报推荐一部电影。可以增加推荐电影的数量,为用户提供一个选项池。到目前为止,我们认为海报的像素值是机器学习算法的唯一功能,这可以与其他功能相结合,如评论(NLP技术)、评级、流派、长度、语言,以提供更好的建议。除了提高模型性能之外,还有一个主要因素是获得一种具体的性能测量方法,因为“喜欢电影”不是一个可测量的数量,创新的性能指标可能是有利的。最后,全球不同人群的标记数据可以提供更好的推荐系统

关键的外卖

在周末没有更浪费的时间决定看看什么电影。我们有一个“去”申请,为此目的,最好的部分是这个想法在Tamu Datathon 2020中获取了第一奖,以便最具创造性的Matlab使用。这是一天完成项目的伟大体验。我们彻底享受了制作该机器学习申请的过程。我们的代码可在github上获得,随意尝试,让我们了解你的想法!

|

评论

要发表评论,请点击在这里登录您的MathWorks帐户或创建新的。