1-深度学习与计算机视觉历史
待补完,之后会优先放在github
一、课程介绍
-
课程名称:EECS 498007-598005,专注于深度学习在计算机视觉领域的应用。
-
讲师:Justin Johnson,密歇根大学助理教授,该课程是他在该校首次开设。
-
课程目标:探索如何利用深度学习技术处理、感知和推理视觉数据。
-
课程将专注于计算机视觉、机器学习和深度学习的交叉领域。
-
除了学习这些领域的基本概念,还将讨论最新的研究成果和技术。
-
定义:计算机视觉是构建能够处理、感知并推理视觉数据的人工系统的研究领域。
-
应用范围:可以包括图像、视频、医学扫描等任何类型的连续值信号。
-
重要性:由于视觉数据无处不在,且数量庞大,因此开发能够自动处理这些数据的系统变得至关重要。
二、计算机视觉的重要性和发展
- 统计数据:例如Instagram每天上传约1亿张照片和视频,YouTube每天上传约300小时视频。
- 技术发展:随着视觉传感器数量的增加,以及自动驾驶车辆、增强现实/虚拟现实、无人机等新兴技术的出现,计算机视觉的作用愈发凸显。
三、人工智能领域的概况
- 学习:构建能够从数据和经验中学习的系统。
- 深度学习:机器学习的一个子集,使用具有多个层次的层次化学习算法,受哺乳动物大脑结构的启发。
- 人工智能:构建能够执行人们通常执行的任务的计算机系统。
- 子领域:包括计算机视觉、机器学习等,本课程将聚焦于这些子领域的交叉部分。
四、历史背景
早期探索
- Hubel和Wiesel的研究:1963年,通过在猫脑中插入电极,研究了视觉皮层的神经元如何响应不同的视觉刺激,特别是对边缘的响应,为后续计算机视觉算法的发展奠定了基础。
计算机视觉的诞生
- Larry Roberts的工作:被认为是计算机视觉领域的第一个博士研究工作,他的工作集中在图像的边缘检测和3D几何理解上。
早期的乐观与挑战
- MIT的夏季计算机视觉项目:Seymour Papert在1966年提出的项目,目标是在夏季通过几名本科生的工作构建视觉系统的大部分,但最终未能实现这一雄心勃勃的目标。