-
机器学习 Machine Learning - Neural Networks 神经网络
Neural Networks 神经网络 We will learn today…- What a (deep) neural network is- How do we train it?- … which requires a calculus refresher ☺- Why is everybody talking about it?- Various ways to accelerate gradient descent- Practical ti...…
-
工程力学-动力学/Technische Mechanik IV – Dynamik - Integration der Eulerschen Gleichungen 欧拉方程的积分
Integration der Eulerschen Gleichungen 欧拉方程的积分EULERSCHE Kreiselgleichungen 欧拉陀螺仪方程Eulersche Gleichungen beschreiben allgemeine Bewegung eines starren Körpers mit einem fixen Punkt.欧拉方程描述了具有固定点的刚体的一般运动。\[\begin{aligned}& \dot{\omega}_1 ...…
-
汽车视觉 Automotive Vision - Behavior Recognition 行为识别
Chapter 8: Behavior Recognition 行为识别今天我们讨论行为识别这一章节。这是这一章节的参考文献列表,我们主要涉及隐马尔可夫模型,因此主要参考文献是关于隐马尔可夫模型及其在各种应用中的使用方法的教材。您可以考虑阅读Witten和Frank关于人工智能的书籍,其中包含了关于隐马尔可夫模型的章节。还有一本德语书,主要介绍了隐马尔可夫模型在各种应用领域的基本算法。还有一篇由Rabiner撰写的关于隐马尔可夫模型及其在语音识别中的应用的教程。虽然我们在这里不涉及语音识别...…
-
汽车视觉 Automotive Vision - Road Recognition 道路识别
Chapter 7: Road Recognition 道路识别欢迎回到汽车视觉课程,今天我们将讨论第七章,即从相机图像识别道路。以下是与本章工作相关的参考文献列表。第一篇论文是关于基于视频识别车道标记和估计车道几何形状的较早的工作。第二篇论文也涉及相同的主题,来自同一时期。第三篇论文是Heidi Laws及其团队关于从视频序列识别车道的文章之一。我们今天要解决的任务是面对类似这样的图像:一张由自动驾驶汽车前方摄像头拍摄的相机图像。我们可以清楚地看到道路及其旁边的环境。当然,对于自动驾驶来...…
-
汽车视觉 Automotive Vision - SLAM 同时定位与地图构建
Chapter 6: Self-Localization and Mapping欢迎回到汽车视觉的第六章,我们将讨论以相机为基础的自我定位和映射的主题。自我定位和映射的主题是机器人技术和制图和地理信息学领域进行大量研究的领域。例如,在Tune Burger和Fox的《概率机器人》一书中,第七到十三章覆盖了这些主题。IEEE机器人与自动化杂志上的一篇分成几部分的同时定位和映射教程,由Duran、White和Bailey编写。你还可以在《机器人手册》中找到关于定位和映射的基础知识。另外,如果你...…
-
汽车视觉 Automotive Vision - Tracking Moving Objects 追踪移动物体
Chapter 5 Tracking Moving Objects 追踪移动物体欢迎来到《汽车视觉》课程中关于跟踪运动物体的第五章。在本章中,我们将讨论如何利用相机、激光雷达传感器或其他环境传感器来估计场景中物体的运动。与像素级方法不同,我们将把注意力转移到物体级别上。这意味着我们假设环境中的物体已经被检测出来,并且我们能够确定它们的三维位置。我们想要估计的运动是物体的三维运动,而不仅仅是二维的光流向量。在本章中,我们将探讨各种物体跟踪技术。以下是与本章相关的专业文献列表: Greg W...…
-
汽车视觉 Automotive Vision - Optical Flow and Image Based Tracking
Chapter 4: Optical Flow and Image Based Tracking 光流和基于图像的跟踪欢迎来到《汽车视觉》讲座中关于光流和基于图像的跟踪的章节。首先,让我们看一下文献。这里有几篇来自教科书和原创论文的章节,涉及到今天讨论的主题。前三个条目是教科书的一部分,介绍了光流估计的主题。第四篇出版物是一篇原创论文,描述了Hon和Chun的方法。如果你有兴趣阅读原始论文,最后一篇论文涉及内核化相关滤波器,这在本章后半部分讨论图像中的物体跟踪时已经介绍过。Referen...…
-
汽车视觉 Automotive Vision - Binocular Vision / Stereo Vision 双目视觉/立体视觉
chapter 2 Binocular Vision 双目视觉欢迎来到《汽车视觉》第二章,今天我们将讨论双目视觉系统,也称为立体视觉。这是一些提供有关双目视觉系统章节的教科书列表。如果你需要超出本讲座范围的背景信息,请参考这些书籍以获取更多信息。让我们通过介绍对极几何概念来开始我们对双目视觉的讨论。 R. Hartley, A. Zisserman, Multiple View Geometry in computer vision. CambridgeUniversity Press...…
-
机器视觉-深度学习(第二部分) Deep Learning
深度学习语义分割和目标检测 (Semantic Segmentation and Object Detection)场景标注 Scene Labeling分割图像 分类每个像素 自动编码器/解码器结构摘自:J. Long、E. Shelhamer、T. Darrell,“用于语义分割的全卷积网络”,CVPR,2015摘自:J. Long、E. Shelhamer、T. Darrell,“用于语义分割的全卷积网络”,CVPR,2015实例标签 Instance Label...…
-
机器视觉-深度学习(第一部分) Deep Learning
深度学习 Deep Learning多层感知器Multi-Layer Perceptrons (MLP)MLP 是高度参数化的非线性函数示例:图像分类$\vec{x}$ 特征向量,例如 图像中所有灰度值的向量$\vec{y}$ 1-of-q-vector 为 q 个可能类别中的每一个建模概率,例如 笑脸是快乐/悲伤/沮丧感知器, 感知机许多感知器的分层排列: 网络结构创建了一组高度非线性的函数 许多权重 深层架构:通常 >5 个隐藏层我们如何...…
-
机器视觉-模式识别(第二部分) Pattern Recognition
模式识别组合方法 Ensemble Methods如果想解决分类问题,应该怎么做?– 创建专家:训练分类器– 训练几个分类器 → 并构建一个组合集成学习归属于机器学习,他是一种「训练思路」,并不是某种具体的方法或者算法。现实生活中,大家都知道「人多力量大」,「3 个臭皮匠顶个诸葛亮」。而集成学习的核心思路就是「人多力量大」,它并没有创造出新的算法,而是把已有的算法进行结合,从而得到更好的效果。那组合怎么工作? k分类器 $c_{1}, c_{2}, \ldots,...…
-
机器视觉-模式识别(第一部分) Pattern Recognition
模式识别 Pattern Recognition分类:将对象分配到类别(classes)。维基百科:模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境和客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。以光学字元识别之“汉字识别”为例:首先将汉字图像进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就像老师教我们“这个字叫什么、如何写”记在大脑中。这一过程叫做...…
-
机器视觉-图像分割(第二部分) Segmentation
形态学运算 Morphological Operations对于图像具有的问题:孔洞, 参差不齐的轮廓,间隙,微小区域等,我们提出了形态学运算。两个关键概念:扩展和缩小区域:——腐蚀erosion: 将区域缩小一个像素——膨胀dilation:将区域扩大一个像素最基本的形态学运算是膨胀和腐蚀。膨胀指将像素添加到图像中对象的边界,而腐蚀指删除对象边界上的像素。现在我们假设:背景的像素用0编码,前景像素用大于1的数字编码。如图是四个相邻的像素 八个相邻的像素 24个相邻的像素八个相邻的...…
-
机器视觉-图像分割(第一部分) Segmentation
机器视觉-图像分割(第一部分)在计算机视觉领域, 图像分割 (segmentation)指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像分割通常用于定位图像中的物体和边界(线,曲线等)。更精确的,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。图像分割在实际中的应用:在卫星图像中定位物体(道路、森林等)人脸识别指纹识别交通控制...…
-
机器视觉-相机光学 Optics
针孔照相机点\((x,y,z)\)投影到\((x',y')\)截距定理:\[\frac{x}{z}=\frac{x^{\prime}}{f}, \quad \frac{y}{z}=\frac{y^{\prime}}{f} \quad \Rightarrow \quad z \cdot\left(\begin{array}{l}x^{\prime} \\ y^{\prime}\end{array}\right)=\left(\begin{array}{ll}f & 0 \\ ...…
-
机器视觉-颜色 Color
颜色颜色物理学可见光是波长在 380nm 到 740nm 之间的电磁波光的波长指定了它的颜色图像– 光可以包含许多波长’ → 光谱– 光谱取决于光源和滤光片– 要完整描述光源的物理特性,我们必须知道它的全光谱人类感知中的颜色人眼有四种感光细胞: 视杆细胞(对颜色不敏感) rods L-、M-、S-视锥细胞(对颜色敏感)Young-Helmholtz 理论: 人类对颜色的印象可以完全通过 S、M 和 L 锥的反应来解释 这不适用于色盲人士 这不适用于其他物种假设单色光的波长...…
-
机器视觉-曲线拟合(圆和椭圆) Curve Fitting
曲线拟合——圆和椭圆在上一篇文章中,我们总结了视觉识别中对于直线型边缘的拟合。但是如果有的图形边缘是曲线的话应该怎么拟合? 这一篇博文,我们就对其进行讨论。标准圆首先圆的方程为:\(\left(x-m_{1}\right)^{2}+\left(y-m_{2}\right)^{2}-r^{2} = 0\)因为d很小,用趋近的想法来考虑那么点(x,y)到圆的欧几里得距离大小为:\[d_{E}=\left|\sqrt{\left(x-m_{1}\right)^{2}+\left(y-m_...…
-
机器视觉-曲线拟合(直线部分) Curve Fitting
曲线拟合 Curve Fitting在上一篇文章中,我们讨论了图像的边缘检测,但是边缘检测完毕后存在一个问题就是噪点多,或者换句话说不光滑。所以我们再增加一个步骤来使得图像轮廓更加平滑:曲线拟合。原始图像–>(通过边缘检测)得到边缘图像–>(通过轮廓探测contour detector)得到坐标值(几何描述)在进行正式的拟合之前,我们先回顾一下二维几何知识:向量向量向量知识中有个很重要的概念:点积。点积的意义主要是表征向量的相似性。值越大代表相似性越好。 定义...…
-
机器视觉-边缘检测 Edge Detection
边缘检测的意义边缘检测是为了提取图像中主体的轮廓特征.灰度边缘的特性 在明亮和黑暗交接出有明显的改变(hard changes) 通常发生在物体的边缘处 发生在阴影和纹理处 边缘和亮度没有关系 人类的视觉皮层的许多部分都在处理灰度边缘灰度:把白色与黑色之间按对数关系分成若干级,成为灰度等级。范围一般从0-255,黑色为0.寻找边缘 边缘是灰度变化最大的地方(其变化率最大,可以通过导数判断) $g(u+\epsilon)-g(u-\epsilon)$...…
-
机器视觉-图像预处理 Image Preprocessing
图像预处理 Image Preprocessing图像形成与分析成像器图像形成过程: 入射光强度 成像仪的输出图像形成过程:– 采样sampling评估规则网格上的光强度– 量化 quantization将连续信号映射到离散值(自然数)– 模糊和噪声 blur and noise– 颜色将在后面讨论。 这里:只有光强度/灰度图像采样用于采样的二维网格电子相机:矩形等距网格生物:具有不同分辨率的六边形网格波纹图案 Moiré Patterns莫列波纹(英语:Moiré ...…