什么时候用到施密特正交化?
求正交基,正交矩阵时用到。 特别在化对称矩阵为对角矩阵中用的多。
施密特正交化的意义?
施密特正交化就是把非正交基变为正交基的。
施密特正交化的过程其实就是这种过程的重复。对于两个向量而言,以其中一个向量为基,构建出另一个与之垂直的向量。具体的构造方法就是利用两个向量的内积得到其中一个向量在基方向的投影向量,然后直接相减,就能得到垂直于基的向量。这种垂直其实就是来自于向量的内积过程,或者说投影过程。因此我们看到施密特正交化公式中有大量的内积。
拓展资料
算法概念
我们不仅需要了解如何构建机器学习模型,同时我们还需要理解构建机器学习的各种概念。如下所示,这两张速查表介绍了很多统计学、线性代数、最优化理论和机器学习理论上的概念,这些概念在模型构建和模型操作计算上有很重要的意义。比如前面就介绍了线性代数中的施密特正交化(Gram Schmidt Orthogonalization)概念,如下所述施密特正交化可以将 n 个线性无关向量转化为 n 个互相正交的向量,该速查表给出了转化公式。还有后面常用于最优化的梯度和海塞矩阵的求解方法,该速查表用一阶偏导数向量的形式表示了梯度的定义,二阶偏导数及其在矩阵中的位置表示了海塞矩阵的定义方式。这两个都是在最优化如梯度下降和牛顿法中核心的概念。当然机器学习的概念也少不了,比如前面的决策边界和后面的反向传播算法公式等。
TensorFlow
今年谷歌发布了第二代 TPU,同时它能在 Google Compute Engine 上进行使用。第二代 TPU 的性能达到每秒 180 万亿次浮点运算(180 teraflops),并且如果将 64 个 TPU 组织成一个计算集群,那么它的性能达到每秒 11.5 千万亿次浮点运算(11.5 petaflops)。如下图所示,该速查表不仅简要介绍了 TensorFlow、Skflow 和 Keras,同时还描述了如何安装和获得帮助的函数。该速查表还重点描述了 TensorFlow 的常用函数,如常见的梯度下降法、适应性梯度算法和 Adam 优化算法等优化器,常见的 ReLU、Sigmoid 和 tanh 等激活函数。
神经网络
下图相信不少读者已经挺熟悉了,该图使用不同颜色和符号代表不同的单元而描述了神经网络的各种架构。例如简单的长短期记忆神经网络就是几个黄色的输入单元组成输入层,再加上由若干个记忆单元组成的隐藏层和输出单元组成的输出层。
库函数语法速查表
1.Keras
Keras 是一个非常强大且容易上手的深度学习库;当 Keras 接入 Theano 和 TensorFlow 时,后两者可提供高水平的神经网络 API 以开发和评估深度学习模型。该速查表可用于 Python 数据科学和机器学习。
2. Numpy
Numpy 库是 Python 中科学性计算的核心库,它提供高性能、多维度的数组对象,以及对这些数组进行运算的工具。该速查表可用于 Python 数据科学和机器学习。
3. Pandas
这张 Pandas 速查表主要用于数据整理(data wrangling)。
Pandas 库构建在 NumPy 上,并为 Python 编程语言提供易于上手的数据结构和数据分析工具,该速查表可用于 Python 数据科学和机器学。
4. SciPy
SciPy 库是科学性计算的核心包之一,科学性计算可提供数学算法和构建在 Python 的 NumPy 扩展上的便捷函数 (Convenience Functions) ;该表中还包括线性代数的部分。该速查表可用于 Python 数据科学和机器学习。
5. Matplotlib
Matplotlib 是一个 Python 2D 绘图库,它在平台上以多种硬拷贝格式和交互环境生成发表品质的图。该速查表用于 Python 数据科学。
6. Scikit-learn
Scikit-learn 是一个开源 Python 库,通过统一接口实现一系列的机器学习、预处理、交叉验证和视觉化算法。该速查表可用于 Python 数据科学和机器学习。
7. ggplot2
ggplot2 基于图形语法,其思想是你可以利用相同的几个组件构建所有的图形:一个数据集、一个几何集(表征数据点的视觉化标记)和一个协作系统。该速查表用于数据可视化。