连载 2.1 神经网络基础之二分分类

注，本文是在学习吴恩达老师（Andrew Ng）网易公开课课程的的学习总结和理解，希望与君共勉！

什么是二分分类问题

让我们来举例说明，假如有一副下图中含有两只小猫的图片，在二分分类中的问题中，我们的目标是训练出一个分类器（classifier）它以特征向量x作为输入预测出结果y是0还是1，也就是预测出图片中是否含有猫。

计算机如何表示图片

我们先来看一看图像在计算机里是怎么表示的，为了在计算机里保存一幅（彩色）图像，计算机要存储3个独立的矩阵，分别对应着图像的红、绿、蓝3个颜色通道。如果你的图像大小是64×64那么你会有3个64×64大小的实数矩阵分别代表图像的红、绿、蓝3个颜色通道。由于空间有限，我在文档中画的矩阵比实际小的多，大小只是5×4，而不是64×64,所以如图所示：

为了用向量表示这些像素矩阵，我们将把这些矩阵中的像素的值展开，使其成为一个向量x，这个向量x作为算法的输入。为了将这些像素的值展开成为一个向量，我们所做的就是按下面方法定义一个与该图像相对应的向量。我们直接将255、231、42…..等这些红色通道像素的值取出放入向量x中，接着放入绿色通道像素的值255、134、202…等代表绿色通道的像素值，最后是红色蓝色通道的像素值，最终我们会得到一个非常长的向量。向量中列出了图像中红、绿、蓝，三个通道的像素值。如果图像的大小是64×64。那么该向量的维度将会是64x64x3，这就是图像的矩阵包含的元素总数。在这个例子中，向量的总长度为12288也就是64x64x3的乘积，

并且我们将用
$\LARGE n_{x}=12288$
来表示输入特征向量x的维度。并且有时候为了简化，我也会直接用小写n来表示输入特征向量的维度。所以在二元分类问题中我们的目标是学习到这样的一个分类器：我们输入一幅以特征向量x表示的图像，然后预测对应的输出y是1还是0，即这幅图上是猫还是不是猫。

一些符号的定义

单个样本由一对（x,y）表示。其中x是一个维的特征向量，表示为
$x\epsilon R$
。y是标签，取值为0或1，表示为

。训练集包含m个训练样本所以训练集将被写成

${(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})}$

,其中的
$(x^{(1)},y^{(1)})$
表示第一个样本的输入和输出，
$(x^{(2)},y^{(2)})$
代表第二个样本的输入和输出，一直到
$(x^{(m)},y^{(m)})$
表示最后一个样本输入和输出。因此，我将使用小写m代表训练集的样本总数。有时为了强调表示训练集的样本总数，我会写成

$M=M_{train}$

，当是测试集时，我有时会用

$M=M_{test}$

来表示测试集的样本的总数。如图所示

为了将所有的训练样本写成更加紧凑的形式我们将定义一个矩阵，用大写X表示，X定义如下：将训练集中的输入
$x^{(1)}$
,
$x^{(2)}$
…
$x^{(m)}$
,取出按列排列到矩阵X中。我们将
$x^{(1)}$
放在矩阵的第一列中，
$x^{(2)}$
放在矩阵的第二列中，直到
$x^{(m)}$
。这样便得到了矩阵X。因此矩阵M将有m列，m即训练样本的总数。同时矩阵X有
$n_{x}$
行。概括一下，X是一个
$n_{x}$
乘m维的矩阵。在Python中你会看到X.shape命令，这是Python里得到矩阵形状的命令的输出是
$(n_{x},m)$
这表示X是一个
$n_{x}$
乘m维的矩阵。以上就是你如何组织训练样本的输入x到矩阵X，那么如何组织输出标签Y呢？事实证明要使你应用神经网络时更简单，你同样应该将y按列排列。因此Y等于
$\begin{bmatrix} y^{(1)}& y^{(2)}} &...&y^{(m) \end{bmatrix}$
，Y是一个1行m列大小的矩阵,标记为

$x\epsilon R^{1\times m}$

。同样的，使用Python命令Y.shape，将会输出(1，m)表示Y是一个1行m列大小的矩阵。

在本文之后，当你实现你自己的神经网络时你会发现一个非常有用的惯例：混合不同的训练样本数据。在这里数据是指单个x或y，或者之后其他的数目数据混合不同训练样本的数据并将它们按列排列，像我们之前对x和y做的那样。以上就是我们之后会在回归算法和神经网络算中使用到的一些符号。如果你忘记了某个符号的意义比如M代表什么N代表什么或者其他什么的，我们已经在课程网站贴出了符号指南你可以用它快速的查找特定符号的意义。让我们开始进入下一节课着手实现逻辑回归算法。

原文链接：https://blog.csdn.net/zhuguiqin1/article/details/79120368

什么是 二分分类问题

计算机如何表示图片

一些符号的定义

你可能也喜欢

什么是二分分类问题