参考资料

1. 神经元

神经元是神经网络的基本结构，是最小的神经网络。神经元有多个输入和一个输出

输入x：代表样本特征值，如 [房屋面积，房屋价格，社区评分]

连接（Connection）是图中的边。每一个连接上都有一个权重（Weight）

$x = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}， w = \begin{pmatrix} w_1 \\ w_2 \\ w_3 \end{pmatrix}$

信号处理函数分为两部分

计算公式为：

$z = x_1w_1 + x_2w_2 + x_3w_3 + b \\ a = σ(z)$

用向量表示为：

$z = {w^T}x + b$

w可以解理为斜率，b可以解理为截距

z被代入到激活函数 a=σ(z) 得到神经元的输出，这里的 a 表示神经元的激活状态

注意到这里的σ(z)还没有具体展开。 σ(z)被称为激活函数，具体有很多种，在整个神经网络中不同层的神经元可以使用不同的激活函数

1.1. 多分类

单个神经元的决策边界是一条直线，只能解决二分类问题

如果想要解决三分类问题，就要两个神经元，因为两个神经元决策边界是两条直线

扩展w，w从向量变成了矩阵

$w = \begin{pmatrix} w_{11} & w_{21} \\ w_{12} & w_{22} \\ w_{13} & w_{23} \end{pmatrix}$

σ(z)激活函数有好几种，常见的有以下几种：

sigmoid函数（知名度最高）

$a = \frac{1}{1 + e^{-z}}$

tanh双曲正切函数

$a = \frac{e^z - e^{-z}}{e^z + e^{-z}}$

ReLU（Rectified Linear Unit）线性整流函数

$a = max(0, z)$

Leaky ReLu函数

$a = max(0.01z, z)$

先记住以下几点：

至于为什么是这样，需要阅读好多论文才能懂，暂时先记住

定义：在机器学习和认知科学领域，人工神经网络（artificial neural network，缩写ANN），简称神经网络（neural network，缩写NN）或类神经网络，是一种模仿生物神经网络的结构和功能的计算模型，用于对函数进行估计或近似。

多个神经元组成的网络就是神经网络

一个神经网络的训练算法就是让权重的值调整到最佳，以使得整个网络的预测效果最好

整个神经网络分为：输入层，隐藏层，输出层。一般说L层神经网络，指的是有L个隐层，输入层和输出层都不计算在内的

基础神经网络：单层感知器，线性神经网络，BP神经网络，Hopfield神经网络等

进阶神经网络：玻尔兹曼机，受限玻尔兹曼机，递归神经网络等

深度神经网络：深度置信网络，卷积神经网络，循环神经网络，LSTM网络等

结构（Architecture）例如，神经网络中的变量可以是神经元连接的权重

激励函数（Activity Rule）大部分神经网络模型具有一个短时间尺度的动力学规则，来定义神经元如何根据其他神经元的活动来改变自己的激励值。

学习规则（Learning Rule）学习规则指定了网络中的权重如何随着时间推进而调整。（反向传播算法）