做一个有温度和有干货的技术分享作者 —— Qborfy
今天我们来学习 神经网络算法
一句话核心:“神经网络 = 模拟人脑的计算网络,通过层层传递数据自动学习规律,输入→加工→输出是它的核心工作流”
是什么?
定义: 人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。
三层功能
- 输入层:接收数据(如28x28像素的手写数字图片)
- 隐藏层:层层提取特征(线条→局部图案→完整数字)
- 输出层:给出预测结果(概率最大的数字0-9)
怎么做
神经网络如何实现预测结果?
- 神经元计算(积木拼装), 将所有数据(w1)+影响因子(x1)+权重(b)都输入到网络中,公式:
w1*x1+w2*x2+...+wn*xn+b
- 激活函数(质检开关), 判断当前数据输出是否符合要求
- 损失函数(误差雷达), 计算预测值和实际值之间的误差,公式:
loss = (y-y')^2
- 经过三个步骤,不断迭代,直到误差最小,得到预测结果公式:
y' = f(w1*x1+w2*x2+...+wn*xn+b)
神经网络算法类型
类型 | 特点 | 典型应用 | 在线实验 |
---|---|---|---|
全连接网络 | 每层神经元全部连接 | 房价预测 | TF Playground回归任务 |
卷积网络CNN | 局部感知/权重共享 | 人脸识别 | CNN Explainer可视化 |
循环网络RNN | 记忆之前状态 | 语音识别 | Karpathy Char-RNN |
Transformer | 自注意力机制 | ChatGPT | Hugging Face Demo |
生活案例
快递分拣中心模型:
- 收货区(输入层):接收全国包裹(原始数据)
- 分拣线(隐藏层):
→ 首站:按省份粗分(提取大特征)
→ 中转:按城市细分(识别局部特征)
→ 末站:按街道精分(确认细节) - 发货区(输出层):送至具体地址(分类结果)
冷知识
- GPT-3的神经元数量(1750亿)≈ 人类大脑神经元(860亿)的 2倍,
- 但人脑能耗仅20瓦,而训练GPT-3需 190万度电(相当于200家庭年用电)!
参考资料
- 本文作者: Qborfy
- 本文链接: https://www.qborfy.com/ailearn/daily/04.html
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!