机器学习十大算法(机器学习需要哪些数学基础)
本文目录
机器学习需要哪些数学基础
最主要的是线性代数和概率论。
线性代数
现在最流行的机器学习模型,神经网络基本是就是一大堆向量、矩阵、张量。从激活函数到损失函数,从反向传播到梯度下降,都是对这些向量、矩阵、张量的操作和运算。
其他“传统”机器学习算法也大量使用线性代数。比如线性回归
听名字就知道和线性代数关系密切了。
而主成分分析,从线性代数的观点看,就是对角化协方差矩阵。
概率
特别是当你读论文或者想深入一点的时候,概率论的知识非常有帮助。
包括边缘概率、链式法则、期望、贝叶斯推理、最大似然、最大后验、自信息、香农熵、KL散度,等等。
其他
神经网络很讲究“可微”,因为可微的模型可以通过梯度下降的方法优化。梯度下降离不开求导。所以多变量微积分也需要。另外,因为机器学习是基于统计的方法,所以统计学的知识也缺不了。不过大部分理工科应该都学过这两块内容,所以这也许不属于需要补充的内容。
2017年机器学习面临解决的十大问题是什么
本文将机器学习面临的问题分为三类:外部问题、内部问题和应用问题,并分别给予解答。
外部问题
神经生物学:因为现在的机器学习在很大一步上是模仿人脑,但是现在人类对人脑的利用和开发 3%都不到,对其认识更是冰山一角,生物学尤其是神经生物学的发展是机器学习的限制性因素之一。目前为止最大的机器学习模型包含上亿个神经元,而大脑神经元的数量估计在150亿数量级以上。
量子物理学:它是与机器学习发展密切相关的重要学科之一,其突破直接影响到量子计算机的革新。
内部问题
数据
数量:数据标注需要人工,费时费力,所以标注的总体数据量不多。
质量:标注质量高的数据集不多,原因同样是费时费力。
训练:训练数据量动辄上TB,用数据训练的模型也很多,所以计算上相当费时。
算法
推理性:现在的大多数算法都是数据驱动型的,仍然处于感知阶段。
透明性:目前绝大多数机器学习算法就是黑箱(logistic regression等简单算法除外),训练出来的模型难以诠释。
选择性:首先是算法巨多,其次是算法变体多,光 GAN 就有 70+ 变体,因此选择解决问题的算法时让人无所适从;选好算法之后还没完,还得不断地调参。
泛化性:最要命的一点,是算法的泛化能力太差了,你好不容易选好调好的算法无法用来解决新问题,只能从头再来。
硬件
计算力:机器学习在计算力方面的需求从未得到满足,因此,硬件供应商的未来市场很大。
应用问题
鲁棒性:机器学习在应用方面首先要保证稳健性,比如在自动驾驶。
通用性:即机器学习的圣杯——通用人工智能(AGI),目前这方面的进展缓慢。可以说是机器学习面临的最大瓶颈。
更多文章:

如何评价cube旗下女团的宋雨琦?Cube Escape: Seasons攻略大全
2025年2月24日 22:00

c语言用fopen时,需要加特殊的 头文件吗?Linux函数fopen(“file.c“,“rt“)中r应该是读吧!t什么意思
2025年3月28日 22:40

itemcommand(如何阻止itemcommand enter键提交)
2025年3月6日 08:40

api免费网站(请问什么网站可以直接调用OCR识别技术的API接口啊最好是免费的!)
2025年3月6日 21:40

sql获取当前时间(如何用Sql语句获取当前时间,并且在当前时间的基础上减去3天的时间)
2025年3月12日 17:50

androbench下载(p10怎么使用androbench)
2025年3月13日 22:10

serial number是什么意思(SerialNumber是什么意思)
2025年3月12日 08:20

excel中rank函数怎么用(EXCEL中的RANK怎么用)
2025年4月5日 00:30

找不到actionlist(adobe flash player 安装 找不到actionlist)
2025年2月16日 16:20

php文件用浏览器打开(wampserver怎么部署php文件能在浏览器中打开)
2025年3月27日 13:20