定义
机器学习:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。
算法:是利用计算机解决特定问题的处理步骤,是有限操作的集合。
以机器学习下西洋跳棋为例,问题可以描述为:
任务T:下西洋跳棋
性能标准:赢棋的概率
经验E:和自己对弈
目标函数:V,用来描述当前棋盘局面
棋局状态b评估:
X1:棋盘上黑子的个数
X2:棋盘上红子的个数
X3:棋盘上黑王的个数
X4:棋盘上红王的个数
X5:被红子威胁的黑子个数
X6:被黑子威胁的红子个数
棋局状态b的流转如下图:
思路:通过将棋盘上的棋子进行评分,并将棋子及所在位置和一个目标函数V建立联系,该目标函数V的值可以描述当前棋盘局面。在棋子、局面和性能P之间建立联系,将P描述为一个和棋子、局面相关的函数,根据已有的数据(经验E)去求解P中各参数相关的最优解
目标函数满足表达式:V(b)=w_0 + w_1 \times X_1+\cdots+ w_6\times X_6 其中w为权重,尚且未知
设定规则:胜+100、平+0、负-100
输入棋谱或者自己和自己下很多盘,求出w_0 、 w_1 \cdots w_6
常见分类
监督学习算法
定义:通过带有标签的数据训练模型,用于预测或分类。
分类算法(Classification)
定义:预测离散的类别标签。
常见算法:
逻辑回归(Logistic Regression)
支持向量机(SVM, Support Vector Machine)
决策树(Decision Tree)
随机森林(Random Forest)
朴素贝叶斯(Naive Bayes)
K近邻(K-Nearest Neighbors, KNN)
神经网络(Neural Networks)
回归算法(Regression)
定义:预测连续的数值。
常见算法:
线性回归(Linear Regression)
岭回归(Ridge Regression)
拉索回归(Lasso Regression)
支持向量回归(SVR, Support Vector Regression)
决策树回归(Decision Tree Regression)
随机森林回归(Random Forest Regression)
其他算法
时间序列预测:如 ARIMA、LSTM。
多标签分类:如多标签支持向量机。
无监督学习算法
定义:通过无标签的数据发现隐藏的模式或结构
聚类(Clustering)
定义:将数据分组为具有相似特征的簇。
常见算法:
K均值聚类(K-Means Clustering)
层次聚类(Hierarchical Clustering)
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)
高斯混合模型(GMM, Gaussian Mixture Model)
谱聚类(Spectral Clustering)
降维(Dimensionality Reduction)
定义:减少数据的特征数量,同时保留重要信息。
常见算法:
主成分分析(PCA, Principal Component Analysis)
t-SNE(t-Distributed Stochastic Neighbor Embedding)
线性判别分析(LDA, Linear Discriminant Analysis)
自编码器(Autoencoders)
关联规则学习(Association Rule Learning)
定义:发现数据中的关联规则。
常见算法:
Apriori算法
FP-Growth算法
异常检测(Anomaly Detection)
定义:识别数据中的异常点。
常见算法:
孤立森林(Isolation Forest)
局部异常因子(LOF, Local Outlier Factor)
单类支持向量机(One-Class SVM)
半监督学习(Semi-Supervised Learning)
定义:结合少量标签数据和大量无标签数据进行训练。
常见算法:
自训练(Self-Training)
图半监督学习(Graph-Based Semi-Supervised Learning)
生成对抗网络(GAN, Generative Adversarial Networks)
强化学习(Reinforcement Learning)
定义:通过与环境交互,基于奖励机制学习最优策略。
常见算法:
Q学习(Q-Learning)
深度Q网络(DQN, Deep Q-Network)
策略梯度(Policy Gradient)
演员-评论家算法(Actor-Critic)
算法详解
TODO
评论区