定义

机器学习：对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么我们称这个计算机程序在从经验E学习。

算法：是利用计算机解决特定问题的处理步骤，是有限操作的集合。

以机器学习下西洋跳棋为例，问题可以描述为：

任务T：下西洋跳棋

性能标准：赢棋的概率

经验E：和自己对弈

目标函数：V，用来描述当前棋盘局面

棋局状态b评估：

X1：棋盘上黑子的个数

X2：棋盘上红子的个数

X3：棋盘上黑王的个数

X4：棋盘上红王的个数

X5：被红子威胁的黑子个数

X6：被黑子威胁的红子个数
棋局状态b的流转如下图：

flowchart LR b1 --> b2 b2 --> b3 b3 --> bn bn --> END

思路：通过将棋盘上的棋子进行评分，并将棋子及所在位置和一个目标函数V建立联系，该目标函数V的值可以描述当前棋盘局面。在棋子、局面和性能P之间建立联系，将P描述为一个和棋子、局面相关的函数，根据已有的数据（经验E）去求解P中各参数相关的最优解

目标函数满足表达式：V(b)=w_0 + w_1 \times X_1+\cdots+ w_6\times X_6 其中w为权重，尚且未知

设定规则：胜+100、平+0、负-100

输入棋谱或者自己和自己下很多盘，求出w_0 、 w_1 \cdots w_6

常见分类

监督学习算法

定义：通过带有标签的数据训练模型，用于预测或分类。

分类算法（Classification）

定义：预测离散的类别标签。
常见算法：
- 逻辑回归（Logistic Regression）
- 支持向量机（SVM, Support Vector Machine）
- 决策树（Decision Tree）
- 随机森林（Random Forest）
- 朴素贝叶斯（Naive Bayes）
- K近邻（K-Nearest Neighbors, KNN）
- 神经网络（Neural Networks）

回归算法（Regression）

定义：预测连续的数值。
常见算法：
- 线性回归（Linear Regression）
- 岭回归（Ridge Regression）
- 拉索回归（Lasso Regression）
- 支持向量回归（SVR, Support Vector Regression）
- 决策树回归（Decision Tree Regression）
- 随机森林回归（Random Forest Regression）

其他算法

时间序列预测：如 ARIMA、LSTM。
多标签分类：如多标签支持向量机。

无监督学习算法

定义：通过无标签的数据发现隐藏的模式或结构

聚类（Clustering）

定义：将数据分组为具有相似特征的簇。
常见算法：
- K均值聚类（K-Means Clustering）
- 层次聚类（Hierarchical Clustering）
- DBSCAN（Density-Based Spatial Clustering of Applications with Noise）
- 高斯混合模型（GMM, Gaussian Mixture Model）
- 谱聚类（Spectral Clustering）

降维（Dimensionality Reduction）

定义：减少数据的特征数量，同时保留重要信息。
常见算法：
- 主成分分析（PCA, Principal Component Analysis）
- t-SNE（t-Distributed Stochastic Neighbor Embedding）
- 线性判别分析（LDA, Linear Discriminant Analysis）
- 自编码器（Autoencoders）

关联规则学习（Association Rule Learning）

定义：发现数据中的关联规则。
常见算法：
- Apriori算法
- FP-Growth算法

异常检测（Anomaly Detection）

定义：识别数据中的异常点。
常见算法：
- 孤立森林（Isolation Forest）
- 局部异常因子（LOF, Local Outlier Factor）
- 单类支持向量机（One-Class SVM）

半监督学习（Semi-Supervised Learning）

定义：结合少量标签数据和大量无标签数据进行训练。
常见算法：
- 自训练（Self-Training）
- 图半监督学习（Graph-Based Semi-Supervised Learning）
- 生成对抗网络（GAN, Generative Adversarial Networks）

强化学习（Reinforcement Learning）

定义：通过与环境交互，基于奖励机制学习最优策略。
常见算法：
- Q学习（Q-Learning）
- 深度Q网络（DQN, Deep Q-Network）
- 策略梯度（Policy Gradient）
- 演员-评论家算法（Actor-Critic）

算法详解

TODO

目录CONTENT

机器学习算法

定义