目 录CONTENT

文章目录

机器学习算法

半糖
2025-03-15 / 0 评论 / 0 点赞 / 25 阅读 / 7685 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2025-03-16,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

定义

机器学习:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。

算法:是利用计算机解决特定问题的处理步骤,是有限操作的集合。

以机器学习下西洋跳棋为例,问题可以描述为:

任务T:下西洋跳棋

性能标准:赢棋的概率

经验E:和自己对弈

目标函数:V,用来描述当前棋盘局面

棋局状态b评估:

X1:棋盘上黑子的个数

X2:棋盘上红子的个数

X3:棋盘上黑王的个数

X4:棋盘上红王的个数

X5:被红子威胁的黑子个数

X6:被黑子威胁的红子个数
棋局状态b的流转如下图:

flowchart LR b1 --> b2 b2 --> b3 b3 --> bn bn --> END

思路:通过将棋盘上的棋子进行评分,并将棋子及所在位置和一个目标函数V建立联系,该目标函数V的值可以描述当前棋盘局面。在棋子、局面和性能P之间建立联系,将P描述为一个和棋子、局面相关的函数,根据已有的数据(经验E)去求解P中各参数相关的最优解

目标函数满足表达式:V(b)=w_0 + w_1 \times X_1+\cdots+ w_6\times X_6 其中w为权重,尚且未知

设定规则:胜+100、平+0、负-100

输入棋谱或者自己和自己下很多盘,求出w_0 、 w_1 \cdots w_6

常见分类

监督学习算法

  • 定义:通过带有标签的数据训练模型,用于预测或分类。

分类算法(Classification)

  • 定义:预测离散的类别标签。

  • 常见算法

    • 逻辑回归(Logistic Regression)

    • 支持向量机(SVM, Support Vector Machine)

    • 决策树(Decision Tree)

    • 随机森林(Random Forest)

    • 朴素贝叶斯(Naive Bayes)

    • K近邻(K-Nearest Neighbors, KNN)

    • 神经网络(Neural Networks)

回归算法(Regression)

  • 定义:预测连续的数值。

  • 常见算法

    • 线性回归(Linear Regression)

    • 岭回归(Ridge Regression)

    • 拉索回归(Lasso Regression)

    • 支持向量回归(SVR, Support Vector Regression)

    • 决策树回归(Decision Tree Regression)

    • 随机森林回归(Random Forest Regression)

其他算法

  • 时间序列预测:如 ARIMA、LSTM。

  • 多标签分类:如多标签支持向量机。


无监督学习算法

  • 定义:通过无标签的数据发现隐藏的模式或结构

聚类(Clustering)

  • 定义:将数据分组为具有相似特征的簇。

  • 常见算法

    • K均值聚类(K-Means Clustering)

    • 层次聚类(Hierarchical Clustering)

    • DBSCAN(Density-Based Spatial Clustering of Applications with Noise)

    • 高斯混合模型(GMM, Gaussian Mixture Model)

    • 谱聚类(Spectral Clustering)

降维(Dimensionality Reduction)

  • 定义:减少数据的特征数量,同时保留重要信息。

  • 常见算法

    • 主成分分析(PCA, Principal Component Analysis)

    • t-SNE(t-Distributed Stochastic Neighbor Embedding)

    • 线性判别分析(LDA, Linear Discriminant Analysis)

    • 自编码器(Autoencoders)

关联规则学习(Association Rule Learning)

  • 定义:发现数据中的关联规则。

  • 常见算法

    • Apriori算法

    • FP-Growth算法

异常检测(Anomaly Detection)

  • 定义:识别数据中的异常点。

  • 常见算法

    • 孤立森林(Isolation Forest)

    • 局部异常因子(LOF, Local Outlier Factor)

    • 单类支持向量机(One-Class SVM)

半监督学习(Semi-Supervised Learning)

  • 定义:结合少量标签数据和大量无标签数据进行训练。

  • 常见算法

    • 自训练(Self-Training)

    • 图半监督学习(Graph-Based Semi-Supervised Learning)

    • 生成对抗网络(GAN, Generative Adversarial Networks)


强化学习(Reinforcement Learning)

  • 定义:通过与环境交互,基于奖励机制学习最优策略。

  • 常见算法

    • Q学习(Q-Learning)

    • 深度Q网络(DQN, Deep Q-Network)

    • 策略梯度(Policy Gradient)

    • 演员-评论家算法(Actor-Critic)

算法详解

TODO

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区