💻
QMMMS的笔记
博客
  • QMMMS的笔记
  • agent
    • MCP的背景、原理和开发
    • Agent 历史与背景
    • Agentic Workflows
    • 环境检查与基础工具
    • Tool Call
    • 工具与运行时的值
    • temp
    • 处理 Tool Call error
    • trick
  • algorithm
    • 线性结构
    • 二叉树
    • 图
    • 查找
    • 排序
    • 动态规划
    • 优化方法
    • 数学
    • 迁移至Java
  • computer_composition
    • 系统总线
    • 存储器
    • 输入输出系统
    • 计算机的运算方法
    • 指令系统
    • 补充
  • computer_network
    • 引入
    • 应用层
    • 传输层
    • 网络层(数据平面)
    • 网络层(控制平面)
    • 链路层
    • 常见问答
    • 实验
  • database
    • SQL实战
    • 关系代数
    • 数据库设计
    • 规范化
    • 数据库基本概念
    • 查询原理
    • 数据库恢复技术
    • 并发控制
  • dev_tools
    • Git
    • Nginx
    • Spring
    • LangChain
    • PyTorch Cheat Sheet
    • MyBatis
    • MySQL Cheat Sheet
    • MySQL 补充
    • Redis
    • Docker
    • RocketMQ
    • Chrome
  • linux
    • Linux基础命令与使用
    • 文件与权限
    • 文件与目录操作
    • 权限属性高级
    • 命令与文件的查找
    • 文件压缩和打包
    • vim编辑器
    • shell变量
    • 命令补充
    • 数据流重定向
    • 管道命令
    • shell脚本
    • 用户管理
    • 用户间交流
    • 计划任务
    • 进程管理
    • 软件管理
    • 认识系统服务
    • 运维常用命令
    • 常用命令
  • llm
    • 大规模语言模型概述
    • 分布式训练概述
    • 有监督微调概述
    • 强化学习与LLM
    • LLM评估概述
    • 大模型应用
    • 理解大模型
    • 量化
    • 预训练
    • 上下文学习
  • machine_learning
    • 引入
    • 大致正确学习
    • 一致收敛
    • 偏差还是过拟合?
    • 可学习的充要条件
    • 非均匀可学习性
    • 计算复杂性
  • mathematics
    • 概率与统计基础
    • 线性代数基础
  • operating_system
    • 操作系统基本概念
    • 进程和线程
    • 同步,互斥与死锁
    • 内存管理
    • 文件系统
    • I/O系统
    • 保护与安全
    • 《现代操作系统》
  • statistical_learning
    • 统计学习引入
    • 线性回归
    • 分类
    • 重抽样方法
    • 线性模型选择与正则化
    • 非线性模型
    • 基于树的方法
    • 支持向量机
    • 无指导学习
    • 马尔科夫链和蒙托卡罗方法简明理解
    • R语言速查
  • deep_learning
    • basic_concepts
      • 逻辑回归与损失函数
      • 神经网络
      • 正则化、预处理、权重初始化
      • 优化算法
      • 机器学习策略
      • 复习:从计算机视觉的角度
      • 卷积神经网络
      • 深度卷积网络示例
      • 计算机视觉任务
      • 循环神经网络
      • 自然语言处理任务
      • 注意力
      • Transformers 家族
      • 显卡扫盲
      • 强化学习概述
    • semi-supervise
      • 半监督学习简介
      • Consistency Regularization
      • Proxy-label Methods
      • Holistic Methods
      • Generative Models
      • Graph-Based SSL
      • Self-Supervision for SSL
      • Other SSL methods
  • programming
    • cpp
      • STL
      • C++基础
      • 内存管理
      • 面向对象
    • java
      • 环境和介绍
      • 注释
      • String
      • 面向对象思想
      • Object
      • 包
      • 访问权限修饰符
      • 初始化块
      • 接口
      • 内部类
      • 注解
      • 枚举
      • 集合框架
      • List
      • Map
      • 泛型
      • 迭代
      • IO与流
      • 序列化
      • 异常
      • Lambda
      • Stream流
      • Socket
      • 缓冲
      • 命名规范
      • 拆箱装箱
      • 值传递
      • 深拷贝
      • 反射
      • JVM
      • 并发编程基础
    • python
      • 并发编程
      • 环境管理
  • software_engineering
    • basic_concepts
      • 系统分析与设计概述
      • 规划
      • 需求分析与原型设计
      • 项目管理
      • 建模
      • 数据库设计
      • 架构
      • 配置管理
      • 测试管理
      • 安全
      • 编码原则
      • 微服务
      • 补充内容
    • software_testing
      • CMMI基础
      • PPQA与SQA
      • 软件测试基础
      • 黑盒测试
      • 白盒测试
      • 集成测试
      • 系统测试
      • 测开面试补充
由 GitBook 提供支持
在本页
  • 多项式回归
  • 阶梯函数
  • 基函数
  • 回归样条
  • 截断幂基
  • 确定结点的个数和位置
  • 自然样条
  • 光滑样条
  • 局部回归
  • 广义可加模型
  • GAM的优点与不足
  • 用于分类的GAM
在GitHub上编辑
  1. statistical_learning

非线性模型

上一页线性模型选择与正则化下一页基于树的方法

最后更新于10个月前

多项式回归

y=β0+β1xi+β2xi2+β3xi3+...+βdxid+εiy=β_0+β_1x_i+β_2x_i^2+β_3x_i^3+...+β_dx_i^d+ε_iy=β0​+β1​xi​+β2​xi2​+β3​xi3​+...+βd​xid​+εi​

阶梯函数

创建分割点$c_1,c_2,...,c_K$,然后构造K+1个新变量:$C_0(X)=I(X<c_1),...,C_K(X)=I(c_k≤X)$

yi=β0+β1C1(xi)+β2C2(xi)+...+βKCK(xi)+εiy_i=β_0+β_1C_1(x_i)+β_2C_2(x_i)+...+β_KC_K(x_i)+ε_iyi​=β0​+β1​C1​(xi​)+β2​C2​(xi​)+...+βK​CK​(xi​)+εi​

基函数

多项式和阶梯函数回归模型实际上是特殊的基函数方法,对变量X的函数变换$b_1(X),b_2(X),...,b_K(X)$进行建模

yi=β0+β1b1(xi)+β2b2(xi)+...+βKbK(xi)+εiy_i=β_0+β_1b_1(x_i)+β_2b_2(x_i)+...+β_Kb_K(x_i)+ε_iyi​=β0​+β1​b1​(xi​)+β2​b2​(xi​)+...+βK​bK​(xi​)+εi​

回归样条

不同区域拟合不同的多项式函数,可以这样表示

没有约束的有K个结点的三次样条会产生4K+4个自由度

有K个结点的三次样条会产生K+4个自由度(原因是每个结点处增加了三个约束:连续、一阶导连续、二阶导连续)

同时也可以使用样条基函数表示

截断幂基

在上述基函数式子中,可以选择不同的基函数得到等价的三次样条,比如截断幂基的方式是先以三次多项式的基为基础($x,x_2,x_3$),然后在每个结点添加一个截断幂基函数

其中ξ是结点

确定结点的个数和位置

使用交叉验证确定:首先移除10%的数据,用剩余的数据拟合,然后对那部分被移除的数据进行预测(10折交叉验证),最后计算整体的交叉验证RSS。整个过程对不同的结点数K不断尝试

回归样条通常结果比多项式回归好且稳定,回归样条通过固定自由度但是多设立结点的方式来获得稳定的估计结果

自然样条

自然样条是附加了边界约束的回归样条,函数在边界区域应该是线性,这样自然样条估计在边界处更稳定。

光滑样条

如果对$g(x_i)$不添加任何约束条件,只能得到一个取值为0的RSS,这样的函数对数据严重过拟合。而实际上真正需要的g是满足RSS尽量小,同时曲线尽量平滑(较少的突变,光滑度下降)

可以通过最小化下式

λ由0增至∞,实际自由度$df_{λ}$从n降至2

局部回归

选取s=k/n比例的最靠近$x_0$的数据$x_i$

对选出的数据赋予其权重$K_{i0}=K(x_i,x_0)$,离$x_0$最远的点权重为0,而最近的点权重最高

用定义好的权重在$x_i$处拟合加权最小二乘回归

根据$\hat{f}(x_0)=\hat{β}_0+\hat{β}_1x_0$得到$x_0$的拟合结果

广义可加模型

每一个变量用一个非线性函数替换

GAM的优点与不足

  • 允许每一个$X_i$都拟合一个非线性$f_i$,非线性拟合模型能预测得更精准,且模型可加,能保持其他变量不变情况下观测单变量对Y的影响效果

  • 局限在于形式被限定为可加形式

用于分类的GAM

用逻辑斯蒂回归的对数发生比即可

yi=β0+β1b1(xi)+β2b2(xi)+...+βK+3bK+3(xi)+εiy_i=β_0+β_1b_1(x_i)+β_2b_2(x_i)+...+β_{K+3}b_{K+3}(x_i)+ε_iyi​=β0​+β1​b1​(xi​)+β2​b2​(xi​)+...+βK+3​bK+3​(xi​)+εi​
∑i=1n(yi−g(xi))2+λ∫g′′(t)2dt\sum_{i=1}^{n}(y_i-g(x_i))^2+ \lambda \int g''(t)^2dti=1∑n​(yi​−g(xi​))2+λ∫g′′(t)2dt
yi=β0+f1(xi1)+f2(xi2)+...+fp(xip)+εiy_i=β_0+f_1(x_{i1})+f_2(x_{i2})+...+f_p(x_{ip})+ε_iyi​=β0​+f1​(xi1​)+f2​(xi2​)+...+fp​(xip​)+εi​
log(p(X)1−p(X))=β0+f1(X1)+f2(X2)+...+fp(Xp)log(\frac{p(X)}{1-p(X)})=β_0+f_1(X_1)+f_2(X_2)+...+f_p(X_p)log(1−p(X)p(X)​)=β0​+f1​(X1​)+f2​(X2​)+...+fp​(Xp​)
p(X)=Pr(y>n∣f1(X),f2(X),f3(X)...)p(X)=Pr(y>n|f_1(X),f_2(X),f_3(X)...)p(X)=Pr(y>n∣f1​(X),f2​(X),f3​(X)...)