Ryan's hub

基于直接偏好优化对齐联邦大模型偏好
A Survey on Federated Fine-tuning of Large Language Models 本综述（Wu等，2025）[1] 首次系统性地回顾了大型语言模型（LLM）与...
2025-12-30
学习记录
毕业设计
| 联邦学习
| 直接偏好优化
Read more基于直接偏好优化对齐联邦大模型偏好
毛泽东思想和中国特色社会主义理论体系（二）
中国近现代史 & 社会主义改造核心知识点辨析本文档汇总了10道关于中国近现代史、社会主义改造与中国特色社会主义理论发展的核心判断题，包含判断正误、详细解析与订正，助你精准掌握易错点与核...
2025-11-24
学习记录
考研
| 政治
Read more毛泽东思想和中国特色社会主义理论体系（二）
马克思主义基本原理
马克思主义基本原理核心概念与易错点梳理一、资本划分：两种根本不同的方法 1. 不变资本 (c) 与可变资本 (v) 维度不变资本 (c) 可变资本 (v) 划分依据...
2025-11-22
学习记录
考研政治
Read more马克思主义基本原理
黑川物流设定
黑川物流公司世界观详细设定一、世界观概述基础设定黑川物流世界观建立在现实世界的科技水平基础上，除去三个虚构元素（兽人、黑胶科技、机械科技）外，其他设定基本与现实世界相同世界中没有魔法或...
2025-11-18
黑川物流
Read more黑川物流设定
低位交叉多存储模块数量的要求
低位交叉多体存储模块数量的要求一、核心结论对于采用低位交叉编址的多体存储器，要达到理论上最高的连续读写带宽，其存储模块的数量 M 必须等于主存访问周期 T 与总线传输周期 τ 之比。即： ...
2025-11-17
学习记录
计算机组成原理
Read more低位交叉多存储模块数量的要求
英语写作九宫格
大作文开头段：描述图画 1.话题引起：开篇点题 The past (several years/ decades/ centuries/ months) have witnessed a (...
2025-11-13
学习记录
英语
Read more英语写作九宫格
基于直接偏好优化对齐联邦大模型偏好的研究
一、原始依据 1、工作基础：随着大模型技术的迅猛发展，大模型偏好对齐问题受到了广泛关注。其中，DPO（Direct Preference Optimization）作为一种高效的偏好对齐方法，...
2025-11-12
学习记录
DPO
| Federal Learning
Read more基于直接偏好优化对齐联邦大模型偏好的研究
DPO直接偏好优化
DPO 产生的背景 RLHF（Reinforcement Learning with Human Feedback）基于人类反馈的强化学习，是近年来在人工智能，尤其是大型语言模型训练中非常关键的...
2025-11-11
学习记录
AI
| 机器学习
| 强化学习
Read moreDPO直接偏好优化
联邦学习（一）
背景大数据和人工智能的发展带来了数据孤岛和隐私安全问题。由于企业系统和业务的封闭性，数据垄断和数据孤岛现象日益严重，加之以新的数据法律法规，导致人工智能中依赖数据共享的传统数据处理模型成本提高...
2025-11-11
学习记录
联邦学习
| 毕设
Read more联邦学习（一）
WSL磁盘空间压缩
前言由于 WSL 的系统是作为文件存储在 Windows 系统中的，所以对 WSL 的一些操作会影响到 Windows 系统的磁盘空间使用情况。WSL 的磁盘空间使用情况可以通过wsl --l...
2025-05-18
学习记录
WSL
| 磁盘空间
Read moreWSL磁盘空间压缩

12 3…5