阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 192|回复: 3

[科技、报告] 《DeepSeek-R1及类强推理模型开发解读》作者:北京大学 陈博远【PDF】

[复制链接]

用户组:秀才

      UID
251
      积分
858
      回帖
10
      主题
101
      发书数
100
      威望
702
      铜币
4056
      贡献
0
      阅读权限
40
      注册时间
2025-3-1
      在线时间
49 小时
      最后登录
2025-5-1
发表于 2025-3-5 10:25 | 显示全部楼层 |阅读模式




DeepSeek-R1及类强推理模型开发的解读,由北京大学的陈博远撰写。主要内容涉及模型的技术架构、强化学习(RL)的应用、与其他技术的对比、未来发展方向等。教程一共有76页。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +7 铜币 +17 收起 理由
飞乌与渔 + 7 + 17 补版规更新前的期刊合集

查看全部评分

回复

使用道具 举报

用户组:童生

      UID
7467
      积分
171
      回帖
67
      主题
1
      发书数
0
      威望
137
      铜币
1708
      贡献
0
      阅读权限
20
      注册时间
2025-3-5
      在线时间
23 小时
      最后登录
2025-5-1
发表于 2025-3-6 09:19 | 显示全部楼层
谢谢分享啊,我想看看了啊。
回复

使用道具 举报

用户组:秀才

      UID
5007
      积分
631
      回帖
921
      主题
1
      发书数
0
      威望
170
      铜币
1937
      贡献
0
      阅读权限
40
      注册时间
2025-3-3
      在线时间
47 小时
      最后登录
2025-5-1
发表于 2025-3-6 09:23 | 显示全部楼层
清华大学出来了文章,马上北京大学的来了啊。
回复

使用道具 举报

用户组:儒士

      UID
7162
      积分
274
      回帖
306
      主题
1
      发书数
0
      威望
120
      铜币
1666
      贡献
0
      阅读权限
30
      注册时间
2025-3-4
      在线时间
25 小时
      最后登录
2025-4-30
发表于 2025-3-8 20:12 | 显示全部楼层
谢谢分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-5-2 04:16 , Processed in 0.064378 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表