阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 350|回复: 6

[科技、报告] 《DeepSeek-R1及类强推理模型开发解读》作者:北京大学 陈博远【PDF】

[复制链接]

用户组:举人

重建论坛勋章

      UID
251
      积分
1146
      回帖
32
      主题
104
      发书数
103
      威望
975
      铜币
6952
      贡献
0
      阅读权限
50
      注册时间
2025-3-1
      在线时间
135 小时
      最后登录
2025-12-16
发表于 2025-3-5 10:25 | 显示全部楼层 |阅读模式




DeepSeek-R1及类强推理模型开发的解读,由北京大学的陈博远撰写。主要内容涉及模型的技术架构、强化学习(RL)的应用、与其他技术的对比、未来发展方向等。教程一共有76页。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +7 铜币 +17 收起 理由
飞乌与渔 + 7 + 17 补版规更新前的期刊合集

查看全部评分

回复

使用道具 举报

用户组:儒士

      UID
7467
      积分
470
      回帖
355
      主题
1
      发书数
0
      威望
292
      铜币
329
      贡献
0
      阅读权限
30
      注册时间
2025-3-5
      在线时间
118 小时
      最后登录
2025-12-16
发表于 2025-3-6 09:19 | 显示全部楼层
谢谢分享啊,我想看看了啊。
回复

使用道具 举报

用户组:贡士

      UID
5007
      积分
3004
      回帖
5139
      主题
1
      发书数
0
      威望
434
      铜币
2016
      贡献
0
      阅读权限
60
      注册时间
2025-3-3
      在线时间
219 小时
      最后登录
2025-12-16
发表于 2025-3-6 09:23 | 显示全部楼层
清华大学出来了文章,马上北京大学的来了啊。
回复

使用道具 举报

用户组:秀才

      UID
7162
      积分
511
      回帖
582
      主题
1
      发书数
0
      威望
219
      铜币
2069
      贡献
0
      阅读权限
40
      注册时间
2025-3-4
      在线时间
67 小时
      最后登录
2025-12-16
发表于 2025-3-8 20:12 | 显示全部楼层
谢谢分享!
回复

使用道具 举报

用户组:管理员

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章管理员勋章

      UID
5
      积分
160298
      回帖
23736
      主题
17538
      发书数
17523
      威望
119738
      铜币
429049
      贡献
2400
      阅读权限
200
      注册时间
2025-2-27
      在线时间
1707 小时
      最后登录
2025-12-16
发表于 2025-5-27 10:39 | 显示全部楼层
感觉已经比较专业了,对于这个我就是比较茫然了~
回复

使用道具 举报

用户组:贡士

重建论坛勋章

      UID
17104
      积分
2339
      回帖
2021
      主题
210
      发书数
201
      威望
1022
      铜币
12797
      贡献
0
      阅读权限
60
      注册时间
2025-5-10
      在线时间
198 小时
      最后登录
2025-12-16
发表于 2025-5-28 11:23 | 显示全部楼层
AI时代,想给孩子找到一个有前途的专业方向可不容易了,很多行业都会受到AI的影响,都说要学会有AI工具,可是AI本身也在迭代进化,总有一天,AI加机器人,人类大概能实现真正的共产主义吧,又或者像终结者那样被机器人消灭。
[发帖际遇]: 破碎信仰 被外星人绑架,赔偿 3 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

用户组:翰林

灌水王者

      UID
1376
      积分
17109
      回帖
30805
      主题
14
      发书数
0
      威望
1699
      铜币
39750
      贡献
0
      阅读权限
80
      注册时间
2025-3-1
      在线时间
1349 小时
      最后登录
2025-12-16
发表于 2025-6-11 03:38 | 显示全部楼层
北大另外一个项目组的研究课题了。不过DeepSeek-R1出了那么久了,R2迟迟未到,估计团队内部有些不可言的事情~~~
[发帖际遇]: wkpartner 经过了千辛万苦,捕捉了一只楼主,获得奖励 4 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-16 17:18 , Processed in 0.123077 second(s), 32 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表