欢迎光临24券省钱助手!免费领取淘宝优惠券、天猫优惠券、京东优惠券、拼多多优惠券、饿了么红包、口碑红包、天猫超市优惠券!
24券省钱助手
  • 搜淘宝
  • 搜京东
  • 搜拼多多
微信扫一扫

关注微信公众号
查券更方便


当当网 大模型算法:强化学习、微调与对齐 详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践
当当网 大模型算法:强化学习、微调与对齐 详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践
65.4元¥75.4预计返¥ 0.3110元券
活动结束时间:01-29 23:59 累计销量 :

手机淘宝扫码领券购买

  • 商品详情
  • 特别推荐
原价¥17.4800
14.4
原价¥20.98000
19.9
原价¥34.127万
29.12
原价¥79.91000
29.9
原价¥99300
89
原价¥25.282万
15.28
原价¥32.4100
28.4
原价¥81.91000
59.9
原价¥23.954万
10.95
原价¥20.121
17.1
原价¥14.823
7.8