Menu
首页
搜索
SpringBoot
Vue
Vant
Python
Android
Harmony
InnoDB
BQW_
关注
发信
关注(28)
粉丝(399)
动态
文章
图片
文章
【极速前进】20240706-24240714:用于Agent的树搜、理解LLM的语种困惑、事实知识抽取微调、Quiet-STaR
【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law
【极速前进】20240422:预训练RHO-1、合成数据CodecLM、网页到HTML数据集、MLLM消融实验MM1、Branch-Train-Mix
【自然语言处理】【大模型】BitNet:用1-bit Transformer训练LLM
【自然语言处理】BitNet b1.58:1bit LLM时代
【自然语言处理】【大模型】 ΨPO:一个理解人类偏好学习的统一理论框架
【自然语言处理】【大模型】VeRA:可调参数比LoRA小10倍的低秩微调方法
【自然语言处理】【大模型】赋予大模型使用工具的能力:Toolformer与ART
【自然语言处理】【长文本处理】RMT:能处理长度超过一百万token的Transformer
【深度学习】【分布式训练】DeepSpeed:AllReduce与ZeRO-DP