大语言模型预训练数据
北京大学信息科学技术学院本科毕业,曾任未名超算队队长,并代表学校参加 SC20 国际大学生超算竞赛。
现就职于 DeepSeek-AI(深度求索),研究方向为大语言模型的预训练数据与训练系统。
感谢鹏程哥教我用 Linux,感谢所有的队友们。