每个人都能看懂的大模型知识分享,LLMs春/秋招大模型面试前必看,让你和面试官侃侃而谈
00-序-AGI之路3个子项
assest2个子项
大家都谈的ScalingLaw是什么6个子项
智能涌现和AGI的起源7个子项
01-第一章-预训练50个子项
assest43个子项
10分钟了解什么是多模态大模型(Multimodal LLMs)6个子项
10分钟搞清楚为什么Transformer中使用LayerNorm而不是BatchNorm4个子项
FlashAttention v2相比于v1有哪些更新?5个子项
为什么会发展出Multi Query Attention和Group Query Attention1个子项
为什么大型语言模型都在使用 SwiGLU 作为激活函数?5个子项
什么是perplexity3个子项
什么是大模型的位置编码Position Encoding10个子项
从欧拉公式的美到旋转位置编码RoPE20个子项
复变函数在大模型位置编码中的应用7个子项
大模型分布式训练并行技术(一)概述5个子项
大模型分布式训练并行技术(三)流水线并行3个子项
大模型分布式训练并行技术(二)数据并行2个子项
大模型分布式训练并行技术(五)混合并行3个子项
大模型分布式训练并行技术(四)张量并行4个子项
大模型并行策略[中文翻译]11个子项
大模型训练框架(一):综述4个子项
大模型训练框架(三)DeepSpeed3个子项
大模型训练框架(二)FSDP3个子项
大模型训练框架(五)Accelerate4个子项
大模型训练框架(四)Megatron-LM3个子项
搞懂大模型的分词器(一)2个子项
搞懂大模型的分词器(三)2个子项
搞懂大模型的分词器(二)2个子项
搞懂大模型的分词器(五)2个子项
搞懂大模型的分词器(六)2个子项
搞懂大模型的分词器(四)2个子项
最简单的方式理解Mamba(中文翻译)17个子项
最美的数学公式-欧拉公式2个子项
混合专家模型 (MoE) 详解(节选)6个子项
看懂FlashAttention需要的数学储备是?高考数学最后一道大题!18个子项
神经网络的优化器(一)概述5个子项
神经网络的优化器(七)AdaDelta1个子项
神经网络的优化器(三)Momentum2个子项
神经网络的优化器(九)Adam1个子项
神经网络的优化器(二)SGD3个子项
神经网络的优化器(五)Rprop1个子项
神经网络的优化器(八)RMSprop1个子项
神经网络的优化器(六)AdaGrad1个子项
神经网络的优化器(十一)AdamW1个子项
神经网络的优化器(十二)RAdam1个子项
神经网络的优化器(十)Nadam1个子项
神经网络的优化器(四)ASGD2个子项
神经网络的激活函数19个子项
02-第二章-部署与推理12个子项
assest
03-第三章-微调14个子项
assest
04-第四章-量化2个子项
assest
05-第五章-显卡与并行2个子项
assest
06-第六章-Prompt Engineering4个子项
assest
07-第七章-Agent9个子项
assest
08-第八章-大模型企业落地7个子项
assest
09-第九章-评估指标4个子项
assest
10-第十章-热点4个子项
assest
11-第十一章-数学2个子项
calculus3个子项
assest
linear-algebra6个子项
assest
ReAct1个子项
draft3个子项
AssertForCommonUse2个子项
assest
md4个子项
math1个子项
Probability&Statistics3个子项
pic
点赞
回复