小小万事屋

一个似乎什么都想做的网站

前言

表面上看,这个是在问实际经验,但是实际上,这里有一个很重要的前提:Qwen在一代、二代,甚至之后的等版本,都是decoder-only的,这也就从本质上改变了输入数据的格式。

阅读全文 »

前言

也许你一开始就在期待我开始讲什么self-attention。我承认,这已经算是必背科目,甚至算客观题了。

但是,从这个地方开始总归是有点追逐太阳的感觉,越追越累,还追不上。

所以,我们直接从太阳开始出发。

阅读全文 »

前言

这个库是Hexo的一个部分,所以保留了上面这些title之类的玩意儿。

剩下的就是markdown了,内容就是LLM相关的一些面试问题,以及一些好心面试官给的发展建议,算是错题本吧。

阅读全文 »