475 目标世界第一。(1 / 2)
很快,陈凯就来到了魔都,和苏阳会面。
“苏总,我昨天看了你的招聘视频。”陈凯放下包,开门见山,“一亿年薪,世界第一。我想知道你凭什么说能做到。”
苏阳没有立刻回答。他起身走到办公桌旁,拿起一个银色的u盘,回到沙发边,把u盘放在茶几上,推到陈凯面前。
“这里面是盘古大模型的技术架构概要。不是ppt,不是概念,是可落地的工程方案。你先看。看完再决定要不要聊下去。”
陈凯看着那个小小的u盘,犹豫了一秒,然后拿起它,插进了自己的笔记本电脑。
文件打开。第一页:模型架构——混合专家模型,总参数量两万亿,激活参数量三千亿,上下文长度一百万字。
他的手指顿住了。两万亿参数。目前公开的全球最大模型,参数量也不过一万亿出头。而盘古直接翻倍。更关键的是那个“激活参数量”——这意味着模型虽然庞大,但每次推理只调用部分参数,既保证能力,又控制成本。
他的目光往下扫。推理速度:比现有主流模型快十倍。训练成本:行业平均水平的二十分之一。陈凯的呼吸开始变得急促。
第二页:核心技术——独创的稀疏注意力机制,长文本处理效率提升两个数量级;自研分布式训练框架,万卡集群线性加速;知识截止日期为最新,支持持续更新。
陈凯摘下眼镜,揉了揉眼睛,又重新戴上。这些东西,有些是他和团队在千问尝试过但没做成的,有些是他只在学术论文里见过、从未在工程上实现的,有些甚至是他想都没想过的。
第三页:应用场景。第四页:商业模式。第五页:……
陈凯一页一页地翻,翻到最后一页时,他的手在微微发抖。他抬起头,看着苏阳。苏阳正端着茶杯,不紧不慢地喝着,像在看一场已经知道结局的电影。
“苏总,这些技术方案……是谁做的?”陈凯的声音有些发涩。
苏阳放下茶杯,语气平静:“你不用管谁做的。你只需要回答我——你能不能把它做出来?”
陈凯沉默了很久。他想起在千问的那些日子,每次提出新的技术方案,都要被产品部门质疑“这能赚钱吗”,被管理层质问“竞争对手有没有做”,被财务部门驳回“预算超了”。技术理想在资本面前,一次次退让,一次次妥协。而眼前这个人,给他看了一份足以颠覆整个行业的技术方案,然后问他——你能不能把它做出来。
没有问成本,没有问周期,没有问roi。只问能不能。
“能。”陈凯说。
声音不大,但很坚定。
苏阳点了点头,站起身,走到窗边。阳光透过玻璃照在他的侧脸上,勾勒出一个清晰的轮廓。
“陈博士,我不是做技术的。我不懂算法,不懂模型,不懂训练框架。但我知道一件事——在这个行业里,华夏一直被美国压着。gpt出的时候,我们追;gemini出的时候,我们追;每次都是追。我不想追了。”
他转过身,看着陈凯:“盘古要做,就做世界第一。不是国内第一,是世界第一。你做得到,我给你一切资源。你做不到,我换人做。”
陈凯站起身来,伸出手:“苏总,我做得到。”
苏阳握住他的手,力度不大,但很稳:“那就这么定了。盘古大模型的技术负责人,是你。年薪一亿。团队你来搭,预算你来批。我不干涉你的技术决策。”
陈凯深吸一口气,点了点头。
很快,两人就签订了合同,由陈凯担任盘古大模型的开发负责人。
签约之后的下午,陈凯立马开始忙碌起来。
-->>(本章未完,请点击下一页继续阅读)