第623章 前世的终局与今生的起手-《高二分科,我选校花也选亿万身家》


    第(3/3)页

    团队散伙那天,核心算法工程师把工牌放在会议桌上,什么都没说,转身走了。

    门没关严,走廊里传来的声音很轻,但顾屿听得清清楚楚。

    2025年春天,公司清算完毕。

    他在锦城的出租屋里,盯着天花板上那道裂缝,想了很久很久。

    然后他重生了。

    所以他对AI这条路的理解,从来不是什么“前瞻性预判”。

    他是亲手走过那条路上的每一步,踩过每一个坑,最后被终局的浪头拍死的人。

    他知道训练大模型时候学习率该怎么调。

    知道RLHF的人类反馈强化学习有多少坑。

    知道MOE的路由策略为什么能把成本打下来。

    这些知识是他的武器,也是他的伤疤。

    前世他死在三件事上:起步太晚,资本不够,算力受制于人。

    这一世,全都翻过来了。

    雅安基地的算力,够。

    百亿级的资金储备,够。

    任少卿加九章团队的人才密度,够。

    而任少卿刚才摆在他面前的这份残差网络实验数据,证明了一件更关键的事情:

    这个时代的硬件和人才,已经具备了从卷积神经网络向更通用架构跃迁的基础条件。

    前世,全世界花了整整三年,才从2014年注意力机制的萌芽走到2017年TranSfOrmer论文的发表。

    但这一世,他不打算走硅谷那条“有钱就是任性”的老路了。

    不堆参数,不烧天价算力,不做那头笨重的大猪。

    他要走DeepSeek的路。

    用最少的资源,做最聪明的架构。

    让模型学会自己选择、自己推理、自己纠错。

    用MOE让参数按需激活,用极致的工程优化把每一滴算力都拧干。

    前世DeepSeek做到了,但它来得太晚,他的公司已经死了。

    这辈子,他要自己做这件事。

    从头做。

    顾屿缓慢地睁开眼睛,视线重新聚焦在屏幕上那条安静攀升的精度曲线上。

    任少卿还在旁边等着他的反应,大概以为老板在思考学术问题。

    “少卿。”

    顾屿的声音恢复了一贯的云淡风轻。

    “在。”

    “这个东西,你准备叫什么名字?”

    任少卿想了想:

    “残差网络。ReSidUalNetWOrk。简称ReSNet。”

    顾屿点了点头。

    然后他把椅子往前拉了拉,双手交叠放在桌面上,目光落在任少卿脸上。

    “论文的事我们待会儿再聊。我先问你一个问题。”

    “你说。”

    “卷积神经网络,本质上在做什么?”

      


    第(3/3)页