昆仑万维蝶变:寻找穿越周期的确定性

最新信息

昆仑万维蝶变:寻找穿越周期的确定性
2024-04-29 13:52:00



  4月23日晚间,昆仑万维(300418.SZ)(以下简称“公司”)披露2023年年度业绩报告。2023年,公司实现营业收入49.2亿元,海外业务收入占比达86.0%,同比提升8.4个百分点;实现归属于上市公司股东的净利润12.6亿元,同比增长9.15%,利润规模继续位居行业前列。
  2024年2月,昆仑万维发布新版MoE大语言模型“天工2.0”,其采用业内顶尖的MoE专家混合模型架构,应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。到了2024年4月17日,“天工”大模型迭代至3.0版本,采用4,000亿参数MOE架构,是目前全球模型参数最大、性能最强的开源MoE模型之一,在MMBench等多项权威多模态测评结果中超越GPT-4V,多项评测指标达到全球领先水平。目前,公司已成为中国首批基于MoE大模型架构搭建大模型的平台企业。
  “天工3.0”MMBench测评表现(表格中Skywork-VL即“天工3.0”大模型)
  关键,这家已经宣布“All in AGI与AIGC”的互联网平台,其实在生成式人工智能这样一个大家都靠烧钱来获得发展优势的行业,哪怕他们横跨了AI大模型、AI搜索、AI游戏、AI音乐等领域,他们的布局都比较稳。
  比如昆仑万维曾于2023年8月推出国内第一款AI搜索产品——天工AI搜索,开创中国AI搜索先河;而2024年4月17日发布新版天工AI智能助手,并拓展了在包括创作、图像、角色对话、学习效率等领域在内的多元智能体生态,精心推出了如AI写作、AI绘画、AI数据分析、AI伴侣等使用频率较高的官方智能体;2023年9月昆仑万维宣布与华为云达成战略合作,还推出了基于华为云昇腾AI云服务打造的“天工大模型端云一体化方案”。
  智能体创建流程展示
  某种程度上讲,这种稳定表现在人工智能这个行业比较少见。
  更有意思的是,财报显示现在昆仑万维是一个不折不扣以AI和大模型为核心的平台企业,而且发展十分迅速且稳健。这就引出一个问题:为什么在不知不觉间,昆仑万维就完成了主营业务的转换,穿越周期找到了长期发展的确定性?
前瞻性是最大的确定性
  一个企业决策实现穿越周期的稳定发展,是一定要找到确定性。但在寻找确定性过程中,具备前瞻性视野并能准确找到准确的方向,其实是最重要的。
  长江商学院管理实践教授、中石化原董事长傅成玉曾在长江商学院授课时指出,不确定性是整个商业世界运转的底层逻辑。这意味着任何企业的发展,归根到底都是在不确定性中寻找确定的内容和发展方向。
  因此,对企业家而言,外界的环境变化是无法估量的,但企业本身的管理与业务落实是可以操作的。
  所以,哪怕是再小的事情,只要坚持不懈地做下去,最终这件事情的意义和对企业的影响就会浮现出来,从而改变外界不确定的环境,进而让其向企业有利发展的方向转化。
  而寻找到可以撬动一切的那个支点,就是企业寻找确定性第一选择。这其实就是寻找前瞻性。
  某种意义上,昆仑万维并不是2023年才开始确定“All in AGI与AIGC”的,他们早在2020年就开始认定AI是方向,就开始推动企业转型。
  2020年,在体验过GPT3.0以后,昆仑万维董事长兼CEO方汉就有个判断,认为内容行业一定会被 AIGC 重新洗牌。他觉得昆仑万维的机会来了,把握这个风口很可能会变成互联网大厂。
  于是,他和创始人周亚辉一道,说服了整个管理团队和董事会,全力以赴投入大模型的研发。也因此,自 2020 年起,昆仑万维从文本大模型做起,陆续做了音乐生成模型和文生图模型等。
  “那时候大家做AI都是BERT路线(Google 最初做大模型的路线),行业里根本没有GPT路线的人,想 ‘套壳’ 都没法套,只能自己搞。” 在最近一次接受媒体采访时,方汉这样表示。
  两年之后,在2022年春节的7天假期里,昆仑万维的核心管理人员聚在一起开战略会,复盘、碰撞、推演,最终明确了一件事——All in AIGC。
  同年12月,ChatGPT 刚上线一个月后,昆仑万维就发布了AIGC模型系列。2023年4月,昆仑万维又发布天工1.0大模型系列。
  就在技术研发过程中,整个技术团队一边推进大模型迭代,一边反思。大家觉得靠现在transformer基层架构的大模型发展可能没前途,因为这是一个需要不断投入巨量资源的过程。关键,这种发展思路不适合昆仑万维
  毕竟,昆仑万维看重经营效率,每一个业务都要衡量“吃水线”,昆仑万维创始人周亚辉甚至一度每个季度都要点数服务器,考察成本。
  接下来,在筛选过各种技术论文后,MoE架构因为投入的可持续以及对于技术等软件资源更看重的特点,被昆仑万维认定是未来大模型的发展方向,并开始将自己的“天工”大模型正式建立在这样的架构基础上。
  当然,2022年出现这样的决策也有外部背景。那段时间腾讯、网易等游戏巨头开始出海,原本以海外游戏业务和搜索业务见长的昆仑万维感受到压力和内卷,迫切需要新的突破口。
  创始人周亚辉为此特意多次跑去硅谷参访几家互联网巨头,在吸收先进经验和思路基础上逐渐理清了昆仑万维的发展思路。接下来这场内部讨论就是顺理成章。
  一开始就坚持这样的技术底层来做模型,表明他们在游戏、搜索方面看到内卷严重的现实后,意识到需要转型。正好相关技术被披露,周总认为是方向,大家讨论后觉得生成式人工智能确实是一个可以确定的方向,就定下来了。
  2023年不管多难,对这个判断没有动摇并不断投入研发,从天工1.0到发布天工智能助手,再到2024年2月发布天工2.0以及4月中旬开启公测的天工3.0,整体上公司的资源和关注度完全转型到这个方向。
  天工大模型的演进过程
  当然,外界变化也说明,昆仑万维早在2022年就作出的这个决策,确实走对了。尤其是最新的天工3.0,采用4000亿参数MOE架构,在MMBench等多项权威多模态测评结果中超越GPT-4V,多项评测指标达到全球领先水平。
  昆仑万维从游戏公司成功转型到AI大模型平台,而且是一个比较成功的平台,其经验表明树立前瞻性,对于企业寻找确定性非常关键。
确定性需要具备洞察力和执行力
  在从前瞻性出发找到发展方向的确定性后,如何从中找出真正的方法和推动最终落地,其实已经成为区分有前景公司和普通公司的前置条件。
  国际管理学大师德鲁克在《成果管理》一书中说过,“心甘情愿地、有目的地去促使未来发生,是伟大的企业与平庸的企业之别”。
  傅成玉教授还将企业家寻找确定性的必要性提升了一个层次,他认为企业家不光要善于在不确定性中发现确定性,还要善于用确定性管理和驾驭不确定性。
  这就需要企业具备洞察力和执行力。
  其实,昆仑万维的决策能力和执行力,在行业有口皆碑。管理团队看到的趋势,技术团队会持续的跟进和落实,并且由于公司决策和实施的扁平化,让这样的优势被不断放大,最终成为在MoE大模型细分领域国内的领军者。
  昆仑万维管理层在一开始准备开发大模型时就研究了谷歌、openai等经验,认为单纯靠资源堆积的大模型开发不可能长久,需要新的发展思路。
  正好MoE技术成熟,2023年天工开始利用这个模型架构开始训练,实现在可控成本下快速提升的模型能力。
  由于这种架构运营的核心,实际上是将大任务分成小任务,日常的训练也是针对于各个小神经网络的专家进行,所以他所需要的推理和训练资源远远低于整体运算的transformer架构。
  关键在于这种架构对技术的理解和使用,切分任务和找到关键神经细分网络并训练专家模型是该架构成功的核心,这需要强大的技术实力。相较于不断增长的硬件投入,这种软性投入对大模型开发者来说更可接受。
  自2023年6月以来,昆仑万维不断针对MoE架构技术最前沿进行研发探索,技术团队更是通过一系列针对性的MoE技术攻关,在投入大量研发训练资源后,最终解决了困扰整个MoE产业的模型不收敛、特定任务泛化效果较差等核心性能问题,使“天工2.0”的模型性能得到显著提升。
  尤其昆仑万维坚持技术与应用并重的发展思路,与许多中小模型开发方不同。这些开发方更倾向于开源模型,通过推动使用和调整训练效果吸引投资。但这种方式存在用户反馈不及时的问题,导致模型调整不够迅速。
  因此,昆仑万维从一开始就采取了模型和应用同步并行的策略。他们建立自己的大模型并不断提升技术水平,同时推出集合超级应用,直接面向用户提供服务,收集用户反馈,促进模型优化和迭代。
  这种方式特别适合MoE大模型的发展,因为该模型需要快速找到使用的细分专家网络和综合信息的门框网络缺陷,通过用户反馈的训练素材来提升模型运行效率。
  关键,“天工智能助手”在MoE架构“天工2.0”模型的支持下,全面升级了AI搜索、对话、阅读、创作的回答质量与响应速度,搭载强大的多模态能力,支持图文对话、文生图等多模态应用,支持最高100K的超长上下文窗口(超过15万个汉字),并新增了AI绘画、数据分析等热门应用,成为关注热度和使用效果最好的AI智能助手之一。
  这种一手抓技术,一手抓应用的模式,对于MoE模型架构在中国的普及才是最有意义的。毕竟任何一种新的技术,无论有多炸裂,只有大量的应用才能对于产业,以及人们的生活带来新的价值。
  2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测。
  “天工3.0”是采用4千亿级参数MoE混合专家模型的全球领先模型之一,并将开源。相较于“天工2.0”,“天工3.0”在语义理解、逻辑推理、通用性、泛化性、不确定性知识和学习能力等领域有显著提升,模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。
  这样的技术路线和发展趋势,恰恰跟现在行业发展方向一致,即表明整个技术管理团队的前瞻眼光,也表明他们脚踏实地的发展路线。
  而昆仑万维经验显示的洞察力和执行力,对一家想转型进而穿越周期的企业来说,非常重要。
未来的确定性来自当下
  想要得到一个可以确定发展的未来,就要做好当下所有能确定的方法和计划,这才是一家企业能穿越周期的真相。
  行业内现在一致认为,在国内MoE模型的排名里,昆仑万维的天工有口皆碑。
  尤其是刚刚开始公测的“天工3.0”,新增了多种功能,如搜索增强、研究模式、调用代码及绘制图表等,并优化了模型的Agent能力,使其能够独立完成复杂任务,如产业分析、产品对比等。同时,“天工3.0”也是全球首个多模态“超级模型”,集成了多种AI能力,如搜索、写作、长文本阅读、对话、语音合成、图片生成、漫画创作、图片识别、音乐生成、代码写作和表格生成等,成为大模型时代的“超级应用”,为用户带来颠覆式的人工智能体验。
  实际上,现在调整到位和技术到位的昆仑万维,在生成式人工智能领域,其实有了自己未来发展的确定性。
  毕竟,在国内国外大模型研发方中,昆仑万维不光一手抓模型训练,一手抓应用,而且还不断通过调整,在MoE基础上不断推动应用层面的落地,建立自己的竞争优势。
  在这个基础上,正在公测的“天工3.0”就成为集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型,更是全球领先的多模态大模型。
  超级模型是大模型时代必然的发展方向,也是昆仑万维天工系列大模型一直以来坚持认定的战略。
  昆仑万维董事长兼CEO方汉表示,“超级模型”是大模型时代发展的必然,未来,行业内将出现不止一个“超级模型”,昆仑万维也将持续朝着这一方向不断努力,持续为用户提供更智能、更高效、更可靠的人工智能服务。
  某种意义上,一家企业如果可以找到发展的确定性就已经可以预见很好的未来,但如果还能找到确定性的落实方法,就为这种确定性未来多加了一层保障。
  摆脱内卷的最好方式就是穿越周期,而穿越周期最好的方法就是从不确定中找到确定性。寻找确定性有自己的方法论,不光要具备前瞻性眼光,还要有洞察力和执行力,并要从当下能落地的每一步认真做起。
  对企业来说,这几点都一样重要,结合起来才能真正确定未来。
  多年前流行过一本书叫《长寿公司》,长寿公司在某种程度上就是一种具有长期主义文化、战略和管理方法的公司。企业家要做一家长期主义的公司,必须对外在环境的变化极其敏感,也就是说能够在热闹场中感受到某种寒凉的东西,在冷酷的现实里头感受到某种温度和能量,并且快速地采取行动。
  国际管理学大师德鲁克在《成果管理》一书中说过,“心甘情愿地、有目的地去促使未来发生,是伟大的企业与平庸的企业之别”。
  从这点看,昆仑万维就走在一条正确的路上,而且越走越顺。
(文章来源:上海证券报)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

昆仑万维蝶变:寻找穿越周期的确定性

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml