[中报]昆仑万维(300418):2024年半年度报告摘要

时间:2024年08月23日 22:11:51 中财网
原标题:昆仑万维:2024年半年度报告摘要

证券代码:300418 证券简称:昆仑万维 公告编号:2024-059
昆仑万维科技股份有限公司
2024年半年度报告摘要

一、重要提示
本半年度报告摘要来自半年度报告全文,为全面了解本公司的经营成果、财务状况及未来发展规划,投资者应当到证监会指定媒体仔细阅读半年度报告全文。

所有董事均已出席了审议本报告的董事会会议。

非标准审计意见提示
□适用 ?不适用
董事会审议的报告期利润分配预案或公积金转增股本预案
□适用 ?不适用
公司计划不派发现金红利,不送红股,不以公积金转增股本。

董事会决议通过的本报告期优先股利润分配预案
□适用 ?不适用
二、公司基本情况
1、公司简介

股票简称昆仑万维股票代码300418
股票上市交易所深圳证券交易所  
联系人和联系方式董事会秘书证券事务代表 
姓名吕杰刘娟 
电话010-65210366010-65210366 
办公地址北京市东城区西总布胡同46号明阳国 际中心B座北京市东城区西总布胡同46号明阳国 际中心B座 
电子信箱[email protected][email protected] 
2、主要会计数据和财务指标
公司是否需追溯调整或重述以前年度会计数据
□是 ?否

 本报告期上年同期本报告期比上年同期 增减
营业收入(元)2,501,811,162.322,425,229,544.833.16%
归属于上市公司股东的净利润(元)-389,136,070.45358,189,359.72-208.64%
归属于上市公司股东的扣除非经常性损益的净 利润(元)-407,394,274.63311,942,472.00-230.60%
经营活动产生的现金流量净额(元)189,088,081.19533,113,423.95-64.53%
基本每股收益(元/股)-0.320.30-206.67%
 本报告期上年同期本报告期比上年同期 增减
稀释每股收益(元/股)-0.310.29-206.90%
加权平均净资产收益率-2.58%2.74%-5.32%
 本报告期末上年度末本报告期末比上年度 末增减
总资产(元)21,039,773,543.6021,484,962,358.21-2.07%
归属于上市公司股东的净资产(元)15,093,299,461.4815,174,349,421.64-0.53%
3、公司股东数量及持股情况
单位:股

报告期末普通股股东 总数138,696报告期末表决 权恢复的优先 股股东总数 (如有)0持有特别 表决权股 份的股东 总数(如 有)0 
前10名股东持股情况(不含通过转融通出借股份)      
股东名称股东性质持股比例持股数量持有有限售条 件的股份数量质押、标记或冻结情况 
     股份状态数量
新余盈瑞世纪软件研发 中心(有限合伙)境内非国有法 人15.41%189,744,9430不适用0
周亚辉境内自然人11.76%144,844,3250质押200,000
李琼境内自然人7.82%96,341,4350不适用0
中国民生银行股份有限 公司-华夏中证动漫游 戏交易型开放式指数证 券投资基金其他1.92%23,633,3460不适用0
香港中央结算有限公司境外法人1.78%21,908,7840不适用0
中国工商银行股份有限 公司-易方达创业板交 易型开放式指数证券投 资基金其他1.31%16,116,9550不适用0
#毛金明境内自然人1.25%15,389,8030不适用0
中国工商银行股份有限 公司-华泰柏瑞沪深 300交易型开放式指数 证券投资基金其他0.82%10,120,7000不适用0
#毛英俊境内自然人0.74%9,161,0000不适用0
上海浦东发展银行股份 有限公司-国泰中证动 漫游戏交易型开放式指 数证券投资基金其他0.59%7,242,9830不适用0
上述股东关联关系或一致行动的说明股东周亚辉及新余盈瑞世纪软件研发中心(有限合伙)为一致行动人。     
前10名普通股股东参与融资融券业务股 东情况说明(如有)股东毛金明通过国泰君安证券股份有限公司客户信用交易担保证券账户持 有 15,389,803 股,通过普通证券账户持有 0 股,合计持有 15,389,803 股。 股东毛英俊通过广发证券股份有限公司客户信用交易担保证券账户持有 9,161,000股,通过普通证券账户持有0股,合计持有9,161,000股。     
持股5%以上股东、前10名股东及前10名无限售流通股股东参与转融通业务出借股份情况 单位:股

持股5%以上股东、前10名股东及前10名无限售流通股股东参与转融通业务出借股份情况        
股东名称 (全称)期初普通账户、信用账 户持股 期初转融通出借股份且 尚未归还 期末普通账户、信用账 户持股 期末转融通出借股份且 尚未归还 
 数量合计占总股本 的比例数量合计占总股本 的比例数量合计占总股本 的比例数量合计占总股本 的比例
上海浦东 发展银行 股份有限 公司-国 泰中证动 漫游戏交 易型开放 式指数证 券投资基 金5,292,3330.44%00.00%7,242,9830.59%1,284,7000.10%
中国民生 银行股份 有限公司 -华夏中 证动漫游 戏交易型 开放式指 数证券投 资基金16,702,16 71.37%1,441,0000.12%23,633,3461.92%406,9000.03%
中国工商 银行股份 有限公司 -易方达 创业板交 易型开放 式指数证 券投资基 金15,965,94 61.31%1,048,0000.09%16,116,9551.31%812,4000.07%
前10名股东及前10名无限售流通股股东因转融通出借/归还原因导致较上期发生变化 ?适用 □不适用
单位:股

前10名股东及前10名无限售流通股股东因转融通出借/归还原因导致较上期发生变化情况     
股东名称(全称)本报告期新 增/退出期末转融通出借股份且尚未归还 数量 期末股东普通账户、信用账户持股及 转融通出借股份且尚未归还的股份数 量 
  数量合计占总股本的比例数量合计占总股本的比例
中国建设银行股份有限公 司-华安创业板50交易型 开放式指数证券投资基金退出00.00%6,710,6950.54%
中国农业银行股份有限公 司-中证500交易型开放 式指数证券投资基金退出00.00%00.00%
上海浦东发展银行股份有 限公司-国泰中证动漫游 戏交易型开放式指数证券 投资基金新增1,284,7000.10%8,527,6830.69%
公司是否具有表决权差异安排
□是 ?否
4、控股股东或实际控制人变更情况
控股股东报告期内变更
□适用 ?不适用
公司报告期控股股东未发生变更。

实际控制人报告期内变更
□适用 ?不适用
公司报告期实际控制人未发生变更。

5、公司优先股股东总数及前10名优先股股东持股情况表
公司报告期无优先股股东持股情况。

6、在半年度报告批准报出日存续的债券情况
□适用 ?不适用
三、重要事项
报告期内经营业绩情况:
本报告期,公司实现营业总收入25.02亿元,同比增长3.16%。整体毛利率达78.20%,继续保持在较高水平。公司出海步伐再加速,海外业务收入规模达22.05 亿元,同比增长9.02%,占总收入比重达88.16%,公司以 AI 技术助力产品成功出海,赢得全球市场广泛认可。本报告期,公司继续坚定践行“All in AGI 与 AIGC”发展战略,持续加大研发投入,上半年公司研发费用为 7.57 亿元,同比增长115.72%。

本报告期,受资本市场波动下行影响,公司投资业务短期承压,导致归属于上市公司股东净利润转负,在不考虑投资业务影响下,公司亏损幅度将大幅收窄。目前公司 AI 应用加速落地,商业化进程顺利开展,我们相信AI业务将成为公司新的增长引擎,为股东创造长期价值。

AI 应用的渗透是一个渐进的过程,要大规模产生收入及利润,可能还需要 1-2 年的过程,但这一时间点必定到来。当前对于公司而言,我们需要做到的是一直在第一梯队,确保在技术创新和市场应用上保持领先位置。目前公司AI应用加速落地,商业化进程顺利开展,我们相信AI业务将成为公司新的增长引擎,为股东创造长期价值。


报告期内公司主要业务:
1、AGI与AIGC业务板块
昆仑万维是中国领先的人工智能科技公司,现已完成“算力基础设施—大模型算法—AI 应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI 社交、AI短剧组成的多元AI业务矩阵。

本报告期,公司在基座大模型迭代、AI应用发展、商业化变现,三大维度均取得显著进展。

基座大模型侧,公司坚持技术创新,对文本大模型、多模态图文大模型、音乐大模型、3D 大模型、视频大模型进行了全面升级,在性能上均达到行业领先水平,为用户带来前所未有的智能体验。

AI 应用侧,公司多款产品在全球范围内成功落地。报告期内,天工 AI 智能助手日活跃用户(DAU)突破 100 万;截至报告期末,AI 社交产品 Linky 日活跃用户(DAU)突破 50 万;AI 游戏产品《Club Koala》开启 Alpha 测试;AI 音乐方向,2024 年 8 月,公司推出了全球首款 AI 流媒体音乐平台Melodio和AI音乐创作平台Mureka;AI短剧平台SkyReels于2024年 8月19日正式发布。

商业化侧,天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台、直播平台、教育公司、物业公司等达成商务合作,实现商业化收入。公司海内外 C 端 AI 应用也在加速商业化进程,反哺业务发展。

此外,公司旗下艾捷科芯在研的 AI 大算力芯片项目进展顺利。艾捷科芯致力于推动算力芯片技术的突破,为人工智能、数据中心和高性能计算等领域提供强有力的硬件支持。我们将继续加强研发力度,为实现芯片技术的自主可控贡献力量。


1.1 AI大模型
公司 AI 大模型布局覆盖天工基座大模型及四大关键垂类模型。具体来说包括语言大模型、多模态图文大模型、音乐大模型、3D大模型及视频大模型。

报告期内,公司持续迭代升级天工大模型。2024年4月17日,正式发布采用业内顶尖MoE专家混合模型架构,并拥有 4000 亿参数的大语言模型“天工 3.0”,相较传统大模型,其复杂任务处理能力更强、响应速度更快、训练及推理效率更高、可扩展性也更强。通过MoE架构,模型可以将一个复杂的问题分解成多个更小、更易于管理的子问题,并由不同的专家网络分别处理,显著提升了模型训练与推理的性能和效率。相较于“天工 2.0”,新模型各方面性能又一次实现飞跃,“天工 3.0”不仅在语义20%的提升,数学、推理、代码和文创能力更是提升超过30%。 多模态图文大模型方面,公司通过多流结构中多视觉编码器的融合方案,将文本信息与图像特性进 行融合,得到的文本图像特征可以被应用到视觉问答、图像描述生成等不同的多模态任务中,从而实现 图文内容的理解和推理。在训练过程中,利用不同的数据和策略来训练图文模型的各个模块,以快速高 效实现预训练图像模型和语言模型的对齐和升级。该模型以其卓越的图像识别、处理和生成能力,结合 深度文本理解,为用户提供了高效、个性化的使用体验。其不仅能精准执行任务,还能创造性地满足用 户需求,适用于广告、艺术、教育等多个领域。 昆仑万维多模态大模型Skywork-MM架构

音乐大模型方面,公司推出了国内首款公开可用的 AI 音乐 SOTA 模型——“天工 SkyMusic”。该模型采用先进的Large-scale Transformer和Diffusion Transformer技术,能够生成高质量、具有自然人声和丰富情感表达的双声道立体声音乐,还能够根据用户输入的歌词风格定制歌曲,支持多样的音乐风格,并具备学习颤音、歌剧等歌唱技巧的能力,实现情感丰沛的音乐表达。“天工 SkyMusic”有效降低用户创作门槛,一经推出便收获广泛好评。目前,公司天工 SkyMusic 已迭代至 2.0 版本,相较于上一代模型,SkyMusic 2.0 能够支持长达 6分钟的 44,100Hz采样率双声道立体声歌曲,并支持 500字以上的歌词输入,确保了音乐作品的旋律流畅性和结构完整性。同时,SkyMusic 2.0 在音乐旋律质量、伴奏质量、配器丰富度、音乐结构性和混音质量等维度均有大幅提升,在人声音质、人声自然度和发声可懂度上维持业内领先的SOTA水平。

天工SkyMusic代际对比及架构示意图

3D大模型方面,公司技术团队设计了基于DiT架构的混合生成方案,充分利用了原生3D生成和2D升维生成各自的优势。具体来讲,针对几何生成,设计了基于 DiT 架构的端到端生成模型,实现文生3D 几何和图生3D 几何;另一方面,针对贴图生成,区别于市面常见的多视角生成算法,设计了渐进式的多视角生成算法,在几何一致性上有显著提升,然后基于这些视角图片即可生成高质量贴图。经过多次版本迭代,公司3D生成大模型已达到行业领先水平,并已在多个内部AI游戏项目中得到应用。

视频大模型方面,公司采用 3DCausalVAE 加 3D-DiT 的领先架构,使得模型能够高效地解析视频数据中的多维度信息,包括场景、动作、音频等关键要素,从而实现更为精准的视频内容识别与推理。与此同时,该模型还具备出色的生成和编辑功能。模型能够在潜在空间中灵活操控视频内容,实现高质量的视频生成、风格迁移和内容插帧等任务。这些功能为视频创作者和编辑人员提供了强大的创作工具和编辑手段,极大地丰富了视频内容的多样性和创造性。


1.2 AI搜索
本报告期,随着天工大模型更新到 3.0 版本,公司在“天工 AI 搜索”的基础上,进一步完善产品功能,并发布最新版天工AI智能助手。新版助手集成了多轮搜索、图表绘制、研究模式等AI能力,提供了一个全面、高效的 AI 生产力工具。它的多轮搜索与综合工具调用能力,使得模型能够独立规划、调用、组合外部工具及整合信息,完成复杂的用户需求。


天工AI智能助手展示 新版助手还打造了一个强大的智能体平台,目前,天工 AI 智能体平台已拥有近百万个官方及 UGC 智能体,涵盖学习效率、研究分析、生活娱乐等多个方面。例如备受用户青睐的 AI PPT 智能体,用户 仅需简明扼要地提出 PPT 的内容需求,智能体便能够迅速响应,在线生成一份结构完整、可编辑的 PPT 大纲以及详尽的各页内容。此功能不仅实现了智能化的图片检索和模板匹配,还能一键打造出内容充实、 逻辑连贯、设计精美的PPT文档。用户可以选择在线编辑,或将文档下载至本地进行个性化的调整和分 享。 报告期内,天工AI智能助手日活跃用户(DAU)突破100万,商业化进展顺利,为平台的持续发展 奠定了坚实基础。 AI PPT智能体展示

公司目前有包括《Club Koala》、《Project G7》在内的数款AI游戏处于研发过程当中。

《Club Koala》是一款基于 AI 打造的 UGC 社交游戏,游戏内部可以分成商业区、游乐区和私人区三大部分,能够为不同游戏乐趣的玩家提供个性化游戏体验。游乐区中,我们为玩家提供了赛车、跑酷、生存等数百种不同类型的小游戏。与此同时,我们还为用户提供了功能强大、上手简单的 AI 游戏编辑器,用户可以轻松将自己脑海中的游戏创意变成现实。商业区中,我们提供了各类公共设施,并构建完善的社交机制,让玩家可以在其中结交志同道合的朋友,也可以去彼此的庄园中造访。在此基础上,玩家还可以购置小岛来建设自己专属的私人庄园,并在其中进行耕种、采摘、钓鱼等活动。与此同时,游戏中还配有大量性格、功能各异的AI NPC,玩家可以与其开启一段独一无二的奇特故事。

《Club Koala》旨在成为全球玩家的大型线上游乐园,为玩家提供全方位的娱乐和社交体验。产品前期在各类线下游戏展会及Discord社区中广受好评。《Club Koala》已于本报告期顺利开启Alpha测试,预计于2024年10月开启Beta版测试。

《Project G7》是一款基于 AI 打造的 UGC开放世界 RPG 游戏,游戏以风格化美术设计、自由探索的开放世界、AI 驱动的剧情和编辑器、以及先进的人物社交系统为核心,构建了三大主要玩法。首先,玩家可以自由探索广阔的城镇,体验驾驶、射击、格斗等多样化的交互方式。其次,Project G7 集成了丰富的社交玩法,通过 RP Agent 技术赋予 NPC以人格和灵魂,实现与玩家的深度互动。此外,游戏支持UGC创作,鼓励玩家分享和展示自己创作的剧情和故事,实现内容的长期供给和沉淀。


1.4 AI音乐
公司依托天工SkyMusic模型的强大能力,面向海内外市场推出多款AI音乐产品,以满足不同用户的使用需求。

在国内,面向 C 端用户,我们推出了天工音乐服务,用户仅需进入新版天工 AI 助手的音乐频道,输入歌曲名称和歌词(或借助AI辅助生成),并选择一首参考曲目设定风格(或是由AI智能匹配),之后“天工SkyMusic”便能自动完成谱曲和混音,创作出个性化的 AI 音乐作品。整个创作流程简单直观,用户可以轻松下载、分享自己的专属歌曲,享受前沿音乐创作技术,挥洒创意,自由表达。


天工音乐功能展示 在海外,2024 年8 月14 日,昆仑万维正式发布搭载全新自研音乐大模型 SkyMusic 2.0 的全球首 个 AI流媒体音乐平台 Melodio与 AI 音乐商用创作平台 Mureka,为用户提供更加丰富和个性化的音乐 体验。 Melodio 是全球首款个性化 AI 流媒体音乐平台,用户只需根据所处场景或即时心情输入提示词, Melodio 便将持续生成相应风格的定制化无限流式音乐、满足用户个性化情绪表达。用户还可以随时通 过简单的指令来调整音乐生成,并对喜欢的片段进行保存、分享满足其社交需求。此外,Melodio 还提 供了动态的音乐可视化功能,使用户在享受音乐的同时,也能通过视觉感受音乐的独特律动。 Melodio产品展示
Mureka 是公司面向海外推出的革命性的 AI 音乐商用创作平台。它不仅为专业艺术家和音乐爱好者 提供了一个共同的舞台,还通过其独特的商业模式,为音乐创作和商业化开辟了全新道路。Mureka 能 够根据用户输入的歌词和音乐风格偏好,生成具有高度稳定性和可控性的原创音乐,并利用Style功能 来定制音乐风格。Mureka 的智能算法支持对前奏、主歌、副歌等各个段落的精细调整,确保每首作品 都能完美符合创作者的灵感表达。 Mureka创作界面展示

Mureka 创新的商业模式保证了平台的活力和可持续性。用户在 Mureka 平台上的每一次创作,都需要通过消耗积分来完成。这些积分不仅是用户对平台的贡献,更是他们作品价值的直接体现。当用户完成创作后,可以下载创作证明,并申请在 Mureka 商店中进行展示出售,吸引潜在的买家和听众。除了出售自己的作品,用户还可以在 Mureka 商店购买各种音乐素材,如伴奏和分轨音频等,以进一步丰富和完善音乐作品。而每当用户通过平台出售歌曲获得收益时,Mureka 会按照合理的既定比例进行抽佣。

通过这种方式,Mureka 确保了平台、创作者和消费者之间的利益平衡,促进了整个音乐创作生态的健康发展。

Mureka商业化展示

1.5 AI社交
Linky 是昆仑万维面向海外市场推出的新一代 AI 社交产品,致力于通过角色扮演互动和内容消费,为用户提供高质量的情绪价值和内容价值,带来前所未有的社交体验。Linky 已经成功构建了一个 UGC人设生态闭环,日均UGC内容达到上万条,涵盖了丰富的剧情NPC及人设内容。这一生态不仅为用户带来了多样化的角色扮演选择,还通过商业化分成体系激励用户持续提升内容质量,确保了平台的活力和持续发展。在技术方面,Linky 的角色大模型和故事大模型能够标签化一键组装大纲剧情和长短篇故事,与用户进行持久的角色扮演互动。目前,产品在App内整合了故事、剧本创作和聊天互动功能,支持用户一键生成 Chat 剧本。在人设一致性、长文本记忆、剧情丰富性等方面,Linky 均达到了业内领先水平,为用户提供了更加真实、沉浸式、个性化的社交娱乐体验。

Linky 作为一款全球领先的 AI 社交产品,商业化进展显著,尤其在发达国家和地区表现卓越。报告期内,Linky 日活跃用户(DAU)突破50万,用户粘性极强。



AI社交产品Linky功能展示

1.6 AI短剧
2024年8月,我们推出了全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。通过引入先进的 AI 技术,我们大幅简化了剧本创作流程,提高了内容生产的效率和质量,为用户提供了一个从创意构思到视觉呈现的一站式解决方案。SkyReels平台集成了昆仑万维自研剧本大模型SkyScript、自研分镜大模型 StoryboardGen、自研 3D生成大模型 Sky3DGen、以及业界首个将AI 3D 引擎与视频大模型深度融合的创新平台 WorldEngine。剧本模型是 AI 短剧创作的起点,通过智能分析用户输入的标签化选项,快速组装出符合用户需求的剧情框架。剧本模型亦支持高级剧情大纲输入,能够根据用户给出的大纲自动生成跌宕起伏、引人入胜的剧情内容。此外,模型还支持已有剧本的自动整理与润色,提高创作效率。而分镜模型是将剧本转化为视觉画面的关键环节。模型根据剧本内容和情感走向,智能规划分镜设计,生成分镜图片和对应的文字脚本并自动匹配最合适的镜头语言和视角。分镜模型的智能分析能力,确保了每一帧画面都能够精准传达剧情的情感和张力。同时,用户还可以自由调整分镜、镜头角度、运镜方式等参数,以确保创意的精确呈现。最后视频生成模型是 AI 短剧系统的最终输出环节。

它负责将分镜设计转化为实际的视频内容,通过匹配视频模板和应用先进的图像处理技术,创作出视觉效果出众的短剧。这一模型不仅能够保证视频内容的高质量,还能够根据用户的反馈进行实时调整,确保最终作品能够满足用户的期待。

目前SkyReels已支持1080P 60帧的高清视频输出,单次可生成视频长度达180秒,视频生成后用户可一键整合所有创作成果,并可快速导出和分享。平台还支持多种格式下载,方便用户后期编辑,推动“一人一剧”时代加速来临。


1.7 AI普惠生态建设
本报告期,公司继续坚定履行承诺,通过发布和开源多项技术,进一步推动生态建设。报告期内, 昆仑万维与新加坡国立大学、新加坡南洋理工大学团队联合发布了 Vitron 通用像素级视觉多模态大语 言模型。Vitron 支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了图像/视频 模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑等任务的像素 级通用视觉多模态大模型,为下一代通用视觉大模型的终极形态奠定了基础。 Vitron框架示意图

公司在报告期内开源了千亿参数级稀疏大模型Skywork-MoE。这是首个完整应用 MoE Upcycling技术并落地的千亿参数级开源 MoE 大模型,也是首个支持用单台 4090 服务器完成推理的千亿参数级开源MoE大模型。Skywork-MoE模型的总参数量为146B,激活参数量22B,共有16个Expert,每个Expert大小为13B,每次激活其中的2个Expert。在显著提升了模型的推理效率和泛化能力的同时,Skywork-MoE的推理成本有近3倍的下降,大幅降低了使用门槛。






Skywork-MoE测评表现 此外,昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等机构,提出了通 用计算机控制框架 Cradle,使 AI Agent无需训练便能像人一样直接控制键盘鼠标,实现任意开闭源软 件交互。Cradle 在进行复杂任务的连续执行和长程规划决策中表现出色,极大地扩展了智能体的交互 范围。 Cradle框架示意图

昆仑万维还开源了用于Diffusion的新架构Dimba,其融合了Transformer和Mamba的混合架构,创造出独特的Dimba块。Dimba通过交替堆叠Transformer和Mamba层,并结合跨注意力层来集成条件 信息,优化了图像生成的质量和效率。项目团队采用了高效的数据集构建策略和先进的训练方法,包括 质量调优技术和分辨率适应策略,显著提升了图像美感和质量。此外,Dimba 的设计灵活性支持针对不 同资源约束和目标场景的定制,实现了在保持高性能的同时减少内存占用。 Dimba模型架构示意图

同时,作为国内领先的人工智能企业,昆仑万维积极响应国家号召,致力于推动人工智能技术的普惠化发展。公司通过校园公益行动,为师生提供AI知识培训和实践操作,激发学生们对AI技术的兴趣和探索欲望。昆仑万维还联合众谷公益,为偏远山区儿童带来AI系列公益课程,让338所学校的17万师生享受到AI教育,缩小城乡教育差距。

此外,面对 OpenAI 封锁的挑战,昆仑万维迅速推出“一键搬家计划”,助力开发者无缝迁移至国内大模型,并提供 1.5亿 Tokens的 API调用资源。公司还提供专属迁移服务技术支持,包括最新模型能力体验、备案培训及辅助等,确保开发者顺利过渡,支持我国人工智能行业创新发展。


2、海外信息分发与元宇宙业务板块
根据 Opera 2024年第二季度报告,2024 年上半年,Opera实现营业收入 2亿美元,同比增长 17%; 实现经调整后 EBITDA 5,152万美元,同比增长 22%。截至 2024年第二季度,Opera 全球月活跃用户达 3亿,同时得益于高ARPU地区用户的持续增长,2024年第二季度Opera年化ARPU达1.5美元,同比增 长25%。 报告期内,Opera 继续引领 AI 浏览器革新,启动“AI Feature Drops”计划,推出一系列创新功 能。首先,是“Ask Aria”,它允许用户在浏览网页时通过高亮文本并询问来获取更多信息。无论是深 入探索不熟悉的主题,还是快速获取复杂文本的摘要,Ask Aria 都能提供即时帮助。这一功能特别适 合像学生和研究人员等需要大量阅读和理解信息的用户。其次是“Aria Voice”,这是一项创新的语音 交互功能。它使用户即使在移动中也能与浏览器进行自然语言交流。用户只需点击键盘上的麦克风图标 即可激活 Aria Voice,提出问题并听取回答。这项功能不仅提高了 Aria的可访问性,也为多任务处理 和需要免提操作的场景提供了极大的便利。 本报告期,Aria 引入了先进的图像生成和理解功能,显著提升了用户体验。借助 Google 的 Imagen2模型,Aria能够根据用户的文本提示和描述生成独特图像,为用户提供了一种全新的视觉内容 创作途径,丰富了演讲视觉素材和个性化场景图像创作。同时,图像理解功能允许用户上传图片并询问 相关问题,Aria 通过识别图片内容并提供相关信息和上下文,帮助用户深入理解图片背后的含义,甚 至在解决数学问题或编程难题方面提供支持。此外,我们将图像理解与图像生成相结合,进一步激发了 用户的创造力,用户只需上传草图,Aria 便能根据图示和简短文本提示生成新的图像,提供全新的创 作体验。
Aria还新增了语音输出功能,让Aria 能够大声朗读文本答案,非常适合需要辅助功能的人士、多 任务处理或喜欢以不同格式获取信息的用户。用户可以通过侧边栏或命令行启动与 Aria 的聊天,并使 用新的语音图标来听取回答。这些新功能的推出,不仅展示了 Opera 在 AI 领域的创新能力,也体现了 我们对用户需求的深刻理解。我们期待这些功能能够简化用户的浏览体验,并激发更多创新的互动方式。 此外,为满足用户需求,Aria还引入了本地大语言模型的支持。目前Aria能够接入超过150种本 地LLM模型,这些模型来自约50个不同的模型家族,包括Meta的Llama、Vicuna、Google的Gemma、 Mistral AI 的 Mixtral 等。这一创新举措使得用户能够直接在自己的设备上处理需求,而不必将数据 发送到远程服务器,从而增强了隐私保护和数据处理速度。用户可以通过 Aria 聊天侧边栏选择本地模 式,轻松访问和管理这些本地 LLM,享受更快速、更个性化的 AI 响应。未来我们将继续收集用户反馈, 不断优化和完善Aria的功能,以提供更优质的服务。 Aria本地语言模型展示

算力方面,Opera 成功在冰岛凯夫拉维克部署由绿色能源驱动的全新 AI 集群。该集群采用了搭载全新H100 GPU的NVIDIA DGX SuperPOD,训练速度较上一代提升四倍,推理速度较上一代提升30倍。

在第三方评比中,截至今年六月,该集群已成功跻身世界超级计算机百强,位列第88名。此外,Opera还对基于 Arm的 Windows PC进行了优化,新版本相较过去性能提升4 倍以上,为用户提供更快、更节能的浏览体验。

本报告期,Opera亦对GX版Aria进行了全面升级,不仅引入了图像生成、语音输出和图像理解等图像,并且如果初次生成的图像不符合预期,还可以利用“重新生成”按钮来获取新的图像版本。此外,Aria 新增的语音输出功能,可以大声朗读回答,非常适合需要多任务处理或寻求辅助功能的用户。

Aria 的图像理解能力也得到了提升,现在能够解析用户上传的图片并据此提供答案。聊天体验也因新增的对话摘要功能而变得更加丰富,使用户能够快速回顾对话要点。同时,Aria 还会在聊天中自动提供信息来源链接,方便用户访问更多相关内容。

此外,Opera GX浏览器推出GX Mods Mobile功能,让用户在iOS和Android设备上亦可畅享个性化定制界面。这一功能延续了 PC端 Mods 的成功,提供数千款由社区创造的游戏文化主题 Mods,用户可以轻松通过主菜单选择和激活 Mods,享受定制的背景音乐、动态壁纸等。同时 Opera GX团队还通过举办动态壁纸设计大赛、与知名IP联名合作等方式,不断推进Mods生态建设,为用户打造个性化浏览体验。截至本报告期末,GX.store中Mod 内容已超过 7,000 款。

Opera GX 还推出全新的“Pixels”体系,用户可以通过完成 GX 生态系统内的任务和挑战来获得Pixels。 Pixels 不仅仅是一种奖励机制,还是一种全新的消费方式。用户可以使用 Pixels 个性化装扮自己的账号,塑造独一无二的个人形象。未来 Pixels还可以在 GX.games和 GX.store 中使用,用户可以借此支持 GX 生态内的游戏创作者和 Mods 开发者,通过打赏的方式鼓励他们的创新和努力。通过Pixels,Opera GX不仅增强了用户与平台的互动,还为GX社区注入了新的活力,推动了创意和共享精神的蓬勃发展。


3、投资业务板块
本报告期,受资本市场波动下行影响,公司投资组合中如爱奇艺等标的股价大幅下滑,进而拖累公司的整体投资收益表现,计入较大亏损。我们将继续密切关注市场动态,优化投资组合结构,并采取必要的风险管理措施,以应对市场的不确定性和潜在波动。

报告期内,公司参与投资的昆仑基金持续把握科技创新的前沿趋势,赋能新质生产力发展。本报告期,昆仑基金成功发掘并投资了国内领先的量子计算应用企业——微观纪元,以期能够促进量子计算技术在更多领域的应用,推动相关产业链的创新与升级。融资方面,欧莱新材已于 2024 年 5 月成功登陆科创板,辐联科技、时的科技、星环聚能、跃赛生物和图湃医疗等企业均顺利完成新一轮融资,展现出强劲发展势头。

同时,昆仑基金投资组合中其他成员企业亦有亮眼表现。在硬科技领域,小马智行成功在北京地区推出往返大兴机场的自动驾驶收费服务,并在上海中心城区启动了无驾驶人载客服务,自动驾驶商业化应用迈出了坚实的步伐;中科驭数成功发布第三代全自研 DPU 芯片 K2 Pro 等系列新产品,进一步巩固1:2021 多倍加严全序列稳定性认证,为其国际市场拓展奠定了基础;星环聚能高温超导磁体和重复重 联方案工程验证取得显著进展,为新能源技术的发展贡献了重要力量。在医疗健康领域,新合生物联合 申报的“十四五”项目成功获得国家重点专项立项;征祥医药的 1 类新药玛赛洛沙韦片的上市申请 (NDA)已获国家药品监督管理局的正式受理。 未来公司将继续聚焦于新质生产力的培育和发展,通过不断的科技创新和资本投入,推动产业升级 和社会进步,为社会创造更多价值。 报告期内公司所处行业情况: 2024年上半年,人工智能行业继续保持高速发展,在 AI 模型创新和应用落地方面均取得了显著成 果。国际上,诸如OpenAI的GPT-4o和Google的Gemini系列等大型语言模型不断推陈出新。国内方面, 以昆仑万维、字节跳动、阿里巴巴、百度等为代表的科技公司在 AI 大模型技术上亦取得了一系列重要 成果。此外,AI 的应用场景不断拓宽,从智能搜索、AI助手到智能制造、智慧医疗等,AI技术正逐渐 渗透到社会生产和生活的各个方面。特别是在端侧模型、多模态交互和大模型的商业化应用方面,行业 展现出了巨大的潜力和活力。国内外的企业和研究机构正通过技术创新和应用实践,推动人工智能行业 向着更加智能、便捷和高效的方向发展,整个行业展现出一派生机勃勃的景象。
数据来源:中国信通院、中金公司

模型创新方面,OpenAI 发布视频生成模型 Sora,引起全球广泛关注。该模型能够生成长达一分钟、视觉风格的一致性。OpenAI 还推出了 GPT-4o,这一模型以其实时、情感丰富的交互模式成为焦点。 GPT-4o的“o”代表omni,即大而全万能的意思,彰显了其广泛的应用潜力。Google发布了Gemini系 列与 Gemma 系列新模型,同时在图像和视频生成领域,Google 推出了 Imagen-3,显示了其在生成高质 量图像和视频方面的持续进步。Google 还推出了 Veo 视频生成模型,支持从文本、视频到图像的多种 转换方式,进一步推动了多模态AI的发展。 数据来源:国金证券及公开信息

此外,小模型与端侧模型的兴起同样值得关注,其发展已成为推动人工智能应用创新的关键力量。

小模型通常指的是参数规模较小的大语言模型,它们通过特定设计和优化,在减少计算资源消耗的同时,保持了高效的任务处理能力。Meta 的 Llama-3 和微软的 Phi-3-mini 是小模型的代表,均采用主流的Decoder-only Transformer 架构,并遵循了“预训练+微调+对齐”的训练思路,确保了小模型在资源受限的设备上也能发挥出色的性能。端侧模型则是指在终端设备如智能手机和个人电脑上运行的模型。

它们利用本地计算能力提供服务,具有成本低、移动性强和数据安全的优势。例如,苹果自研的 3B 端侧模型,其性能超越了主流的 7B 模型,展示了端侧模型在保持设备便携性的同时,能够实现与大型模型相媲美的智能处理能力。

2024 年上半年,AI 应用落地亦呈现出蓬勃的发展态势,特别在模型即服务(MaaS)、AI 智能体(Agent)以及AIGC应用等方面取得明显进展。

MaaS(Model as a Service)MaaS 代表了 AI 服务模式的一次重大革新。它通过将 AI 算法模型及在金融、电信等行业的应用已取得积极成效,推动了大模型技术的规模化落地。MaaS 框架由模型平台 层、模型服务层和应用开发层组成,提供了从数据处理到模型开发、部署及运营的全流程服务。MaaS 的成功实施,不仅提升了模型服务的效率,也促进了AI技术在更广泛场景中的应用。 数据来源:中国信通院

AI智能体或称为AI Agent,是AI应用的另一种形式,它通过集成到各种应用程序中,为用户提供个性化和智能化的服务。如 GPTs 作为基于大模型的应用开发工具,可通过自然语言方式创建 GPT 应用,国内头部企业也纷纷推出各类应用开发平台,可实现 AI原生应用开发,并支持构建 AI Agent(智能体),达到大模型与各组件或系统工具的强互动及关联。据 MarketsandMarkets 预测,至 2028 年全球 AI Agent市场规模将达到285亿美元,2023至2028年复合增长率将达到43.0%。

根据 QuestMobile的研究报告,2024年上半年国内 AIGC 应用同样迎来了爆发式增长,各类 AI应用陆续推向市场。AIGC App主要分为AI工具和AI社交/娱乐两大赛道,形成了细分化的竞争格局。虽然大多数 App处于早期发展阶段,但已有如天工、豆包等月活跃用户规模在数百万甚至千万量级的 App出现。QuestMobile数据显示,目前国内AIGC 类App 在 36-40岁群体间覆盖较好,在年轻用户仍有极大发展空间。

数据来源:QuestMobile
国内外 AI 应用的进展表明,人工智能技术正成为全球经济增长的新引擎。随着技术的不断成熟和市场的不断扩大,AI 应用正逐步渗透到经济社会的各个领域,展现出广阔的发展前景和巨大的潜力。

无论是在提高生产效率、优化资源配置,还是在创造新的消费体验、推动社会进步方面,AI 应用都发挥着越来越重要的作用。随着国内外企业和研究机构在 AI 领域的持续投入和创新,我们有理由相信,人工智能将为人类社会带来更多的可能性和机遇。



  中财网
各版头条