[中报]云从科技(688327):2024年半年度报告
|
时间:2024年08月30日 20:01:36 中财网 |
|
原标题:云从科技:2024年半年度报告

公司代码:688327 公司简称:云从科技
云从科技集团股份有限公司
2024年半年度报告
重要提示
一、 本公司董事会、监事会及董事、监事、高级管理人员保证半年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。
二、 重大风险提示
公司已在本报告中详细描述可能存在的相关风险,具体内容详见本报告第三节“管理层讨论与分析”之“五、风险因素”的相关内容。
三、 公司全体董事出席董事会会议。
四、 本半年度报告未经审计。
五、 公司负责人周曦、主管会计工作负责人高伟及会计机构负责人(会计主管人员)黄莲声明:保证半年度报告中财务报告的真实、准确、完整。
六、 董事会决议通过的本报告期利润分配预案或公积金转增股本预案 无
七、 是否存在公司治理特殊安排等重要事项
√适用 □不适用
公司治理特殊安排情况:
□本公司为红筹企业
□本公司存在协议控制架构
√本公司存在表决权差异安排
1.特别表决权设置的基本安排
2020年 9月 1日,公司召开 2020年第三次临时股东大会,审议通过了《关于公司实施特别表决权制度及累积投票制度暨修改公司章程及股东大会议事规则的议案》,并修改《公司章程》,设置特别表决权。
根据特别表决权设置安排,公司控股股东常州云从持有公司的股份为 A类股份,其他股东(包括首次公开发行对象)所持公司股份均为 B类股份。除《公司章程》规定的部分特定事项的表决外,每一 A类股股份享有 6票表决权,每一 B类股股份享有 1票表决权。公司董事长兼总经理周曦通过常州云从对公司的经营管理等决策事项拥有控制权,能够影响公司股东大会表决的结果。
2.特别表决权持有情况
2023年 5月 16日,公司召开 2022年年度股东大会,审议通过了《关于<公司 2022年年度利润分配及资本公积转增股本方案>的议案》等相关议案。转增股本以方案实施前的公司总股本740,670,562股为基数,以资本公积向全体股东每股转增 0.4股。本次资本公积转增股份已于 2023年 6月 13日上市流通,公司控股股东常州云从持有公司的 A类股份数由 146,505,343股增加至205,107,480股,表决权数量由 879,032,058股增加至 1,230,644,880股,表决权比例不变。
单位:股
| 股东名称 | 职务 | 持有特别表决权
股份数量 | 每份特别表
决权股份的
表决权数量 | 合计持有表决
权数量 | 合计持有
表决权比
例(%) |
| 常州云从 | 董事长、总经理 | 205,107,480 | 6 | 1,230,644,880 | 59.67 |
3.特别表决权股份拥有的表决权数量与普通股股份拥有表决权数量的比例安排 公司控股股东常州云从持有公司的 205,107,480股股份为 A类股份,扣除 A类股份后,公司剩余 831,831,307股股份为 B类股份。具体比例安排如下:
| 序号 | 股东名称 | 持股数量(股) | 持股比例(%) | 表决权(票) | 表决权比例(%) |
| 1 | 常州云从 | 205,107,480 | 19.78 | 1,230,644,880 | 59.67 |
| 2 | 其他股东 | 831,831,307 | 80.22 | 831,831,307 | 40.33 |
| 合计 | 1,036,938,787 | 100.00 | 2,062,476,187 | 100.00 | |
4.其他安排
根据《公司章程》的规定,当公司股东对下列事项行使表决权时,每一 A类股份享有的表决权数量应当与每一 B类股份的表决权数量相同:
(一)对《公司章程》作出修改;
(二)改变 A类股份享有的表决权数量;
(三)聘请或者解聘公司的独立董事;
(四)聘请或者解聘为公司定期报告出具审计意见的会计师事务所; (五)公司合并、分立、解散或者变更公司形式;
(六)更改公司主营业务;
(七)审议公司利润分配方案。
股东大会对上述第(二)项作出决议,应当经过不低于出席会议的股东所持表决权的三分之二以上通过,但根据《上海证券交易所科创板股票上市规则》的规定,将相应数量 A类股份转换为 B类股份的不受前述需要三分之二表决权以上通过的约束。
八、 前瞻性陈述的风险声明
√适用 □不适用
本报告所涉及的公司未来计划等前瞻性陈述,不构成公司对投资者的实质承诺,投资者及相关人士均应当对此保持足够的风险认识,并且应当理解计划、预测与承诺之间的差异。
九、 是否存在被控股股东及其他关联方非经营性占用资金情况
否
十、 是否存在违反规定决策程序对外提供担保的情况
否
十一、 是否存在半数以上董事无法保证公司所披露半年度报告的真实性、准确性和完整性 否
十二、 其他
□适用 √不适用
目录
第一节 释义 ......................................................................................................................................... 6
第二节 公司简介和主要财务指标 ................................................................................................... 11
第三节 管理层讨论与分析 ............................................................................................................... 15
第四节 公司治理 ............................................................................................................................... 68
第五节 环境与社会责任 ................................................................................................................... 70
第六节 重要事项 ............................................................................................................................... 71
第七节 股份变动及股东情况 ......................................................................................................... 102
第八节 优先股相关情况 ................................................................................................................. 111
第九节 债券相关情况 ..................................................................................................................... 111
第十节 财务报告 ............................................................................................................................. 112
| 备查文件目录 | (一)载有公司负责人、主管会计工作负责人、会计机构负责人(会计
主管人员)签名并盖章的财务报表。 |
| | (二)报告期内公开披露过的所有公司文件的正本及公告的原稿。 |
第一节 释义
在本报告书中,除非文义另有所指,下列词语具有如下含义:
| 常用词语释义 | | |
| 公司/本公司 | 指 | 云从科技集团股份有限公司 |
| 重庆云从 | 指 | 重庆中科云从科技有限公司,系公司的控股子公司 |
| 北京云从 | 指 | 北京云从科技有限公司,系公司的全资子公司 |
| 上海云从 | 指 | 上海云从企业发展有限公司,系公司的全资子公司 |
| 芜湖云从 | 指 | 芜湖云从科技有限公司,系公司的全资子公司 |
| 上海汇临 | 指 | 上海云从汇临人工智能科技有限公司,系公司的全资子公司 |
| 实体清单 | 指 | 美国商务部产业安全局要求实体清单上企业的出口、再出口或者转让所有
受管辖的物项均需经其事先许可 |
| 常州云从 | 指 | 常州云从信息科技有限公司,曾用名“常州飞寻视讯信息科技有限公
司”,系公司控股股东 |
| 佳都科技 | 指 | 佳都科技集团股份有限公司,系公司股东 |
| 云逸众谋 | 指 | 宁波梅山保税港区云逸众谋投资管理合伙企业(有限合伙),系公司股东 |
| 释天投资 | 指 | 宁波梅山保税港区释天创业投资合伙企业(有限合伙),系公司股东 |
| 高丛创业 | 指 | 广州高丛企业管理咨询合伙企业(有限合伙),系公司股东,曾用名“广
州高丛创业投资合伙企业(有限合伙)” |
| 大昊创业 | 指 | 广州大昊企业管理咨询合伙企业(有限合伙),系公司股东,曾用名“广
州大昊创业投资合伙企业(有限合伙)” |
| 吕申创业 | 指 | 广州吕申企业管理咨询合伙企业(有限合伙),系公司股东,曾用名“广
州吕申创业投资合伙企业(有限合伙)” |
| 嘉兴长茂 | 指 | 嘉兴长茂股权投资合伙企业(有限合伙),系公司股东 |
| 海康威视 | 指 | 杭州海康威视数字技术股份有限公司,深圳证券交易所主板上市公司,股
票代码为 002415 |
| 首链科技 | 指 | 首链(广州)区块链科技有限公司 |
| 国务院 | 指 | 中华人民共和国国务院 |
| 财政部 | 指 | 中华人民共和国财政部 |
| 中国证监会 | 指 | 中国证券监督管理委员会 |
| 上交所 | 指 | 上海证券交易所 |
| 《证券法》 | 指 | 《中华人民共和国证券法》 |
| 《公司章程
(草案)》 | 指 | 公司股东大会已通过且拟在上市之日起生效的《云从科技集团股份有限公
司章程(草案)》 |
| 保荐机构 | 指 | 中信建投证券股份有限公司 |
| 募投项目 | 指 | 募集资金扣除发行费用后将投资的项目,包括:人机协同操作系统升级项
目、轻舟系统生态建设项目、人工智能解决方案综合服务生态项目和补充
流动资金 |
| 人工智能、AI | 指 | Artificial Intelligence的缩写,研究、开发用于模拟、延伸和扩展人的智能
的理论、方法、技术及应用系统的技术科学 |
| 常用词语释义 | | |
| 云从人机协同
操作系统/人机
协同操作系统
/CWOS | 指 | Cloudwalk Operating System的简称,即云从人机协同操作系统,指运行在
通用操作系统或云操作系统之上,提供人机协同相关算力、算法和数据管
理能力和应用接口的底层软件系统,专为人与计算机之间进行自然交互、
协作完成复杂业务以及为开发者设计开发人机协同智能应用而构建,旨在
降低人工智能应用门槛、提升人类与机器智能进行协作的效率和体验 |
| 人工智能生态 | 指 | 人工智能技术服务于人类所需的核心能力和配套资源,与参与其中的各类
角色相互作用的体系 |
| 人机协同 | 指 | 充分结合人类和人工智能的优势能力解决问题,包括人类和人工智能互相
沟通和理解(人机交互)、人类和人工智能共同完成任务(人机融合)、
人类和人工智能共同创造新的内容(人机共创) |
| 物联网、IoT | 指 | Internet of Things的简称,即一个动态的全球网络基础设施,它具有基于
标准和互操作通信协议的自组织能力,其中物理的和虚拟的“物”具有身
份标识、物理属性、虚拟的特性和智能的接口,并与信息网络无缝整合 |
| 区块链 | 指 | 一个共享数据库,存储于其中的数据或信息,具有不可伪造、全程留痕、
可以追溯、公开透明、集体维护等特征 |
| 深度学习 | 指 | 一类人工智能主流算法的总称,可基于海量数据训练具有大量隐含层的人
工神经网络模型(即深度神经网络),使其完成图像识别、语音识别等特
定的人工智能任务 |
| 神经网络 | 指 | 人工神经网络的简称,是计算机科学家受生物脑基本结构启发而提出的一
大类人工智能模型的总称,可用于视觉、语音和自然语言处理等广泛的应
用领域,让计算机实现类人的感知功能和较为简单初步的认知功能 |
| 云端 | 指 | 在计算机领域中一般指集中在大规模数据中心进行远程处理。该处理方案
称为云端处理,处理场所为云端 |
| 终端 | 指 | 相对于云端,一般指个人可直接接触或使用、不需要远程访问的设备,或
者直接和数据或传感器一体的设备,如手机、智能音箱、智能手表等 |
| 训练 | 指 | 在机器学习或人工智能领域,通过大量带标签样本,通过一定的方法,得
到对应机器学习/人工智能模型参数的过程 |
| 推理 | 指 | 在机器学习或人工智能领域,通过已经训练好的模型(模型参数已经通过
训练得到),去预测新数据标签的过程 |
| 计算机视觉 | 指 | 用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并
进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测
的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建
立能够从图像或者多维数据中获取“信息”的人工智能系统 |
| 跨镜追踪 | 指 | 行人再识别(Personre-identification),是利用计算机视觉技术判断镜头中
某个图像或跨多镜头的视频序列中是否存在特定行人的技术 |
| CPU | 指 | Central Processing Unit,简称 CPU,作为计算机系统的运算和控制核心,
是信息处理、程序运行的最终执行单元。 |
| ReID | 指 | Re-identification的缩写,即重识别技术,一般为利用计算机视觉技术判断
图像或者视频序列中是否存在特定对象的技术。旨在弥补固定摄像头的视
觉局限,可与对象检测/跟踪技术相结合 |
| ASR | 指 | Automatic Speech Recognition的缩写,即自动语音识别技术,指一种将人
的语音转换为文本的技术 |
| NLP | 指 | Natural Language Processing的缩写,即自然语言处理,属于人工智能的一
个子领域,用于研究人类自然语言和计算机之间的相互作用。重点是帮助
机器利用信息的语义结构来理解人类自然语言的含义 |
| ML | 指 | Machine Learning的缩写,即机器学习,专门研究计算机怎样模拟或实现
人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之
不断改善自身的性能 |
| 常用词语释义 | | |
| API | 指 | Application Programming Interface的缩写,应用软件编程接口,软件系统
不同组成部分衔接的约定,用来提供应用程序与开发人员基于某软件或硬
件得以访问的一组例程,而又无需访问原码 |
| SDK | 指 | Software Development Kit的缩写,软件开发工具包,指特定的软件包、软
件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合 |
| 3D | 指 | 三维立体图形 |
| TOF | 指 | Time Of Flight的缩写,飞行时间法 3D成像,通过给目标连续发送光脉
冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)
时间来得到目标物距离 |
| 5G | 指 | The fifth generation mobile communication network的缩写,第五代移动通
信网络,其峰值理论传输速度可达每秒数 10Gb,比 4G网络的传输速度
快数百倍 |
| PAD | 指 | Portable Android Device的缩写,平板电脑,一种小型、方便携带的个人电
脑,以触摸屏作为基本的输入设备 |
| OCR | 指 | Optical Character Recognition的缩写,光学字符识别,指电子设备检查打
印字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状
翻译成计算机文字的技术 |
| ISV | 指 | 独立软件开发商,即 Independent Software Vendors |
| OTA | 指 | 空中下载技术,即 Over-the-AirTechnology,是通过移动通信的空中接口实
现对终端设备进行远程管理的技术。 |
| IPC | 指 | 网络摄像机,又叫 IPCAMERA(简称 IPC),是一种结合传统摄像机与网络
技术所产生的新一代摄像机,它可以将视频影像通过网络进行传输 |
| NVR | 指 | Network Video Recorder,即网络视频录像机,是网络视频监控系统的存储
转发部分,NVR与视频编码器或网络摄像机协同工作,完成视频的录像、
存储及转发功能 |
| PGIS | 指 | 城市停车诱导系统(Parking Guidance Information System,简称 PGIS)是
指通过智能探测技术,与分散在各处的停车场实现智能联网数据上传,实
现对各个停车场停车数据进行实时发布,引导司机实现便捷停车,解决城
市停车难问题的智能系统 |
| GIS | 指 | Geographic Information System,是以地理空间数据库为基础,在计算机软
硬件的支持下,对地理空间信息进行采集、存储、检索、显示和分析的综
合性技术系统 |
| MOTA | 指 | (Multiple Object Tracking Accuracy)多目标跟踪准确度,用于衡量单摄
像头多目标跟踪准确度的一个指标,通常情况数值越接近于 1表示跟踪器
性能越好 |
| BI分析系统 | 指 | BI(Business Intelligence)即商务智能,用来将企业中现有的数据进行有
效的整合,快速准确地提供报表并提出决策依据,帮助企业做出明智的业
务经营决策 |
| KaaS | 指 | KnowledgeasaService的缩写,知识即服务 |
| CWOS-ECO | 指 | CloudWalk Operating System简称 CWOS,是云从自主研发的人机协同操作
系统,CWOS-ECO践行了一种独特的 AI系统构建思想,提供了方法论、
标准规范和工具集,聚焦于解决分布式系统封装打包、编排设计、一键部
署、快速开设、集群管理、升级扩容、故障反馈、智能运维、生命周期管
理等需求 |
| ChatGPT | 指 | ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理
解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类
一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等 |
| 常用词语释义 | | |
| | | 任务。 |
| SAAS | 指 | Software as a Server的缩写,软件即服务 |
| 行业大模型 | 指 | 行业大模型是指在某个特定领域或行业中进行预训练的深度神经网络模
型,能够学习到该领域或行业的特定知识和规律,具有很强的应用性和实
用性 |
| 下游任务微调 | 指 | 下游任务微调是指在行业大模型基础上,使用特定领域或行业的数据进行
有监督训练,对模型进行微调,以适应具体的任务需求,如文本分类、情
感分析、命名实体识别等 |
| 预训练大模型 | 指 | 预训练大模型是指在大规模数据集上进行预训练的深度神经网络模型,通
常采用无监督学习方法,如自编码器、对比学习等 |
| 基础平台 | 指 | 基础平台是指为上层应用提供基础支撑的计算机软硬件系统,通常包括操
作系统、数据库、网络、存储等基本组件,以及应用程序接口(API)、
开发工具、安全机制等辅助工具。基础平台提供的基础设施和服务,可以
帮助上层应用快速开发、部署、运行和管理,减少开发成本和时间,提高
应用的可靠性和性能 |
| 开发者平台 | 指 | 开发者平台是指为开发者提供开发工具、API、SDK、文档、测试工具等
资源和服务的计算机软硬件系统 |
| AI数据湖 | 指 | AI数据湖是一种基于云计算和人工智能技术的数据管理和分析平台,它
可以集成、存储和处理各种结构化和非结构化数据,如文本、图像、音频、
视频等,同时支持数据挖掘、机器学习、深度学习等数据分析和建模技术,
可以为企业提供全面、高效、智能的数据处理和分析服务 |
| 算法工厂 | 指 | 算法工厂是指一个基于人工智能技术和自动化技术的平台,可以自动化地
开发、测试和部署算法模型,从而实现算法的快速迭代和应用 |
| 人机自然交互 | 指 | 人机自然交互是指通过自然、直观、智能的方式进行人机交互,使人和计
算机之间的交流更加顺畅、高效和自然。人机自然交互需要结合人工智能、
自然语言处理、计算机视觉、语音识别等多种技术,实现人机交互的智能
化和个性化 |
| 智能业务流 | 指 | 智能业务流(Intelligent Business Process)是一种基于人工智能技术的业务
流程,通过对数据进行分析,自动化、优化和智能化地管理业务流程,提
高企业效率和竞争力 |
| 语音交互 | 指 | 语音交互是指人类通过语音与计算机或其他智能设备进行交流和互动的
过程。语音交互技术是一种人机交互方式,通过语音识别、语音合成、自
然语言处理等技术,实现人与计算机之间的语音交流 |
| 算法平台 | 指 | 算法平台是一种计算机软件或硬件系统,提供一系列算法的实现和支持,
以便用户能够快速有效地开发、测试和部署自己的算法 |
| AIGC | 指 | AIGC即 A IGenerated Content,是指利用人工智能技术来生成内容 |
| AGI | 指 | Artificial General Intelligence,俗称通用人工智能 |
| 多模态数据感
知 | 指 | 多模态数据感知是指通过多种感知技术和传感器,获取不同形式和类型的
数据,并将其整合和分析,从而获得更全面、更准确的信息和知识 |
| 长尾算法 | 指 | 即 Long Tail Algorithm,是一种用于推荐系统的算法,旨在解决传统推荐
系统中的“热门偏见”问题 |
| AI算法 | 指 | AI算法是一种计算机程序或指令集合,它使用人工智能技术来解决问题
或执行任务 |
| 生物特征识别 | 指 | 生物特征识别是一种基于生物特征(如指纹、人脸、虹膜、声音等)进行
身份认证的技术 |
| 自然语言理解 | 指 | 自然语言理解(Natural Language Understanding,简称 NLU)是一种人工 |
| 常用词语释义 | | |
| | | 智能技术,旨在让计算机能够理解自然语言。 |
| 结构化数据 | 指 | 结构化数据(Structured Data)是指按照一定的数据模式或格式进行组织
和存储的数据 |
| 知识推理 | 指 | 知识推理是指基于已有的知识和规则,通过逻辑推理或推断,从而得出新
的知识或结论的过程。 |
| 知识图谱 | 指 | 知识图谱是一种基于语义的知识表示形式,用于描述和组织现实世界中的
实体、概念和关系 |
| 迁移学习 | 指 | 迁移学习(Transfer Learning)是指将从一个领域或任务中所学到的知识和
经验,迁移到另一个领域或任务中,以提高学习效果和效率的机器学习方
法 |
| 无监督学习 | 指 | 无监督学习是指一种机器学习技术,它不需要预先标记的数据,而是通过
分析数据的内在结构和特征,自动发现数据集中的模式和关系 |
| 多模态算法 | 指 | 多模态算法是指同时处理多种数据类型或模态的算法 |
| 图像识别 | 指 | 图像识别(Image Recognition)是指利用计算机视觉技术对图像进行分析
和处理,从而实现对图像中目标物体的识别和分类的技术 |
| 语音识别 | 指 | 语音识别(Speech Recognition)是一种通过计算机技术将语音信号转化为
文本或命令的技术 |
| 报告期、本报
告期 | 指 | 2024年 1月 1日至 2024年 6月 30日 |
| 报告期末 | 指 | 2024年 6月 30日 |
| 上年同期 | 指 | 2023年 1月 1日至 2023年 6月 30日 |
| 元、万元、亿元 | 指 | 人民币元、人民币万元、人民币亿元 |
第二节 公司简介和主要财务指标
一、 公司基本情况
| 公司的中文名称 | 云从科技集团股份有限公司 |
| 公司的中文简称 | 云从科技 |
| 公司的外文名称 | Cloudwalk Technology Co.,Ltd. |
| 公司的外文名称缩写 | CLOUDWALK |
| 公司的法定代表人 | 周曦 |
| 公司注册地址 | 广州市南沙区南沙街金隆路37号501房 |
| 公司注册地址的历史变更情况 | / |
| 公司办公地址 | 上海市浦东新区川和路55弄张江人工智能岛11栋 |
| 公司办公地址的邮政编码 | 201210 |
| 公司网址 | www.cloudwalk.com |
| 电子信箱 | [email protected] |
| 报告期内变更情况查询索引 | / |
二、 联系人和联系方式
| | 董事会秘书(信息披露境内代表) | 证券事务代表 |
| 姓名 | 杨桦 | 周阳帅 |
| 联系地址 | 上海市浦东新区川和路55弄张江人工智能
岛11栋 | 上海市浦东新区川和路55弄张江人工智能
岛11栋 |
| 电话 | 021-60969707 | 021-60969707 |
| 传真 | 021-60969708 | 021-60969708 |
| 电子信箱 | [email protected] | [email protected] |
三、 信息披露及备置地点变更情况简介
| 公司选定的信息披露报纸名称 | 《中国证券报》《上海证券报》《证券时报》《证券日报》 |
| 登载半年度报告的网站地址 | www.sse.com.cn |
| 公司半年度报告备置地点 | 上海市浦东新区川和路55弄张江人工智能岛11栋董事会办公室 |
| 报告期内变更情况查询索引 | 不适用 |
四、 公司股票/存托凭证简况
(一) 公司股票简况
√适用 □不适用
| 公司股票简况 | | | | |
| 股票种类 | 股票上市交易所
及板块 | 股票简称 | 股票代码 | 变更前股票简称 |
| A股 | 上海证券交易所
科创板 | 云从科技 | 688327 | 不适用 |
(二) 公司存托凭证简况
□适用 √不适用
五、 其他有关资料
√适用 □不适用
| 报告期内履行持续
督导职责的保荐机
构 | 名称 | 中信建投证券股份有限公司 |
| | 办公地址 | 北京市朝阳区景辉街 16号院 1号楼泰康集团
大厦 10层 |
| | 签字的保荐代表人姓名 | 高吉涛、吴建航 |
| | 持续督导的期间 | 2022年 5月 27日至 2025年 12月 31日 |
六、 公司主要会计数据和财务指标
(一) 主要会计数据
单位:元 币种:人民币
| 主要会计数据 | 本报告期
(1-6月) | 上年同期 | | 本报告期
比上年同
期增减
(%) |
| | | 调整后 | 调整前 | |
| 营业收入 | 120,519,793.18 | 163,646,018.26 | 163,646,018.26 | -26.35 |
| 归属于上市公司股
东的净利润 | -356,346,586.51 | -306,020,225.32 | -304,110,365.83 | 不适用 |
| 归属于上市公司股
东的扣除非经常性
损益的净利润 | -369,213,726.89 | -322,702,131.23 | -320,792,271.74 | 不适用 |
| 经营活动产生的现
金流量净额 | -130,191,110.52 | -171,578,906.70 | -171,578,906.70 | 不适用 |
| | 本报告期末 | 上年度末 | | 本报告期
末比上年
度末增减
(%) |
| | | 调整后 | 调整前 | |
| 归属于上市公司股
东的净资产 | 1,369,681,587.04 | 1,622,776,936.30 | 1,622,776,936.30 | -15.60 |
| 总资产 | 2,198,524,556.45 | 2,748,521,233.94 | 2,748,521,233.94 | -20.01 |
(二) 主要财务指标
| 主要财务指标 | 本报告期
(1-6月) | 上年同期 | | 本报告期比上年同
期增减(%) |
| | | 调整后 | 调整前 | |
| 基本每股收益(元/股) | -0.34 | -0.30 | -0.29 | 不适用 |
| 主要财务指标 | 本报告期
(1-6月) | 上年同期 | | 本报告期比上年同
期增减(%) |
| | | 调整后 | 调整前 | |
| 稀释每股收益(元/股) | -0.34 | -0.30 | -0.29 | 不适用 |
| 扣除非经常性损益后的基本每股收
益(元/股) | -0.36 | -0.31 | -0.31 | 不适用 |
| 加权平均净资产收益率(%) | -23.88 | -15.56 | -15.46 | 不适用 |
| 扣除非经常性损益后的加权平均净
资产收益率(%) | -24.74 | -16.41 | -16.31 | 不适用 |
| 研发投入占营业收入的比例(%) | 179.69 | 120.99 | 120.99 | 增加58.70个百分
点 |
公司主要会计数据和财务指标的说明
√适用 □不适用
追溯调整或重述的原因说明:
财政部于 2022年 12月发布了《企业会计准则解释第 16号》(财会〔2022〕31号,以下简称“解释第 16号”“本解释”),要求“关于单项交易产生的资产和负债相关的递延所得税不适用初始确认豁免的会计处理”内容自 2023年 1月 1日起施行。根据解释第 16号“关于单项交易产生的资产和负债相关的递延所得税不适用初始确认豁免的会计处理”的衔接规定,对于在首次施行本解释的财务报表列报最早期间的期初至本解释施行日之间发生的适用本解释的单项交易,企业应当按照本解释的规定进行调整。
对于在首次施行本解释的财务报表列报最早期间的期初因适用本解释的单项交易而确认的租赁负债和使用权资产,以及确认的弃置义务相关预计负债和对应的相关资产,产生应纳税暂时性差异和可抵扣暂时性差异的,企业应当按照本解释和《企业会计准则第 18号——所得税》的规定,将累积影响数调整财务报表列报最早期间的期初留存收益及其他相关财务报表项目。
报告期内,公司营业收入有所下降,主要系公司积极推进产品和客户结构优化,新签订单规模同比下降所致。此外,公司持续推进精细化管理策略,合理调度优化各项资源,进一步降低费用支出。
七、 境内外会计准则下会计数据差异
□适用 √不适用
八、 非经常性损益项目和金额
√适用 □不适用
单位:元 币种:人民币
| 非经常性损益项目 | 金额 | 附注(如适用) |
| 非流动性资产处置损益,包括已计提资产减 | 396,611.76 | |
| 非经常性损益项目 | 金额 | 附注(如适用) |
| 值准备的冲销部分 | | |
| 计入当期损益的政府补助,但与公司正常经
营业务密切相关、符合国家政策规定、按照
确定的标准享有、对公司损益产生持续影响
的政府补助除外 | 11,889,606.92 | |
| 除同公司正常经营业务相关的有效套期保值
业务外,非金融企业持有金融资产和金融负
债产生的公允价值变动损益以及处置金融资
产和金融负债产生的损益 | 360,726.01 | |
| 除上述各项之外的其他营业外收入和支出 | 586,533.16 | |
| 其他符合非经常性损益定义的损益项目 | | |
| 减:所得税影响额 | | |
| 少数股东权益影响额(税后) | 366,337.47 | |
| 合计 | 12,867,140.38 | |
对公司将《公开发行证券的公司信息披露解释性公告第 1号——非经常性损益》未列举的项目认定为的非经常性损益项目且金额重大的,以及将《公开发行证券的公司信息披露解释性公告第 1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因 √适用 □不适用
单位:元 币种:人民币
| 项目 | 涉及金额 | 原因 |
| 其他收益 | 4,340,785.57 | 系软件退税款,与公司正常经营业务密切相关。 |
九、 非企业会计准则业绩指标说明
□适用 √不适用
第三节 管理层讨论与分析
一、 报告期内公司所属行业及主营业务情况说明
(一)公司所属行业情况
根据中国证监会上市公司行业分类结果,公司属于“信息传输、软件和信息技术服务业”中的“软件和信息技术服务业”。同时根据国家统计局《战略性新兴产业分类(2018)》,公司所属行业为“新一代信息技术产业-人工智能-人工智能软件开发(1.5.1)/人工智能系统服务(1.5.3)”。
报告期内,AI行业在政策推动和市场需求的驱动下,继续保持了快速发展的态势。技术的创新和应用的深化,为行业的长远发展提供了强大的动力。同时,行业也需要不断解决发展过程中出现的问题,以实现健康、可持续地发展。AI行业在“政策、技术、应用以及生态”层面取得如下进展:
1. 政策引导驱动 AI行业发展
报告期内,国家政策继续大力支持人工智能行业的发展。政府积极出台多项政策,旨在推动人工智能技术的创新与应用。
2024年 1月,国务院常务会议研究部署推动人工智能赋能新型工业化有关工作。会议强调,要统筹高质量发展和高水平安全,以人工智能和制造业深度融合为主线,以智能制造为主攻方向,以场景应用为牵引,加快重点行业智能升级,大力发展智能产品,高水平赋能工业制造体系,加快形成新质生产力,为制造强国、网络强国和数字中国建设提供有力支撑。
同年 6月,工信部等四部门联合印发《国家人工智能产业综合标准化体系建设指南(2024版)》,旨在到 2026年形成引领人工智能产业高质量发展的标准体系,并新制定 50项以上的国家标准和行业标准。
此外,青岛、成都、福州等地也相继出台了人工智能产业发展行动计划,提供资金支持和税收优惠等激励措施,鼓励 AI技术在智慧城市、智能制造、智慧医疗等领域的应用。
2. 大模型技术推动 AI新应用
报告期内,大模型技术继续蓬勃发展,不仅在自然语言处理领域取得突破,还在图像识别、视频分析、自动驾驶等多领域广泛应用。ChatGPT 4.0版本的推出,进一步提升了对话生成的流畅度和准确性,标志着大模型在处理复杂语境和多模态数据方面迈出了重要一步,这一进展标志着大模型技术在理解和生成自然语言的能力上达到了一个新的高度,使得人机交互更加自然和高效。同时,国内外企业纷纷发布了新一代 AI芯片和相关工具链,优化了 AI算法的性能和效率。与此同时,国内外企业也在积极推动 AI硬件的发展,纷纷发布了新一代 AI芯片和相关工具链。这些新产品通过优化 AI算法的性能和效率,为大模型技术的进一步应用奠定了坚实的基础。这些技术上的进步,不仅提升了人工智能系统的整体性能,还为更多应用场景的实现提供了可能。
3. AI应用深化提高效率
报告期内,AI技术在医疗、教育、金融等多个领域的应用不断深化,显著提高了各行业的业务效率和服务水平。在医疗领域,人工智能辅助诊断和智能影像分析等技术已经在多个省市的医院中实现了规模化应用。这些技术不仅提高了医生诊断的准确性,还大幅减少了病人的等待时间,从而极大地提高了医疗服务的效率和质量。
在教育领域,AI技术同样展现出强大的变革力量。个性化学习推荐系统和智能教学助手的开发,为教育的个性化和精准化提供了可能。这些系统通过分析学生的学习行为和知识掌握情况,自动推荐适合的学习资源和学习路径,从而帮助学生更高效地学习。
金融领域也受益于 AI技术的快速发展。AI技术助力风控和反欺诈系统的升级,增强了金融机构的安全性。通过深度学习和数据分析技术,金融机构能够更准确地识别潜在风险和欺诈行为,从而保护客户的资金安全。
此外,智能制造和智慧城市等领域的 AI应用也在稳步推进,进一步推动了各行业的数字化转型。在智能制造领域,AI技术的应用不仅提高了生产效率,还优化了供应链管理,降低了运营成本。在智慧城市建设中,AI技术通过智能交通管理、环境监测和公共安全等方面的应用,提升了城市管理的效率和居民的生活质量。
4. 生态完善推动 AI发展
报告期内,人工智能产业生态日益完善。国内 AI企业在技术研发和市场推广方面取得了重要进展。同时,国际科技巨头也加大了在中国市场的投入力度,带动了整个产业链的发展。
总体来看,大厂的共通点在于打造完善的生态系统。其不仅在技术研发上投入大量资源,还致力于建立一个开放且协同的开发环境,目的是促进整个行业的创新与发展。大厂注重底层能力的提升,通过持续的技术迭代和优化,确保其平台在性能和稳定性上保持领先地位。他们力争通过提供高性价比和高效率的解决方案,吸引更多应用开发者参与其模型的应用落地。这些方案不仅降低了开发者的进入门槛,还为他们提供了丰富的工具和支持,使其能够更加高效地开发和部署应用。
相较于大厂,专业人工智能公司更倾向于利用自身优势,专注于其擅长的领域。一方面,这类公司通常在某些垂直领域拥有独特的技术或市场资源,通过针对性地优化和创新,能够在特定市场中迅速建立起竞争优势。另一方面,这类公司更加愿意与传统行业的软件公司和硬件生态公司建立合作和联盟。通过这种灵活和敏捷的合作方式,它们可以结合客户本地化的优质数据、完善的行业流程以及明确的需求,快速响应市场变化。这种合作模式使这类公司能够提供定制化的解决方案,满足客户的特定需求,从而赢得客户的信任和支持。通过与传统行业的紧密合作,这类公司不仅能够加速技术的落地应用,还能提升服务质量和客户满意度,进一步增强市场竞争力。
此外,AI人才的培养和储备也得到了各界的高度重视,各大高校和科研机构纷纷设立了 AI相关专业和研究项目,培养了一批高素质的 AI人才,为行业的发展提供了有力支撑。
(二) 公司主营业务情况
1. 主要业务
公司是一家提供高效人机协同操作系统和行业解决方案的人工智能企业,致力于助推人工智能产业化进程和各行业智慧化转型升级。
一方面,公司凭借着自主研发的人工智能核心技术打造了人机协同操作系统,通过对业务数据、硬件设备和软件应用的全面连接,把握人工智能生态的核心入口,为客户提供信息化、数字化和智能化的人工智能服务;另一方面,公司基于人机协同操作系统,赋能智慧金融、智慧治理、智慧出行、智慧商业、泛 AI等应用场景,为更广泛的客户群体提供以人工智能技术为核心的行业解决方案。
2. 主要产品及服务
公司自主研发了融合人工智能技术的人机协同操作系统和部分 AIoT设备。报告期内,公司主要产品及服务按照提供交付内容和业务模式可划分为人机协同操作系统和人工智能解决方案。
人机协同操作系统业务指公司向客户提供自主研发的基础操作系统、基于人机协同操作系统的应用产品和核心组件以及技术服务。同时,公司推出轻量化且功能全面的基于人机协同操作系统的“轻舟”通用服务平台引入生态伙伴共同开发 AI应用及配套 SaaS服务。
人工智能解决方案业务指公司提供解决特定行业客户业务问题的智能化升级解决方案;公司凭借所具备较强的 AI技术能力和行业应用场景的深刻理解,为客户提供涵盖架构咨询与设计、软硬件产品适配优化、交付部署、售后维护等环节的一体化解决方案。人工智能解决方案会将人机协同操作系统作为方案架构的核心组成部分,充分发挥操作系统提供的 AI能力,再结合智能 AIoT设备和第三方软硬件产品等为客户解决特定行业问题。
报告期内,公司主要产品及服务图谱如下:
| 及结
慧政务
标
D A TA
视觉 | 图如下:
慧哨兵
机场平台
G PT
安全
能平台 | 慧应急 视
业务应用
生产平台
数据平台 | 频大数据
IB IS
数字
报营销
知识平台 | 慧城管
智
人智能屏
… |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
D A TA G PT
海报营销
安全生产平台
知识平台 …
视觉智能平台 数据平台
交互设备 一体机
训练平台 推理平台 模型管理平台 …
行业/企业大模型 行业/企业大模型 ……
大模型
技术服务
语言大模型 视觉大模型 语音大模型 多模态大模型
L0
2.1人机协同操作系统
公司人机协同理念包含“人机交互、人机融合和人机共创”三个依次演进的层次: (1)人机交互:通过视觉、听觉和超感知等感知技术以及认知和决策等技术,实现机器对人的感知和交互的过程;
(2)人机融合:将实际生产、服务、决策等工作任务根据人和机器的优势进行智能分配,实现人机无缝融合,提升任务处理效率;
(3)人机共创:通过行业知识转换、群体智能以及人工智能自主发掘创造新的服务内容、产
品系统,并动态更新。
公司人机协同操作系统指运行在通用操作系统或云操作系统之上,提供人机协同相关算力、
算法和数据管理能力和应用接口的底层软件系统,专为人与计算机之间进行自然交互、协作完成
复杂业务以及为开发者设计开发人机协同智能应用而构建,旨在降低人工智能应用门槛、提升人
类与机器智能进行协作的效率和体验。 2.2人工智能解决方案
报告期内,公司主要基于自主研发的人机协同操作系统及其应用产品和 AIoT硬件设备,面
向智慧治理、智慧出行、智慧金融、智慧商业、泛 AI等领域提供综合解决方案,同时根据客户需
求基于公司人工智能核心技术并结合其他应用领域的技术为客户提供定制化软件开发服务。二、 核心技术与研发进展
1. 核心技术及其先进性以及报告期内的变化情况
截至报告期末,公司主要核心技术如下表所示:
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| 1 | 多
模
态
大
模
型 | 视频自监
督预训练
大模型 | 通过自监督的方式,获得视
频预训练大模型。预训练模
型具有较好的时空特征表征
能力,泛化能力强,通过少量
数据微调能够广泛用于视频
检索、3D行为识别、行为关
键帧检测等下游任务中,提
升视频相关任务的开发效率
和识别精度。 | 1、创新预训练方法
根据视频的特点,设计了多分支
特征蒸馏模块,让模型同时学到
场景语义特征和时序运动特征,
配合掩码重建的方式进行自监
督预训练,可实现对视频图像语
义特征和时序运动特征的统一
提取。
2、高效的下游任务微调
模型泛化能力强,仅需少量数据
即可快速迁移到下游任务场景,
减少人工标注。训练时通过多帧
之间信息互补的方式自动去除
模型冗余的部分,减少模型大
小,极大提升了下游任务的训练
和推理速度。
3、性能优越
大幅提升视频相关任务的性能,
在权威数据集上取得了业界领
先的结果。核心算法具有很强的
迁移能力,在3D行为识别中取
得了显著成果。 | 自
主
创
新 | 202011233268.1
202110049704.8
202011392551.9
202111131620.5
202110292039.5
2021106452939
2020109224588
2018112698826
2020104243099
2020100127633
202110513268.5
202110262297.9
202110550697X
202111131165.9 | 2024SR0315103
2020SR0983700
2020SR0348906
2020SR0617519
2021SR0985283
2023SR0198215
2022SR1409910
2023SR0920287 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、智能
货柜、安全生产平台
AIoT设备:训练推理
一体机 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| 2 | | 视觉-语
言基础预
训练大模
型 | LLM只能感知和输出文本信
息,但要真正理解世界、达成
更好的人机交互离不开对视
觉信号的处理。通过大规模
对比学习,将跨模态的图像
和文本数据映射到共同的表
征空间,捕捉并锚定两者之
间内在的语义联系,从而架
设起视觉模块和LLM之间的
桥梁,使得LLM具备视觉、语
言多模态的感知能力。 | 1、基于对比学习桥接视觉编码
器和大语言模型,对齐了文本和
视觉模态的状态空间,实现大语
言模型对真实世界的多模态感
知和理解。
2、抗干扰多模态对比学习方法,
基于数据相似性权重降低数据
噪声对对比学习的影响,从而得
以高效地在大规模互联网数据
上进行无监督学习,实现高性能
的视觉-语言模态对齐效果。
3、面向精准图像理解的提示词
智能注意力,利用语言模型并使
用任务相关的自然语言文本提
示词作为输入来修改图像编码
器的注意力行为,从而实现让模
型依据不同的任务和问题进行
信息的选择性过滤,从而实现更
高的计算效率和更准确的结果。 | 自
主
创
新 | 202110049695.2
2020109431874
202110049695.2 | 2019SR1205085
2022SR1590522
2024SR0315103
2021SR0479373
2022SR0887162
2021SR0985283
2023SR0198120
2022SR1409910
2023SR0920287
2024SR0151064
2024SR0149169
2024SR0315103
2024SR0357281 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、云月
数字人
AIoT设备:训练推理
一体机 |
| 3 | | | | | | | | |
| | | 通用多模
态大模型 | 开放世界的物体识别和行为
理解,往往因为外观多样化
和场景复杂多变导致现有的
单模态和多模态都难以学习
理解。设计具有引导性的多
模态算法,充分挖掘基于海
量数据预训练的视觉大模型
和语言大模型的潜力,无缝
地将视觉语义映射到语言的 | 1.基于自研的视觉大模型VIT和
语言大模型LMM。VIT基于海量
的高质量图文进行对比学习得
到,保证了对图像从全局到细节
的准确理解。同时LLM也经过海
量文本和高质量的微调数据进
行训练得到,保证了可以充分理
解视觉隐含的语义信息。
2.具备引导性的视觉与语言桥 | 自
主
创
新 | 202110049695.2
202011233268.1
202110049704.8
202011392551.9
202111131620.5
202110292039.5
2021106452939
2020109224588
2018112698826 | 2019SR1205085
2022SR1590522
2024SR0315103
2021SR0479373
2023SR0920287
2023SR0198120
2023SR0008642
2021SR0985283
2023SR0198120
2022SR1409910 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、云月
数字人
AIoT设备:训练推理
一体机 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | 逻辑表达空间,实现对开放
世界的通用理解能力。 | 接层与学习方法,可以在图文多
模态学习的同时,大幅度提高视
觉特征向语言空间过渡的信息
含量和质量,大幅度提升模型识
别能力和降低模型幻觉。 | | 2020104243099
2020100127633
2020109431874
202110049695.2 | 2024SR0359116 | |
| 4 | | | | | | | | |
| | | 行人多模
态大模型 | 结合视觉模型的细粒度感知
能力,语言模型的语义理解
能力,使用上百亿覆盖行人
属性/行为的真实数据,使得
视觉和语言在特征空间进行
对齐,构建出行人多模态基
础模型。针对任意行人检测/
识别任务,可以使用自然语
言描述的方式,对图片进行
结构化输出,实现所问即所
得。 | 1、模型训练,基于对多模态技术
的深入研究,使用上百亿行人数
据集,训练出包含百亿参数的基
础模型,针对行人下游任务表现
非常强的泛化能力。
2、Grounding能力,对基础模型
进行检测框细粒度的预训练,模
型具备极强的grounding能力,既
可以对指定的目标区域进行问
答,也可以让模型输出所描述行
人/物体的精确位置。
3、in-context learning能力,基
于多模态基础模型强大的泛化
能力,使得模型迁移到任意行人
下游任务,所需真实样本仅需在
百张量级,甚至可以zero-shot推
理即可获得超过原场景定制化
开发模型的效果。
4、数据和模型闭环,基于文生图
扩散模型,可以模拟无穷无尽非
常逼真的各种场景数据,用于图
生文多模态模型的训练,进而保
证多模态模型可以针对图像输 | 自
主
创
新 | 201811348058X
2018111390502
2019212184644
2018112698826
2021108523820
2021106452939
202110513268.5
202110919591.2
202011550424.7
202110920920.5
202111506333.8 | 2020SR0983700
2019SR0557794
2019SR0483181
2020SR0348906
2020SR0349213
2020SR0617519
2020SR0682593
2020SR0757461
2022SR1393587
2022SR1392437
2022SR1393599
2021SR0985283
2022SR1409910
2023SR0920287 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、安全
生成平台
AIoT设备:训练推理
一体机 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 出精准描述;同时,精准的文本
描述配合高质量的图像,可以反
哺扩散模型的持续改进。最终,
图生文和文生图二者相互促进,
实现数据和模型闭环。 | | | | |
| 5 | | | | | | | | |
| | | 多模态文
档大模型 | 文档影像类型众多,具有版
式复杂多样化、上下文信息
跨度大等特点,传统的文档
解析通常针对特定版式定制
开发,开发成本高昂且缺乏
对文档理解的泛化能力,通
过Transformer模型融合多模
态的信息表达,训练信息抽
取的泛化能力,实现zero-
shot的信息抽取功能。 | 1、多模态信息表达:Transformer
模型的多头自注意力机制能够
以全局视野发现版式特点,模型
的可扩展性能够组合图像、文
本、版式的信息有效训练;自研
文档建模方式可有效表达文档
的版式信息。
2、示例学习:通过训练模型的示
例理解能力,使模型可以在未知
版式时无需训练模型通过
prompt示例实现信息抽取。 | 自
主
创
新 | 2020107502413
202110292039.5
202110083664.9
2016208014308
2016109450120
202011467319.7
2021101713773
202110547961.4 | 2022SR0023369
2022SR1528698
2024SR0213772
2021SR0985283
2022SR1409910
2023SR0920287
2024SR0213772
2024SR0506319 | 操作系统应用产品:
银河人工智能平台、
大模型云平台
AIoT设备:训练推理
一体机 |
| 6 | | | | | | | | |
| | | 语言大模
型 | 高质量预训练语料收集和清
洗、高质量SFT/RLHF数据收
集和标注、模型预训练和微
调、模型价值观和偏好对齐、
模型长上下文处理能力提
升、模型工具调用能力提升。 | 知识水平测试名列前茅
(CEval)、实用基础能力测试名
列前茅(SuperCLUE、自建测试
集)、基于 100K长上下文
CongRong 大 模 型 , 在
Longbench,Loogle等长上下文
测试集上,取得领先成绩。 | 自
主
创
新 | 2020109431874
202011338954.5
2020112651780 | 2022SR0023369
2021SR0985283
2023SR0198120
2022SR1409910
2023SR0920287
2024SR0151064
2024SR0149169
2024SR0469677
2024SR0472447 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、云月
数字人
AIoT设备:训练推理
一体机 |
| 7 | | | | | | | | |
| | | VoiceGPT
多模态大
模型 | 语音多模态的 next token
prediction,可降低交互中因
口语化、停顿、重复等表达,
说话人口音、远近讲/场导致 | VoiceGPT多模态大模型,打造
智能语音交互新范式,通过一个
多模态模型可同时支持多语种
的语音识别,语音翻译,关键词 | 自
主
创
新 | 2020109431874
202110049695.2 | 2022SR0023369
2023SR0198120
2022SR1409910
2023SR0920287 | 操作系统应用产品:
银河人工智能平台、
大模型云平台、云月
数字人 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | 的识别错误带来的影响,进
行跨语种/语言交流,无需进
行ASR识别和机器翻译,一
个模型支持语音识别、语音
问答、文本问答、语音翻译等
多项任务。 | 识别,语音合成,语音问答等任
务,解决ASR因语种、口音、方
言、环境噪声、说话习惯导致的
识别不准确,从而影响最终人机
对话效果的交互难题。 | | | 2024SR0316776
2024SR0357281
2024SR0611330 | |
| 8 | 多
模
态
混
合
感
知 | 2D-3D混
合人脸识
别 | 通过结合2D的纹理特征以及
3D的形状特征,更准确的为
人脸特征建模,提高人脸识
别的精度,降低误识率。 | 2D-3D特征空间:自主研发的
PRNet方法,通过在uv空间构建
人脸的3Duv图,同时对单张静
态的2D人脸图像进行精准3D重
建,使得2D人脸图像可以和结
构光等专用设备采集的3D人脸
进行精确匹配。 | 自
主
创
新 | 2017103751311
2018107076902
2018103426184
2018112147768
2021111316205
201910672087X
202110719966 | 2015SR161207
2016SR197307
2017SR385003
2019SR0739590
2019SR0734710
2019SR0734702
2019SR1240250
2019SR1237081
2019SR0642287
2020SR0316864
2020SR0882283
2022SR1309172
2022SR1392653
2022SR1409920
2022SR1409910
2023SR0552935
2023SR0542771
2023SR1142706
2023SR1144144 | 操作系统应用产品:
云从科技活体检测
软件、云从科技集成
生物识别系统
AIoT设备:天官人脸
识别终端、人证核验
设备、天官视频人脸
门控机、比邻星红外
双目活体安全模组、
如意支付PAD、北极
星结构光相机、大角
星TOF相机 |
| 9 | | | | | | | | |
| | | 多粒度行
人重识别
网络 | 根据人体空间结构的信息,
利用多粒度分析的模型结构
实现对人体全局特征及局部
特征的融合,提高人体检索
的精度。 | 1、创新架构:根据行人上下结构
化信息特点设计了针对性的多
粒度神经网络,配合差异化细节
架构与损失函数,可实现对人体
全局特征到局部特征的统一提 | 自
主
创
新 | 201811348058X
2018111390502
2019212184644
2018112698826
2021108523820
2021106452939 | 2020SR0983700
2019SR0557794
2019SR0483181
2020SR0348906
2020SR0349213
2020SR0617519 | 操作系统应用产品:
火眼人脸大数据平
台、智能云平台、智
能安防管理系统 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 取。
2、性能优越:大幅提高行人重识
别的性能,在权威数据集上取得
了业界领先的结果,首位命中率
达到98.63%,平均精度均值达到
97.52%。
3、算法可落地:该网络架构设计
简单高效,速度快,精度高,满
足大规模的商业落地的要求。
4、普适性强:核心算法具有很强
的迁移能力,在车辆、人脸等相
似任务上也取得了显著成果。 | | 2021102920395
202110932105.0
202110292039.5
202110105939.4
202110920920.5
202111506333.8 | 2020SR0682593
2020SR0757461
2022SR1393587
2022SR1392437
2022SR1393599
2023SR0138569
2023SR0275783
2023SR0275785
2023SR0804100
2023SR0804102
2023SR0804105
2023SR0804102 | |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| 10 | | 开放版式
票据识别
系统 | 通过对预训练模型迁移学习
的方式,降低不同票据字体
差异的影响,同时建立票据
训练“所标即所得”的自动化
流程,降低不同票据版式的
定制化成本,并自动进行语
义结构化,降低票据识别的
成本及门槛。 | 1、模拟数据生成:归纳现有的字
体种类,通过分类及图像变换的
方式自动生成目标字体的训练
数据。
2、训练模型:通过融合240多种
字体的训练数据,训练效果好的
预训练模型。
3、所标即所得的检测:通过少量
的标注,在预训练模型的基础上
迅速定位感兴趣的字段位置。
4、自动语义结构化:通过增量学
习自动识别文字,通过NLP自动
解析成结构化字段。 | 自
主
创
新 | 201610587650X
2016109450120
2017103751078
2021101713773
202110083664.9
202111000445.6
202110547961.4 | 2016SR364178
2017SR355674
2017SR378348
2019SR0476626
2019SR1061239
2020SR0348906
2020SR0345827
2020SR0349001
2020SR0348989
2020SR0345818
2022SR0894630
2022SR0925979
2022SR0894628
2022SR1393588
2022SR1392651
2022SR1392650
2022SR1411149
2022SR1411036
2022SR1411038
2022SR1411037
2022SR1409913
2022SR1409912
2022SR1409908
2023SR1136120 | 操作系统应用产品:
智能云平台、视图汇
聚分析平台、云从科
技OCR识别软件 |
| 11 | | | | | | | | |
| | | 增量结构
化解析网
络 | 通过共享主干网络的方式,
降低识别人体/车辆不同属
性的计算量,同时通过注意
力模型聚焦局部特征的提
取,可快速拓展属性识别的
种类。 | 1、共享主干网络,结构化属性扩
展:通过共享主干特征的方式提
升训练及推理效率,并可动态的
支持新的结构化属性,并且不影
响现有的属性的效果。
2、注意力模型:通过注意力模型
及不同属性的相互验证提升属 | 自
主
创
新 | 2016109529202
2018112954235
2021106938006
2021103420404
202210428109.X | 2016SR347155
2016SR354065
2022SR0853073
2016SR360879
2019SR0281195
2019SR0739590
2019SR0476626 | 操作系统应用产品:
云从科技集成生物
识别系统、视图汇聚
分析平台 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 性的效果。 | | | 2019SR1005070
2020SR0983693
2020SR0882283
2020SR1501173
2021SR0125485 | |
| 12 | | | | | | | | |
| | | 自生成对
抗活体检
测网络 | 为了提升活体检测对不同攻
击的泛化性能,通过对抗攻
击的方式不断探索模拟新的
攻击方式,并优化防守检测
的特征,提升活体检测的安
全性及用户体验。 | 1、活体检测场景泛化性:该技术
具有很强的场景泛化能力,能够
基于可见光图片、红外图片、深
度图片进行人脸活体检测及属
性分析,支持各种前端摄像头设
备。
2、安全性:算法准确率高,在正
常、极端光照下,真人通过率达
到99%,防攻击能力在99.9%以
上,能够抵御照片、面具、视频
翻拍、头模等各种攻击类型。
3、响应时间:能够实现毫秒级的
活体结果反馈,对摄像头捕捉到
的人脸进行实时活体属性分析。
4、用户体验:同时支持配合式和
非配合式的活体检测方式。
5、平台兼容性:部署成本低,兼
容手机移动端、边缘计算盒子、
普通PC机、云端服务器等各种
硬件平台。 | 自
主
创
新 | 201710160685X
2019211784985
2019211779224
2019222330331
2019211784805
2019110314652
2019110314987
2019108729012 | 2017SR067793
2017SR353710
2017SR355036
2017SR360453
2017SR360467
2019SR1232871
2019SR0734695
2019SR0735147
2019SR0739590
2019SR0734702
2019SR0734710
2019SR1240250
2019SR1237081
2020SR0353475
2020SR0353487
2020SR0353481
2020SR0882283 | 操作系统应用产品:
云从科技集成生物
识别系统、云从科技
活体检测软件
AIoT设备:如意支付
PAD、北极星结构光
相机 |
| 13 | | | | | | | | |
| | | 多模态信
号感知设
备 | 通过视觉检测的方式辅助语
音的声源定位及唤醒,更好
的获取高质量的语音信号, | 1、多模态数据采集:视觉部分集
成3D结构光活体检测技术,可
在100ms内快速识别,真人通过 | 自
主
创 | 2015101788986
2016211727546
2019109779150
2021101642941 | 2016SR106359
2016SR106643
2019SR0720380
2019SR1204990 | AIoT设备:智慧航显 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | 降低噪声对后端语音识别的
影响,提升识别精度。 | 率超过99.9%,防攻击能力2D
99.999%,3D 99.9%;音频采集
涵盖波束形成、声源测向、语音
活体检测等多重算法。
2、多模态数据增强:涵盖去混
响、回声消除、降噪等多重算法,
支持双讲场景,语音活动检测算
法准确率达到98%。
3、视觉-语音相互辅助:结合人
脸识别和语音技术,身份验证准
确率可以达到99.9%以上。 | 新 | 2021100496952
2020112614616
202230110439.5
2022305066373
202130826983.5
202011483189.6 | 2019SR0740430
2019SR0734718
2020SR0816461
2020SR0983707
2020SR0985404
2022SR0887164
2022SR0894659
2022SR1455487 | |
| 14 | | | | | | | | |
| | | 多因子生
物认证技
术 | 每一种生物特征都有它的强
项和弱项,通过多因子的方
式进一步提升生物识别认证
的精度。 | 多因子生物识别:通过人脸识别
+声纹识别、人脸识别+指静脉识
别等多种不同的生物特征识别
方法叠加进行多因子校验,提升
认证的准确率,并可以开放集成
更多的生物识别技术。 | 自
主
创
新 | 2018112921424
2019211784595
2019211784260
2019214594164
2019108729012 | 2016SR357425
2016SR104758
2016SR041982
2016SR106359
2016SR106643
2016SR106633
2017SR354230
2019SR0740430
2019SR0734718
2019SR1205085
2020SR0983707
2020SR0816461
2020SR0882283
2022SR1409910
2022SR1455486 | 操作系统应用产品:
云从科技集成生物
识别系统、商业慧眼
平台
AIoT设备:如意支付
PAD、 |
| 15 | 动
态
异 | 动态注意
力预测 | 视频数据量非常大,同时帧
间存在较多冗余,如果逐帧
逐行分析会造成严重浪费, | 1、场景自理解:自动识别视频内
容的场景,根据不同的场景分类
设置不同的策略。 | 自
主
创 | 2016205246695
2019114118162
2018112698826
2021103823689 | 2016SR182399
2016SR360618
2017SR390791
2019SR1197964 | 操作系统应用产品:
云从科技OCR识别
软件、火眼人脸大数 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | 构
理
解 | | 通过时空注意力模型快速定
位感兴趣区域及时间段,并
着重分析该感兴趣区域,能
极大提升视频分析的效率,
减少资源浪费。 | 2、空间注意力预测:通过多模态
注意力模型预测空间中最感兴
趣的区域。
3、时间注意力预测:通过多维度
数据建模预测时间注意力。
4、目标注意力预测:通过专家知
识及场景分析预测不同目标的
关注度。 | 新 | 2021103618805 | 2020SR0407702
2020SR0983723
2020SR0289232
2020SR0289230
2022SR1393588
2022SR1392651
2022SR1392650
2022SR1411149
2022SR1411036
2022SR1411038
2022SR1409913
2022SR1409912
2022SR1409908 | 据平台
AIoT设备:智慧航显 |
| 16 | | | | | | | | |
| | | 多信道行
为识别系
统 | 人体的动作行为是一个时间
与空间相联系的状态,通过
融合时间上的前后依赖及空
间上的相互关系,可更准确
的识别行为。通过自动建模
平台解决了行为的多样性问
题,同时可以快速的建模动
作行为,降低生产成本。 | 1、多信息融合识别:自主研发的
多信道行为系统可融合图片、视
频、语音等多种形式的信息进行
综合识别,实现对多种形式的人
体行为识别与综合视频内容理
解。
2、性能高:错综复杂的系统经过
算法与工程的优化后,可实现实
时的高精度的行为识别。
3、支持种类多样:能够支持各类
应用场景上百种行为识别。
4、人物场综合认知:支持人、
物、场等多种对象在空间与时间
上的复杂交互与综合认知。
5、支持快速定制:基于AI自动
建模平台,可实现针对特定客户 | 自
主
创
新 | 201420509667X
2016207873041
2016205244238
2018112687253
2018203909679
2021100234199
2021106938006
202111020831.1
202110674089.X | 2016SR354067
2016SR357429
2019SR0752817
2019SR1193406
2022SR1393587
2022SR1392653
2022SR1392431
2022SR1392425 | 操作系统应用产品:
火眼人脸大数据平
台、云从科技集成生
物识别系统 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 高度定制的行为识别的任务,相
比专家建模,缩短了项目实施时
间并大幅减少实施成本。 | | | | |
| 17 | | | | | | | | |
| | | 多模态人
机对话 | 通过视觉和语音多维度信息
的融合,自然的“察言观色”,
更好的理解与客户对话的背
景和意图,之后通过融合专
家知识给客户提供专业的建
议与服务。 | 1、视觉-语音混合增强:通过视
觉检测定位辅助麦克风阵列进
行声源定位及增强。
2、多维度信息理解:通过视觉场
景识别、属性识别、语音识别综
合进行对话状态判定。
3、专家知识融合:融合专家经验
进行对话生成。 | 自
主
创
新 | 2019109779112
2021100496952
2021101713773
2020112614616
2021307089021 | 2019SR1205085
2019SR0739590
2020SR0324897
2020SR0882283
2022SR1392437
2022SR1392431
2022SR1393600 | 操作系统应用产品:
云从科技集成生物
识别系统、智能安防
管理系统
AIoT设备:智慧航显 |
| 18 | 全
链
AI
建
模
平
台 | 基于聚类
的无监督
训练 | 数据标注非常耗费资源,同
时人脸识别的标注存在大量
不确定性,人眼已经无法准
确的区分出人的身份,通过
结合视频中的时空关系和跨
摄像头的聚类,可以自动为
每个人生成ID作为训练监督
信号,同时通过噪声抑制的
训练方式解决聚类带来的标
注不准的问题,减少了数据
标注成本。 | 1、无监督训练:利用无标签的数
据(如抓拍图或视频)实现自主
学习,提升人脸识别算法的性
能。
2、结合时空信息聚类:基于小型
化的表征模型和运动估计模型,
跟踪视频中的人物运动轨迹,并
采用基于图神经网络的超大规
模人脸聚类算法,合并因遮挡或
交叉形成的轨迹片段,建立起
“一人一档”的训练数据。
3、有噪声数据训练:由于聚类质
量可靠稳定,可用于训练和提升
人脸识别模型。性能提升后的模
型,反馈到跟踪模块和聚类模
块,进一步提升跟踪和聚类性
能。 | 自
主
创
新 | 2018113067031
2020102909832
2021100496952
2021306945443
2021308575101
2022308676802
2022308755310 | 2017SR360020
2018SR087949
2019SR0919299
2019SR1005070
2020SR0312428
2020SR0348906
2020SR0312293
2020SR1503078
2021SR0125525
2022SR0894629
2022SR1393571
2023SR0104039
2023SR0104038 | 操作系统应用产品:
动态人脸识别系统、
商业慧眼平台 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| 19 | | 基于主动
学习的数
据标注闭
环 | 样本标注由于样本冗余等因
素导致非常耗费资源,通过
主动学习自动发现最有价值
的样本,并优先标注这些对
学习有帮助的样本,可以降
低标注成本,提升训练的速
度。 | 1、完整数据标注闭环系统:自主
研发深度学习模型、主动学习模
型、样本评估排序、标注平台等
核心模块,通过主动学习算法计
算出最有价值的样本进行标注,
在保证模型训练效果的前提下,
大幅度降低数据标注量。
2、主动学习选择样本:算法可分
析出未标注样本的不确定性和
代表性,在实际场景模型部署的
过程中,可从业务方海量未标注
图片中分析出有价值的样本,实
现少量标注样本就可以训练出
满足特定业务场景的个性化模
型。 | 自
主
创
新 | 2018113067031 | 2017SR360020
2018SR087949
2019SR0919299
2019SR1005070
2020SR0312428
2020SR0312293
2020SR0348906
2020SR1503078
2021SR0125526
2022SR0843038
2022SR1457948 | 操作系统应用产品:
云从科技集成生物
识别系统、智能云平
台、商业慧眼平台、
训练推理一体化平
台 |
| 20 | | | | | | | | |
| | | 正例-无
标注学习 | 大量训练任务存在训练样本
不均衡的状况,即绝大多数
均为正常样本、异常样本极
少出现。为了检测异常样本,
借鉴判别对抗网络的思路,
通过分类器和判别器相互博
弈去逼近理想的贝叶斯分类
器,降低业务上对训练数据
的依赖。 | 1、解决样本严重不均衡:通过拟
合正样本分布来解决分类问题,
应对金融风控等场景下正负样
本比例不均衡、某一类样本标注
成本较大或者较难获得的困难。
2、判别对抗网络:提出了全新的
基于判别对抗网络来解决一般
数据分布条件下的正例-无标注
学习问题。以分类器识别未标注
数据中真正的正负数据,通过分
类器和判别器相互博弈训练,最
小化被标注的正数据分布和被
分类器识别的正数据分布之间 | 自
主
创
新 | 2021101956582
202111642391.3 | 2019SR0919299
2019SR1005070
2020SR0312428
2020SR0312293
2022SR1457948
2022SR0023369 | 操作系统应用产品:
云从科技集成生物
识别系统、智能云平
台、商业慧眼平台、
训练推理一体化平
台 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 的距离去逼近理想的贝叶斯分
类器。 | | | | |
| 21 | | | | | | | | |
| | | 自动特征
生成 | 特征生成是数据处理与分类
的基础,自动特征生成可以
快速高效的从海量日志数据
中提取特征,降低人工成本,
提升特征生成效率。 | 自动特征生成:自动特征生成可
实现一(用户)对多(行为)的
行为记录表等常见原始日志型
数据的特征生成,并最终聚合到
用户维度,大幅提升数据特征生
成效率。 | 自
主
创
新 | 201811348058X
2018112698826 | 2016SR347140
2019SR0157218
2019SR0755149
2019SR1005070
2019SR0557794
2019SR0483181
2020SR0983700
2020SR0348906
2020SR0349213
2020SR0617519
2022SR1393597
2022SR1409919 | 操作系统应用产品:
云从科技集成生物
识别系统、智能云平
台、商业慧眼平台 |
| 22 | | | | | | | | |
| | | 视觉长尾
定制训练
平台 | 视觉场景存在大量的长尾定
制任务,需要大量算法工程
师投入。通过建立标准化训
练平台,打通数据标注、模型
训练、模型评估的闭环,并通
过在预训练模型上迁移学习
的方法,利用AutoML自动搜
索适合场景的参数,可快速
低成本的完成长尾定制任
务,降低项目人力成本。 | 1、数据标注管理:支持图片、视
频数据各类数据的交互式智能
标注和汇聚存储,具备完善的标
注任务管理、分发功能,支持
1000人同时进行标注。
2、数据处理能力:支持单机版/
分布式数据处理功能,内置常见
数据预处理模块和数据增强模
块,支持全自动化生成。
3、算法训练能力:支持检测、分
类、分割、风格迁移等各种视觉
算法任务的自动化训练,集成相
关领域算法专家的经验设计,具
有AutoML自动化建模能力,可
以训练运行在各种计算平台的 | 自
主
创
新 | 2016109529202
2018112954235
202010945916X
2018112698826
2021103823689
202110361880.5
2022100542230 | 2016SR364178
2016SR197287
2017SR355674
2017SR378348
2019SR0557794
2020SR0682600
2020SR0681402
2020SR0732207
2022SR0843038
2022SR0853073
2022SR0894630
2022SR1393588
2022SR1392651
2022SR1392650
2022SR1392647
2022SR1392427
2022SR1411149 | 操作系统应用产品:
火眼人脸大数据平
台、智能云平台、训
练推理一体化平台 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 算法模型。
4、模型部署测试:支持模型的自
动化部署和推理测试,自动进行
模型剪枝、量化、格式转换和平
台适配。 | | | 2022SR1411036
2022SR1411040
2022SR1411039
2022SR1411038
2022SR1409914
2022SR1409913
2022SR1409912
2022SR1409908
2022SR1457948 | |
| 23 | | | | | | | | |
| | | 开放集的
小样本物
体检测与
识别 | 检测识别任务在落地实际场
景中面临的一个大的挑战是
只有少量的标注数据可以用
来训练,同时识别类别又是
在使用过程中动态扩充的,
这就需要在小样本数据的状
态下能及时识别新增类别。 | 1、无监督聚类预训练:扩充同
类应用的无标签数据,并通过无
监督聚类的方式生成软标签进
行预训练模型的学习。
2、领域融合的学习:扩充的数据
与原生数据存在较大的领域差
别,直接混合在一起训练会导致
效果不佳,通过领域融合迁移的
方式消除领域差异,使学习聚焦
在本身的特征。 | 自
主
创
新 | 2020109450150
202010945916X
202110181900.0 | 2020SR0407697
2020SR0407568
2020SR1514304
2022SR0994810
2022SR1409914 | 操作系统应用产品:
智能云平台、商业慧
眼平台 |
| 24 | 人
机
协
同
操
作
系
统 | 人机协同
实时操作
系统 | 人机协同建立了从感知-理
解-决策的业务闭环,整套系
统涉及到云边端联动,同时
管理各个任务的实时调度。
通过人机协同操作系统可抽
象底层算法实现,为业务提
供可扩展的各种应用接口,
同时通过实时任务调度高效
响应各种应用的执行。 | 1、实时资源动态调度:系统可应
对海量数据接入与调取,根据感
知预测动态调用AI引擎、切换分
析模型,实现在有效资源下实时
解析海量数据。
2、云边端一体协同计算:系统结
合云端全局分析及调度,定制统
一数据协议和调用协议,打造协
同一体计算,结合边端设备响应
快和云端全局分析的能力。 | 自
主
创
新 | 2016104606306
2016208014308
201620879342X
2021101713773
2018112698826
2020109224588
2020112614616
2021308269835
2021101819000
202230867680.2
202230875531.0 | 2017SR360010
2019SR0281198
2020SR0328435
2020SR0367956
2020SR0367187
2020SR0406388
2020SR0406062
2020SR0406067
2020SR0406486
2020SR0406079
2020SR0406342 | 操作系统应用产品:
智能云平台、火眼人
脸大数据平台、云从
科技集成生物识别
系统 |
| 序
号 | 技
术
类
别 | 技术名称 | 技术内容 | 技术先进性及其表征 | 技
术
来
源 | 相关专利 | 相关软件著作权 | 相关核心技术对应
产品情况 |
| | | | | 3、高性能小文件存储:针对视
频、图片等视觉信息开发专用存
储功能,支持相关文件在训练过
程需要在低延迟的条件下反复
读取以及在检索和显示上的快
速响应。
4、AI应用商店:打通AI模型从
训练、发布、调用的闭环,可以
根据需求动态下载,启动AI应
用。 | | 202210304330.4 | 2020SR0406337
2020SR0406331
2020SR0406700
2020SR0406423
2020SR0406429
2020SR0406542
2020SR0682694
2020SR0682678
2021SR0125526
2022SR0023369
2022SR1393590
2022SR1409910
2023SR0804101 | |
(未完)