一、 本公司董事会、监事会及董事、监事、高级管理人员保证半年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。
截至2023年6月30日,公司尚未实现盈利,主要系公司专注于大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具等基础软件领域研发,大数据基础软件行业属于技术密集型行业,具有研发投入高、研发周期长、技术壁垒高的特点。公司坚持“自主研发、领先一代”的技术发展策略,目前公司正处于快速成长期,在研发、销售及管理等方面持续投入较大,公司目前的营业收入规模相对较小,尚未形成突出的规模效应,不能完全覆盖各项期间费用及成本的投入。报告期内,为不断寻求技术突破以加强产品竞争力,公司持续加大研发投入力度,不断寻求技术突破以加强产品竞争力。同时,公司加强销售队伍的建设,进行相关垂直行业的市场开拓、客户挖掘及行业深耕,以保证公司业务的持续稳定增长。
第一节 释义.................................................................. 5 第二节 公司简介和主要财务指标 ............................................... 13 第三节 管理层讨论与分析 ..................................................... 17 第四节 公司治理 ............................................................. 51 第五节 环境与社会责任 ....................................................... 53 第六节 重要事项 ............................................................. 55 第七节 股份变动及股东情况 ................................................... 90 第八节 优先股相关情况 ....................................................... 97 第九节 债券相关情况 ......................................................... 97 第十节 财务报告 ............................................................. 98
| 常用词语释义 | | |
| 本公司、公司、股份公司、
星环科技 | 指 | 星环信息科技(上海)股份有限公司,由星环信息科技(上
海)有限公司于2020年 12 月整体变更设立的股份有限公
司 |
| 星环有限 | 指 | 星环信息科技(上海)有限公司,系本公司的前身 |
| 控股股东、实际控制人 | 指 | 孙元浩 |
| 赞星投资中心 | 指 | 上海赞星投资中心(有限合伙) |
| 云友投资 | 指 | 上海云友投资事务所 |
| 方广资本 | 指 | 苏州方广创业投资合伙企业(有限合伙) |
| 恒生电子 | 指 | 恒生电子股份有限公司 |
| 信雅达 | 指 | 信雅达科技股份有限公司 |
| 勤智优选 | 指 | 深圳前海勤智优选投资合伙企业(有限合伙) |
| 勤智优选二号 | 指 | 深圳前海勤智优选二号投资合伙企业(有限合伙) |
| 启明创投 | 指 | 苏州启明融合创业投资合伙企业(有限合伙) |
| 瑞赑投资 | 指 | 上海瑞赑广弘投资管理合伙企业(有限合伙) |
| 深创投 | 指 | 深圳市创新投资集团有限公司 |
| 中小企业发展基金 | 指 | 深圳国中中小企业发展私募股权投资基金合伙企业(有限
合伙),曾用名为“中小企业发展基金(深圳有限合伙)” |
| 扬航基石 | 指 | 金华扬航基石股权投资合伙企业(有限合伙) |
| 林芝利创 | 指 | 林芝利创信息技术有限公司 |
| 兴瑞智新 | 指 | 青岛兴瑞智新股权投资中心(有限合伙) |
| 中金祺智 | 指 | 中金祺智(上海)股权投资中心(有限合伙) |
| 长江合志 | 指 | 湖北省长江合志股权投资基金合伙企业(有限合伙) |
| TCL | 指 | 深圳TCL战略股权投资基金合伙企业(有限合伙) |
| 宁波准睿 | 指 | 宁波梅山保税港区准睿创业投资合伙企业(有限合伙),曾
用名为“宁波梅山保税港区凖睿股权投资合伙企业(有限合
伙)” |
| 金山红土 | 指 | 上海金山红土创业投资中心(有限合伙) |
| 溧阳红土 | 指 | 溧阳红土新经济创业投资基金合伙企业(有限合伙) |
| 长峡金石 | 指 | 长峡金石(武汉)股权投资基金合伙企业(有限合伙),曾
用名为“三峡金石(武汉)股权投资基金合伙企业(有限合
伙)” |
| 交控金石 | 指 | 安徽交控金石并购基金合伙企业(有限合伙) |
| 产业基金 | 指 | 产业投资基金有限责任公司 |
| 中金澔晨 | 指 | 宁波梅山保税港区中金澔晨股权投资合伙企业(有限合伙) |
| 渤盛嘉远 | 指 | 湖北渤盛嘉远股权投资合伙企业(有限合伙) |
| 鲲鹏一创 | 指 | 深圳市鲲鹏一创战略新兴产业股权投资基金合伙企业(有
限合伙) |
| 交银科创 | 指 | 交银科创股权投资基金(上海)合伙企业(有限合伙) |
| 惠华启星 | 指 | 共青城惠华启星投资合伙企业(有限合伙) |
| 珠海淳荣 | 指 | 珠海横琴任君淳荣股权投资基金(有限合伙) |
| 晶凯艺赢 | 指 | 宁波梅山保税港区晶凯艺赢股权投资合伙企业(有限合伙) |
| 朗玛二十五号 | 指 | 朗玛二十五号(深圳)创业投资中心(有限合伙) |
| 厦门新鼎 | 指 | 青岛新鼎啃哥瑞叁私募股权投资合伙企业(有限合伙),曾
用名为“厦门新鼎啃哥叁号股权投资合伙企业(有限合伙)” |
| 朗玛三十一号 | 指 | 朗玛三十一号(深圳)创业投资中心(有限合伙) |
| 国科瑞华 | 指 | 深圳市国科瑞华三期股权投资基金合伙企业(有限合伙) |
| 国科正道 | 指 | 北京国科正道投资中心(有限合伙) |
| 青岛新鼎 | 指 | 青岛新鼎啃哥柒号股权投资合伙企业(有限合伙) |
| 创业接力一 | 指 | 上海创业接力创业投资有限公司 |
| 创业接力二 | 指 | 上海创业接力企业服务有限公司 |
| 杨浦梦航 | 指 | 上海杨浦梦航创业投资中心(有限合伙) |
| 接力同行 | 指 | 上海接力同行一号创业投资中心(有限合伙) |
| 接力同行二号 | 指 | 上海接力同行二号投资中心(有限合伙) |
| 中金星环1号 | 指 | 中金星环1号员工参与科创板战略配售集合资产管理计划 |
| 中金星环2号 | 指 | 中金星环2号员工参与科创板战略配售集合资产管理计划 |
| 嘉兴星瀚 | 指 | 嘉兴星瀚股权投资管理合伙企业(有限合伙) |
| 嘉兴星环 | 指 | 嘉兴星环股权投资管理合伙企业(有限合伙) |
| 嘉兴星业 | 指 | 嘉兴星业股权投资管理合伙企业(有限合伙) |
| 嘉兴星智 | 指 | 嘉兴星智股权投资管理合伙企业(有限合伙) |
| 嘉兴星荣 | 指 | 嘉兴星荣股权投资合伙企业(有限合伙) |
| 嘉兴星源 | 指 | 嘉兴星源股权投资合伙企业(有限合伙) |
| 上海业星 | 指 | 上海业星企业管理中心(有限合伙) |
| 英特尔 | 指 | 英特尔亚太研发有限公司 |
| 逸迅科技 | 指 | 上海逸迅信息科技有限公司 |
| 财政部 | 指 | 中华人民共和国财政部 |
| 工信部 | 指 | 中华人民共和国工业和信息化部 |
| 信通院 | 指 | 中国信息通信研究院 |
| 保荐人、保荐机构 | 指 | 中国国际金融股份有限公司 |
| 中国证监会 | 指 | 中国证券监督管理委员会 |
| 上交所 | 指 | 上海证券交易所 |
| 《公司法》 | 指 | 《中华人民共和国公司法》 |
| 《证券法》 | 指 | 《中华人民共和国证券法》 |
| 《企业会计准则》 | 指 | 财政部于2006年2月15日颁布的《企业会计准则》及其
应用指南和其他相关规定,以及相关规定、指南的不时之修
订 |
| 报告期 | 指 | 2023年1月1日至2023年6月30日 |
| 报告期期末 | 指 | 2023年6月30日 |
| 元/万元/亿元 | 指 | 人民币元/万元/亿元 |
| 数据库 | 指 | 按照数据结构来组织、存储和管理数据的仓库 |
| 数据管理系统 | 指 | 用户用以对计算机的数据库进行控制、更新、扩充、传送和
其他操作的软件系统 |
| 数据管理软件 | 指 | 涉及关系型/非关系型、集中式/分布式、多模型、云原生等
一种或多种数据管理模式的软件集合 |
| SQL | 指 | SQL(Structured Query Language),结构化查询语言
的缩写,用于存取数据以及查询、更新和管理关系数据库系
统 |
| 大数据平台 | 指 | 处理海量、个性化、多样化的数据存储、计算及流数据实时
计算等场景为主的一套基础设施 |
| 操作系统 | 指 | 管理计算机硬件与软件资源的计算机程序 |
| 集群 | 指 | 用商品化互连网络把商品化计算机作为基本单元连接起
来,配置松散耦合的计算机软件,以协作完成计算工作的计
算机系统 |
| 数据仓库 | 指 | 面向主题、不可更新、随时间不断变化的数据集合,用于支
持企业或组织的决策分析处理。为了便于多维分析和多角 |
| | | 度展现而将数据按特定的模式进行存储所建立起来的关系
型数据库 |
| 数据湖 | 指 | 一个以原始格式存储数据的存储库或系统。它可以按原样
存储数据,而无需事先对数据进行结构化处理 |
| 数据集市 | 指 | 一种面向特定应用的、更小更集中的数据仓库,主要针对具
体的、部门级别的应用 |
| 分析型数据库 | 指 | 主要对来自交易数据库或其他数据源的历史数据进行高效
地批量查询或分析,主要用于企业内部数据决策分析、数字
化运营等领域 |
| 交易型数据库 | 指 | 实时的、面向应用的数据库,响应及时性要求很高,具备快
速读写单个数据行的能力,同时保证数据完整性 |
| OLAP | 指 | OLAP(Online Analytical Processing),指联机分析处
理,基于数据仓库中的海量数据进行的联机的复杂查询和
多维分析处理 |
| 多模型数据库 | 指 | 一种在统一、综合的平台下同时支持多种不同的数据模型
的数据库,数据模型可包括传统的关系模型和 NoSQL 数据
模型(文档模型,键值模型,图模型),多模型数据库拥有
一种或多种查询语言 |
| 闪存数据库 | 指 | 一种以闪存为存储介质,针对闪存高性能读写特点而设计
的数据库,主要应用于对复杂查询有较高性能要求的场景 |
| 时序数据库 | 指 | 一种以具有时间标签特征(按照时间顺序变化)的数据作为
基本存储和处理单元的数据库,主要应用于金融交易数据
分析、传感器数据分析等场景 |
| 对象存储 | 指 | 以对象作为存储基本单元的技术,用于解决分布式场景下
文件目录带来的性能问题,拥有扁平化、便于扩展、简单访
问的特点。 |
| NoSQL | 指 | NotOnly SQL,泛指非关系型的数据库,数据存储可以不需
要固定的表格模式,一般有水平可扩展性的特征 |
| 分布式技术 | 指 | 一种基于网络的计算机处理技术,与集中式相对应 |
| 分布式系统 | 指 | 分布式系统是多个处理机通过通信线路互联而构成的松散
耦合的系统 |
| 分布式架构 | 指 | 计算机的一种布置方式,将一个硬件或软件组件分布在不
同主机上,主机之间通过网络连接,彼此之间仅仅通过消息
传递进行通信和协调 |
| 分布式文件系统 | 指 | 是指文件系统管理的物理存储资源不一定直接连接在本地
节点上,而是通过计算机网络与节点(可简单的理解为一台
计算机)相连;或是若干不同的逻辑磁盘分区或卷标组合在
一起而形成的完整的有层次的文件系统 |
| 集中式架构 | 指 | 计算机的一种布置方式,由一台或多台主计算机组成中心
节点,数据存储以及整个系统的业务单元都集中部署于该
中心节点,系统所有的功能均由中心节点集中提供 |
| 传统关系型数据库 | 指 | 关系型的集中式数据库,例如Oracle |
| 非关系型数据库 | 指 | 以非关系模型(文档模型、键值模型、图模型)数据作为基
本存储和处理单元的数据库 |
| AI | 指 | 人工智能(Artificial Intelligence),是研究、开发用
于模拟、延伸和扩展人的智能的理论、方法、技术及应用系
统的一门技术科学 |
| 数据科学平台 | 指 | 利用数据、算法、机器学习和AI技术发现模式并构建预测
的平台 |
| 机器学习 | 指 | 专门研究计算机如何模拟或实现人类的学习行为,以获取 |
| | | 新的知识或技能,重新组织已有的知识结构使之不断改善
自身的性能 |
| 深度学习 | 指 | 是一种以人工神经网络为架构,学习数据的内在规律和表
示层次,其本质是使用深度神经网络处理海量数据 |
| 知识图谱 | 指 | 一种揭示实体之间关系的语义网络,可用于高效描述现实
世界中的关联关系 |
| 边缘计算 | 指 | 在靠近物或数据源头的一侧,采用网络、计算、存储、应用
核心能力为一体的开放平台,就近提供最近端服务 |
| 数据模型 | 指 | 数据模型是数据特征的抽象,它从抽象层次上描述了系统
的静态特征、动态行为和约束条件,为数据库系统的信息表
示与操作提供一个抽象的框架。数据模型所描述的内容有
三部分,分别是数据结构、数据操作和数据约束 |
| 数据治理 | 指 | 涉及数据使用的一整套管理行为 |
| 数据资产 | 指 | 由个人或企业拥有或者控制的,能够为企业带来未来经济
利益的,以物理或电子的方式记录的数据资源 |
| 索引 | 指 | 为了加速对数据的检索而创建的一种存储结构 |
| 编译 | 指 | 从源语言编写的源程序产生目标程序的过程 |
| 事务 | 指 | 数据库事务是构成单一逻辑工作单元的操作集合 |
| 分布式事务 | 指 | 事务的参与者、支持事务的服务器、资源服务器以及事务管
理器分别位于不同的分布式系统的不同节点之上 |
| 高并发 | 指 | 通常是指通过设计保证系统能够同时并行处理大量请求 |
| 节点 | 指 | 软件在一台物理机器上的一套运行环境 |
| 计算引擎 | 指 | 专门处理数据的程序 |
| 搜索引擎 | 指 | 一种信息检索系统,旨在协助搜索存储在计算机系统中的
信息 |
| 存储引擎 | 指 | 数据库管理系统用于从数据库增删查改(CRUD)数据的底层
软件组件 |
| 云平台 | 指 | 基于硬件资源和软件资源的服务,提供计算、网络和存储能
力 |
| 数据云技术 | 指 | 数据云是采用o技术打造的PaaS云,它以数据为中心,提
供完整的数据、应用和智能的开发工具,实现数据和应用互
通互联的云技术,可以更好地加速数字化建设 |
| 云计算 | 指 | 通过网络以按需、易扩展的方式获得所需的资源(硬件、平
台、软件)。提供资源的网络被称“云”。“云”中的资源
在使用者看来是可以无限扩展的,并且可以随时获取,按需
使用 |
| 云原生 | 指 | 云原生技术有利于各组织在公有云、私有云和混合云等新
型动态环境中,构建和运行可弹性扩展的应用。云原生的代
表技术包括容器、服务网格、微服务、不可变基础设施和声
明式API |
| 公有云 | 指 | 云服务提供商部署IT基础设施并进行运营维护,将基础设
施所承载的标准化、无差别的IT资源提供给公众客户的交
付模式 |
| 私有云 | 指 | IT 基础设施的所有权属于该企业或机构,但外包给专业服
务商进行部署和托管的云服务模式 |
| 混合云 | 指 | 用户同时使用公有云和私有云的模式。一方面,用户在本地
数据中心搭建私有云,处理大部分业务并存储核心数据;另
一方面,用户通过网络获取公有云服务,满足峰值时期的IT
资源需求 |
| PaaS | 指 | PaaS(Platform as a Service),平台即服务的缩写,构 |
| | | 建在IaaS之上,除了基础架构之外,还提供软件应用的开
发组件和运行环境通常还具备相应的存储接口 |
| IaaS | 指 | IaaS(Infrastructure as a Service),基础
架构即服务的缩写,即通过虚拟化技术将服务器等计算平
台和存储和网络资源一起打包,通过 API 接口的方式提供
给用户 |
| IEEE | 指 | IEEE(Institute of Electrical and Electronics
Engineers), 一个国际性的电气和电子工程师协会,是世
界上最大的专业技术组织之一 |
| 容器 | 指 | 一个标准化的软件单元,它将代码及其所有依赖关系打包,
以便应用程序从一个计算环境可靠快速地运行到另一个计
算环境 |
| 容器云 | 指 | 在公有云、混合云和私有云上提供基于容器技术的服务,即
允许将一个程序运营的所有代码和相关操作系统通过容器
封装后实现灵活的部署及运用 |
| 多租户 | 指 | 指软件架构支持一个实例服务多个用户(Customer),每一
个用户被称之为租户(Tenant),软件给予租户可以对系统
进行部分定制的能力 |
| 多模型 | 指 | 多种数据模型 |
| 数据全生命周期 | 指 | 围绕数据的集成、存储、治理、建模、分析、挖掘和流通等
阶段的生命周期 |
| 数据中台 | 指 | 数据中台是在政企数字化转型过程中,对各业务单元业务
与数据的沉淀,构建包括数据技术、数据治理、数据运营等
数据建设、管理、使用体系,实现数据赋能 |
| 中间件 | 指 | 介于应用系统和系统软件之间的一类软件 |
| 结构化数据 | 指 | 以二维表结构来逻辑表达和实现的数据 |
| 图数据 | 指 | 以节点和关系作为表示单元的数据 |
| API | 指 | Application Programming Interface的简称,即应
用程序编程接口,是一些预先定义的函数,目的是提供应用
程序与开发人员基于某软件或硬件得以访问一组例程的能
力,而又无需访问源代码 |
| 存储过程 | 指 | 在大型数据库系统中,一组为了完成特定功能的 SQL 语句
集 |
| CPU | 指 | 中央处理器(Central Processing Unit)的简称,
是计算机的主要设备之一,功能主要是解释计算机指令以
及处理计算机软件中的数据 |
| GPU | 指 | 图形处理器(Graphics Processing Unit)的简称,
又称显示核心、视觉处理器、显示芯片或绘图芯片。是一种
专门在个人计算机、工作站、游戏机和一些移动设备(如平
板电脑、智能手机等)上进行图像和图形运算的处理器芯片 |
| 内存 | 指 | 用于暂时存放CPU中的运算数据 |
| X86 | 指 | 泛指一系列基于Intel 8086且向后兼容的中央处理器指令
集架构 |
| ARM | 指 | 一种指令集处理器架构 |
| 微服务 | 指 | 将应用程序按功能逻辑划分为更小的服务单位,其间通过
轻量级数据通路做灵活连接组合,提供基于负载的架构弹
性伸缩及更高的系统级容错能力 |
| 批处理 | 指 | 对一组数据进行批量的处理 |
| 数据集成 | 指 | 将不同来源与格式的数据逻辑上或物理上进行集成的过程 |
| 数据挖掘 | 指 | 从大量的数据中通过算法分析、搜索隐藏于其中信息的过 |
| | | 程 |
| 分布式一致性协议 | 指 | 用于维护分布式系统中数据复制的一致性算法 |
| 联邦学习 | 指 | 一种保护隐私安全的分布式的机器学习框架,能够让各参
与方在不共享数据的前提下,联合进行机器学习。在保护用
户隐私、企业数据安全、符合政府法规的基础上,联邦学习
可从技术角度打破数据孤岛,实现AI协作 |
| 模型训练 | 指 | 在机器学习过程中,使用已有的数据和目标,对算法模型进
行调优的过程 |
| 数据标签 | 指 | 根据多种维度描述数据特点的形式 |
| 隐私计算 | 指 | 一种保证两个或多个数据提供方在不泄露敏感数据的前提
下进行联合计算的技术和系统。在隐私计算的框架下,参与
方的数据不出本地,各方能对密文数据进行分析计算并验
证计算结果,保证在各个环节中数据可用不可见 |
| PL/SQL | 指 | Procedural Language/SQL,过程化SQL语言,在普通SQL
语句的使用上增加了编程语言的特点 |
| 云操作系统 | 指 | 是以云计算、云存储技术作为支撑的操作系统 |
| IT | 指 | Information Technology,信息技术的缩写 |
| BI | 指 | Business Intelligence,商业智能分析系统的缩写 |
| IO | 指 | I(Input)即输入,O(Output)即输出,IO即(数据的)
输入及输出 |
| SQL编译技术 | 指 | 一种把数据库 SQL 语言编写的程序代码翻译成为数据库可
执行程序 |
| SQL标准 | 指 | 结构化查询语言标准 |
| SQL方言/数据库方言 | 指 | 数据库厂商在遵守 SQL 标准前提下,拥有厂商特色的扩展
功能 |
| 联邦计算 | 指 | 一种逻辑数据层,用于集成孤立存在于不同系统中的所有
企业数据,管理统一后的数据以实现集中化安全和治理,并
将这些数据实时交付给业务用户 |
| 数据科学 | 指 | 从数据中提取有用信息的一系列技术 |
| 5G | 指 | 即第五代移动通信技术,是最新一代蜂窝移动技术,具有高
速率、高可靠、超带宽、低时延、低功耗等特征,可提高数
据传输速率、减少延迟、降低成本、提高系统容量并实现大
规模设备连接 |
| 分布式数据管理系统 | 指 | 分布式环境下用于管理数据库中数据创建、删除、读取、更
新的软件系统 |
| 分布式交易型数据库 | 指 | 实时的、面向应用的分布式数据库,响应及时性要求很高,
具备快速读写单行数据的能力,同时保证数据完整性 |
| 高可靠 | 指 | 在信息技术领域,高可靠性(high reliability)指
的是运行时间能够满足预计时间的一个系统或组件 |
| 灾备 | 指 | 灾难备援,指的是利用科学的技术手段和方法,提前建立系
统化的数据应急方式,以应对灾难的发生 |
| Oracle PL/SQL | 指 | Oracle在标准SQL上的过程性扩展 |
| Hadoop | 指 | 一种开源的分布式大数据处理方式,可以使用户在不了解
分布式底层细节的情况下开发分布式程序,充分利用集群
进行高速运算和存储 |
| 编译技术 | 指 | 把高级计算机语言编写的程序代码翻译成为计算机可以运
行的二进制机器语言代码的技术 |
| 分析型业务 | 指 | 具备大容量、多维度等复杂处理要求的业务 |
| 规则引擎 | 指 | 一种嵌入在应用程序中的组件,可通过预定义的语义模块 |
| | | 编写业务决策,从而将业务决策和应用程序代码分离 |
| 数据分片 | 指 | 一种针对大量数据的组织方式,使每块数据拥有更少的数
据量 |
| 数据工程 | 指 | 面向不同计算平台和应用环境,使用信息系统设计、开发和
评价的工程化技术和方法。以工程化作为基本出发点的数
据处理、分析和应用方法与技术 |
| 扩缩容 | 指 | 根据服务器池中的负载,对服务器池中的计算资源量进行
增加或者减少的调整 |
| 区块链 | 指 | 分布式数据存储、点对点传输、共识机制、加密算法等计算
机技术的新型应用模式 |
| 数据孤岛 | 指 | 在不同部门相互独立存储的数据无法互相连接互动的现象 |
| 特征工程 | 指 | 一种将原始数据进行转换,使其符合业务逻辑要求,从而提
升机器学习性能的过程 |
| 图计算 | 指 | 以图(对象之间关联关系)作为数据模型来表达问题并予以
解决的过程 |
| HDFS | 指 | HadoopDistributed File System,是指一种被设计成适合
运行在通用硬件上的开源分布式文件系统 |
| 数据血缘 | 指 | 指数据在产生、处理、流转到消亡过程中形成的溯源关系 |
| 数字化运营 | 指 | 通过新技术、数字工具与数据能力重塑产品/服务的各个环
节,降低与用户之间的摩擦,提升用户价值的运营效率 |
| 元数据 | 指 | 关于某数据的名字、意义、描述、来源、职责、格式、用途
以及与其他数据的联系等的信息 |
| 血缘分析 | 指 | 对数据的流转关系进行溯源分析 |
| ERP | 指 | 企业资源计划(Enterprise Resource Planning),是指建
立在信息技术基础上,集信息技术与先进管理思想于一身,
以系统化的管理思想,为企业员工及决策层提供决策手段
的管理平台 |
| OA | 指 | Office Automation,即办公自动化,企业内部的信息化平
台 |
| HIS | 指 | 医院信息系统(Hospital Information System),利用计
算机软硬件技术、网络通信技术等现代化手段,对医院及其
所属各部门的人流、物流、财流进行综合管理,对在医疗活
动各阶段产生的数据进行采集、储存、处理、提取、传输、
汇总、加工生成各种信息,从而为医院的整体运行提供全面
的、自动化的管理及各种服务的信息系统 |
| 业务中台 | 指 | 与业务相关的数据管理系统的集合 |
| 异构硬件 | 指 | 使用不同类型指令集和体系架构的计算单元组成系统的计
算方式 |
| JSON | 指 | Java Script Object Notation缩写,是一种轻量级的数据
交换格式。它基于ECMAScript(欧洲计算机协会制定的js
规范)的一个子集,采用完全独立于编程语言的文本格式来
存储和表示数据。简洁和清晰的层次结构使得JSON成为理
想的数据交换语言。易于人阅读和编写,同时也易于机器解
析和生成,并有效地提升网络传输效率 |
| OCR | 指 | 光学字符识别(Optical Character Recognition),是指
电子设备检查纸上打印的字符,通过检测暗、亮的模式确定
其形状,然后用字符识别方法将形状翻译成计算机文字的
过程 |
| 差分隐私 | 指 | 一种用于数据共享的密码学技术,可分享数据库的一些统
计特征,而不泄露单条明细数据 |
| 大数据一体机硬件 | 指 | 一种专为大量数据的分析处理而设计的软、硬件结合的产
品 |
| 弹性扩展 | 指 | 一种按需对资源进行灵活管理的技术 |
| 数据标注 | 指 | 数据加工者对数据进行标记加工的行为 |
| 有状态系统 | 指 | 在运行过程中需要保存数据或程序运行状态的应用或者系
统 |
| 智能制造 | 指 | 具有信息自感知、自决策、自执行等功能的先进制造过程、
系统与模式的总称 |
| Java | 指 | 一门面向对象的编程语言,具有功能强大和简单易用两个
特征,是静态面向对象编程语言的代表 |
| DBPaaS | 指 | Database Platform as a Service,数据库平台即服务 |
| 行列混合存储 | 指 | 一种以行和列同时作为基础存储单元的技术方式 |
| 迁移学习 | 指 | 运用已有的知识来学习新的知识的机器学习方法 |
| 软硬件一体机 | 指 | 将服务器、网络、储存设施、操作系统平台于一身的软硬件
一体化解决方案,可降低IT复杂性 |
| 数据预处理 | 指 | 在各类主要的逻辑处理以前对数据进行的一些转换、插值、
重新取样等处理 |
| 虚拟化技术 | 指 | 一种在单台计算机上同时运行多个逻辑计算机的技术,每
个逻辑计算机可运行不同的操作系统,并且应用程序都可
以在相互独立的空间内运行而互不影响 |
| 自然语言处理 | 指 | 一种以语言为对象,利用计算机技术进行分析、理解和处理
自然语言的技术 |
| 日志 | 指 | 网络设备、系统及服务程序等在运作时产生的事件记录 |
| Bigtable | 指 | 一种压缩的、高性能的、高可扩展性的基于Google文件系
统(Google File System,GFS)的数据存储系统,用于存
储大规模结构化数据 |
| 服务网格 | 指 | 用于控制和监控微服务应用程序中的内部服务到服务流量
的软件基础结构层 |
| 深度链路查询 | 指 | 在图拓扑中,链路查询指以一个或多个顶点为起点,经由节
点之间的联结边,查找距离为 K 的节点和路径,查询难度
随 K 值增加上升。在一般图拓扑中,通常认为六层及以上
的链路查询为深度链路查询 |
| Oracle | 指 | 甲骨文公司的关系数据库管理系统软件 |
| IBM DB2 | 指 | IBM公司的关系型数据库管理系统软件 |
| Teradata | 指 | 提供大数据分析、数据仓库和整合营销管理解决方案的公
司 |
| Cloudera | 指 | 数据管理和分析解决方案提供商 |
| IBM | 指 | International Business Machines,国际商业机器公司,
一家信息技术和业务解决方案提供商 |
| Cloudera Data Platform | 指 | 美国Cloudera公司开发大数据基础平台软件 |
| MySQL | 指 | 开源关系型数据库管理系统软件 |
| Elasticsearch | 指 | 美国Elastic公司开发的全文检索数据库 |
| SQL Server | 指 | 微软公司推出的关系型数据库管理系统 |
| Intel | 指 | 一家全球知名的半导体公司 |
| SAS | 指 | 一家提供商业智能和分析软件及解决方案、智能领域专业
咨询服务、基于 SAS 解决方案的专业培训和技术支持等服
务的公司;SAS(语言)指SAS公司开发的一门用于统计分
析的程序语言;SAS(软件)指SAS公司开发的数据分析软
件 |
| TPC | 指 | 国际事务性能处理委员会 |
| TPCx-AI | 指 | 由 TPC 发布的一款端到端人工智能基准测试集。该基准衡
量端到端机器学习或数据科学平台的性能。基准开发的重
点是模拟与当前生产数据中心和云环境相关的代表性行业
人工智能解决方案的行为。 |
| TPC-DS | 指 | 由 TPC发布的一款用于评测决策支持系统的标准 SQL 测试
集,这个测试集包含对大数据集的统计、报表生成、联机查
询、数据挖掘等复杂应用,测试用的数据和值不是均匀分布
的,接近于真实数据,TPC-DS测试数据集的规模为TB级。 |
| IDC | 指 | IDC(International Data Corporation,国际数据公司),
一家国际数据集团旗下全资子公司,提供信息技术、电信行
业和消费科技市场的咨询、顾问和活动服务 |
| Gartner | 指 | 一家IT研究与顾问咨询公司,为客户提供客观、公正的论
证报告及市场调研报告,协助客户进行市场分析、技术选
择、项目论证、投资决策 |
| ZB、EB、PB、TB、GB | 指 | 数据量单位,1TB约为1,000GB,1PB约为1,000TB,1EB约
为100万TB,1ZB约为10亿TB |
| ChatGPT | 指 | Chat Generative Pre-trained Transformer,是一款由美
国OpenAI研发的由人工智能技术驱动的自然语言处理工具 |
| AETP | 指 | 一种在交易场景中可增强分析能力或者在分析场景中增强
事务能力的数据库技术 |
| ISV | 指 | Independent Software Vendors,独立软件开发商 |
公司持续在研发及实现产业化方面投入大量的资源,同时目前的营业收入规模相对较小,虽然已经实现了核心技术的产业化应用,但是规模效应还有待进一步提升,不能完全覆盖各项期间费用及成本的投入,因此归属于上市公司股东的净资产和总资产减少。
对公司根据《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》定义界定的非经常性损益项目,以及把《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因。
公司是一家企业级大数据基础软件开发商,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件及服务,已形成大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵,支撑客户及合作伙伴开发数据应用系统和业务应用系统,助力客户实现数字化转型。
公司主要提供两大类的产品和服务:第一类是大数据基础软件业务,包含基础软件产品和与产品相关的技术服务;第二类是应用与解决方案,主要针对大数据应用场景,提供大数据存储、处理以及分析等相关场景下的咨询及定制开发等服务的解决方案;除上述两类业务以外,公司根据客户及项目需求销售少量第三方软件、硬件等其他业务。
TDH是公司自主研发的一站式大数据基础平台,包括多个大数据存储与分析产品,能够存储PB级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、时序、图像、向量等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预测性分析等数据分析功能。
TDC是一款基于容器技术的数据云平台,支持将大数据基础平台、分布式关系型数据库、智能分析工具等大数据软件以PaaS云服务的方式提供给客户,满足客户对数据平台的多租户、弹性可扩展和使用灵活性的要求,可以在一个云平台上支撑大量的用户需求和数字化应用,适用于建设大型企业的数字化基础设施、城市大数据中心的数据平台、企业级数据应用云以及跨多数据中心的数据平台等场景。
KunDB是一款兼容Oracle和MySQL的分布式交易型数据库,集中式与分布式一体化,可快速由集中式扩展为分布式,主要用于支持操作型业务场景(如ERP、OA、HIS等)和高并发场景(如消费者的手机APP应用、居民码查询等)的核心数据系统的构建。
TDS是公司研发的一款用于大数据开发的工具集。TDS内置多个数据工具产品,为企业构建数据仓库、数据湖、数据中台,提供高效的数据集成、数据治理、数据资产管理、数据标签与服务、数据共享与交易等工具,提高开发者对数据系统的建设效率,提升业务客户对数据资产的利用效率,帮助客户实现数据对业务的赋能。
Sophon是一款一站式人工智能平台,它能够在统一的平台上,端到端对多种模态数据完成数据采集、数据接入、数据标注和自标注、模型构建、模型测试、模型管理、模型持续迭代、知识存算和推理、辅助决策到数据要素流通的各个流程;同时,Sophon也能为不同智能数据分析业务提供便捷的存、算资源管理和调度、监控、审计等企业级功能。Sophon内置了多类机器学习算法(包括不限于各类统计学习、图计算、深度学习算法等),并支持多种主流机器学习计算框架、算法和人工智能模型在Sophon平台运行,能够赋能用户更高效地进行大规模复杂数据分析和预测性分析,从而辅助业务决策,提高企业的数字化运营能力和智能化决策能力。
公司主要销售大数据基础软件业务相关的软件产品和技术服务,以及为客户提供应用与解决方案。其中,大数据基础软件业务是公司的主要盈利来源。报告期内,公司大数据基础软件产品包括大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具。根据不同客户或项目需求,公司大数据基础软件业务主要以软件产品授权的方式交付,少量情况下也提供软硬一体套提供相关的技术服务。报告期内,公司主要通过永久授权模式向客户销售软件产品,授权收入根据客户及具体项目需求,按照授权数量收取软件授权费。技术服务及应用与解决方案按项目计价模式或人月计价模式收费,其中维保类服务通常按服务期限收费。公司持续进行新客户的开发、销售,并随着公司客户积累及客户大数据相关信息系统建设需求,向老客户提供已购产品扩容、新软件产品销售、提供技术服务及应用与解决方案的方式,实现老客户对公司产品或服务的复购。
公司秉承“自主研发、领先一代”的技术发展策略,由公司总经理作为公司研发工作总负责人,负责技术和产品研发的统筹安排,技术和产品研发的具体工作由产品研发部门落实完成。为保证研发质量,推动技术创新,公司针对技术研发过程制定了详细的流程管理制度,主要通过产品研发生命周期管理和软件工程过程管理两大类流程,控制开发各环节的工作质量,提高开发作业能力和研发工作效率,保证产品和技术的先进性。
根据客户类型不同,公司销售模式分为直接销售和渠道销售两种模式。其中: (1)直销模式指公司直接面向金融、交通、能源等领域的终端用户进行签约,并向终端用户直接交付公司产品与服务的销售模式。在直销模式下,公司销售团队主要负责新客户的拓展以及存量客户的需求挖掘。公司总部及各地的子公司、分公司等本地化机构具备良好的销售及综合服务能力;
(2)渠道销售模式指公司与项目合作伙伴和经销商等生态合作伙伴直接签约,通过与生态合作伙伴合作向终端用户交付公司产品与服务的销售模式。其中,项目合作伙伴主要包括直接面对中大型终端用户的系统集成商或应用开发商,拥有丰富的行业服务经验和(或)自有的IT产品,能够与公司协作形成具有实际应用价值的产品或解决方案。项目合作伙伴通常根据终端用户的需求采购公司的产品,并结合其自有IT产品或其他厂商产品(如有)销售交付给终端用户。
经销商为行业内具有丰富软件推广经验的合作伙伴,与公司签署有效的合作伙伴协议或框架协议,并在合作伙伴合作协议或框架协议中约定了销售业绩或市场占有率或产品数量等指标。公司与经销商客户之间均为买断式销售,经销商客户在采购公司产品后,向终端用户、系统集成商或应用开发商进行销售。
(1)自用采购主要为公司日常经营和研发过程中所需的服务器、办公设备等相关硬件和少量技术服务以及办公用品,由采购部门根据内部需求执行采购流程; (2)项目采购通常包括技术服务采购和软硬件采购,用于向客户实施及交付。
为了提升项目收益率、提高交付效率以及缩短实施周期,公司会向技术服务供应商采购技术服务。公司技术服务采购分为工时计价和项目计价两种方式。公司采购的物料主要为软硬件一体机的硬件设备及通用工具软件。
对于项目采购,公司建立了内部制度规范采购行为,由采购部门根据客户需求执行采购流程。公司制定了《项目外采管理办法》《内部采购管理及供应商管理制度》等相关制度规范采购行为。
依据国家统计局《国民经济行业分类》(GB/T4754-2017),公司所处行业属于软件和信息技术服务业(I65)。根据《战略性新兴产业分类(2018)》,公司所属行业为“新一代信息技术产业”之“新兴软件和新型信息技术服务”之“新兴软件开发”之“基础软件开发”。
近年来随着互联网、移动互联网、物联网、5G等信息通信技术及产业的不断发展,全球及中国的数据量均爆发式增长。数据资源总体呈现出“4V”的特点,即海量的数据规模(Volume)、多样的数据类型(Variety)、价值密度低(Value)、快速的数据流转(Velocity)。在大数据时代下,以集中式架构关系型数据库为代表的传统数据管理软件在处理大数据场景时不能很好适应数据的“4V”特性,面临较多技术挑战。随着信息技术的发展,数据处理需求的变化推动了数据管理软件技术的变革,从技术发展方向来看,数据管理软件技术依次按照“关系型、集中式”向“非关系型、分布式”并进一步向“多模型、云原生”这三个阶段进行演变。随着技术不断成熟,分布式架构将逐渐成为主流。自底向上,传统的集中式资源管理调度逐渐向基于云原生技术的分布式统一资源管理平台发展;数据管理软件技术架构也会因为计算模式的转变发生重大变革,传统的集中式数据库逐渐向分布式、多模型数据库发展;传统数据分析软件逐渐向新型的分布式数据开发和智能分析软件发展。
当前,中国大数据软件领域处于发展的历史机遇期,我国高度重视大数据在经济社会发展中的作用。根据信通院发布的《大数据白皮书(2022年)》,2021年,我国大数据产业规模增加到1.3万亿,复合增长率超过30%。根据工信部印发的《“十四五”大数据产业发展规划》,在“十三五”时期,我国大数据产业快速起步,但仍然存在一些制约因素,目前国内的技术支撑不够强,基础软件等关键领域与国际先进水平存在一定差距。在工信部印发的《“十四五”软件和信息技术服务业发展规划》中相关内容亦指出,要聚力攻坚基础软件,对数据库等关键基础软件补短板。
传统数据库以集中式架构为主,集中式架构由一台或多台主计算机组成中心节点,数据存储以及整个系统的业务单元都集中部署于该中心节点中,系统所有的功能均由中心节点集中处理。