[中报]格灵深瞳(688207):格灵深瞳2024年半年度报告

时间：2024年08月23日 17:31:15 中财网

原标题:格灵深瞳:格灵深瞳2024年半年度报告

公司代码：688207 公司简称：格灵深瞳

北京格灵深瞳信息技术股份有限公司
2024年半年度报告

重要提示
一、本公司董事会、监事会及董事、监事、高级管理人员保证半年度报告内容的真实性、准确性、完整性，不存在虚假记载、误导性陈述或重大遗漏，并承担个别和连带的法律责任。

二、重大风险提示
公司已在本报告中详细阐述公司在经营过程中可能面临的各种风险，敬请查阅本报告“第三节管理层讨论与分析”之“五、风险因素”。

三、公司全体董事出席董事会会议。

四、本半年度报告未经审计。

五、公司负责人赵勇、主管会计工作负责人王艳及会计机构负责人（会计主管人员）杜家芳声明：保证半年度报告中财务报告的真实、准确、完整。

六、董事会决议通过的本报告期利润分配预案或公积金转增股本预案无

七、是否存在公司治理特殊安排等重要事项
□适用 √不适用

八、前瞻性陈述的风险声明
√适用 □不适用
本报告所涉及的前瞻性陈述，不构成公司对投资者的实质承诺，请投资者注意投资风险。

九、是否存在被控股股东及其他关联方非经营性占用资金情况
否

十、是否存在违反规定决策程序对外提供担保的情况
否

十一、是否存在半数以上董事无法保证公司所披露半年度报告的真实性、准确性和完整性否

十二、其他
□适用 √不适用

目录
第一节释义 .................................................................. 4 第二节公司简介和主要财务指标 ................................................. 6 第三节管理层讨论与分析...................................................... 10 第四节公司治理 ............................................................. 34 第五节环境与社会责任 ....................................................... 36 第六节重要事项 ............................................................. 37 第七节股份变动及股东情况 .................................................... 62 第八节优先股相关情况 ....................................................... 68 第九节债券相关情况 ......................................................... 68 第十节财务报告 ............................................................. 69

备查文件目录	载有公司法定代表人、主管会计工作负责人、会计机构负责人（会计主管人员）签名并盖章的财务报表
	报告期内在中国证监会指定网站上公开披露过的所有公司文件的正文及公告的原稿

第一节释义
在本报告书中，除非文义另有所指，下列词语具有如下含义：

常用词语释义
公司/本公司/格灵深瞳	指	北京格灵深瞳信息技术股份有限公司
瞳门科技	指	瞳门科技（北京）有限公司
格灵科技	指	格灵深瞳（北京）科技发展有限公司
深瞳智数	指	天津深瞳智数科技中心（有限合伙）
灵瞳众智	指	天津灵瞳众智科技中心（有限合伙）
灵瞳数源	指	天津灵瞳数源科技中心（有限合伙）
灵瞳智源	指	天津灵瞳智源科技中心（有限合伙）
灵瞳莱客	指	天津灵瞳莱客科技中心（有限合伙）
灵瞳智皓	指	天津灵瞳智皓科技中心（有限合伙）
艾玛深瞳	指	艾玛深瞳科技（北京）有限公司
深圳高新投	指	深圳市高新投集团有限公司
英伟达	指	NVIDIA Corporation
海通证券/保荐机构	指	海通证券股份有限公司
人工智能/AI	指	Artificial Intelligence，是研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学
计算机视觉	指	计算机视觉是利用一个代替人眼的图像传感器获取物体的图像，将图像转换成数字图像，并利用计算机模拟人的判别准则去理解和识别图像，达到分析图像和作出结论的一种技术
大数据	指	对海量、高增长率和多样化的信息数据进行存储和处理的能力和服务
云计算	指	分布式计算的一种，通过网络将巨大的数据计算处理程序分解成无数个小程序，然后通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户
物联网	指	互联网基础上的延伸和扩展的网络，将各种信息传感设备与网络结合起来而形成的一个巨大网络，实现在任何时间、任何地点，人、机、物的互联互通
算力	指	设备的计算能力，以每秒可以执行的基本运算次数来度量
算法	指	解题方案的准确而完整的指令描述，即以系统的方法描述、解决问题的策略机制
AIGC	指	AI Generated Content，利用人工智能技术来生成内容
边缘计算	指	在靠近物或数据源头的一侧，采用网络、计算、存储、应用核心能力为一体的开放平台，就近提供最近端服务。其应用程序在边缘侧发起，产生更快的网络服务响应，满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求
跨镜追踪	指	利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术
3D立体视觉	指	计算机视觉与计算机图形学高度交叉的一个重要研究方向，突破传统的二维图像空间，实现三维空间的分析、理解和交互
MEC	指	多接入边缘计算（Multi-access Edge Computing），部署在路侧，接入视频、雷达等多传感器的数据，并进行分析、融合处理，生成多维度交通感知数据
点云	指	某个坐标系下的点的数据集，包括三维坐标X、Y、Z，颜色、分类值、强度值、时间等信息
双光/双光谱成像	指	一种从光谱上两个频率范围收集数据的成像形式
模型压缩	指	一种将基于深度学习的较大模型进行轻量化处理的技术，用于降低模型运行算力要求，使得模型可以在小算力平台运行
深度学习	指	一类人工智能主流算法的总称，可基于海量数据训练具有大量隐含层的人工神经网络模型（即深度神经网络），使其完成图像识别、语音识别等特定的人工智能任务
弱监督	指	使用有限的、含有噪声的或者标注不准确的数据来进行模型参数的训练
敏捷方法	指	一种软件开发方法，可应对快速变化的需求的一种软件开发能力。敏捷开发（Agile Development）是一种以人为核心、迭代、循序渐进的开发方法
模型训练	指	在机器学习或人工智能领域，通过大量带标签样本，通过一定的方法，得到对应机器学习、人工智能模型参数的过程
标注	指	人工辅助计算机确定数据真实标签的过程
多目	指	利用多个相机，从不同视角对目标进行拍照，用于估计物体到相机的深度
双目	指	利用两个相机拍摄同一场景的左、右两幅视点图像，运用立体匹配算法获取视差图，进而获取深度图
首位命中率	指	查询返回结果第一位为正确答案的数量与查询总数量的比值
六自由度	指	沿 x、y、z 三个直角坐标轴方向的移动自由度和绕这三个坐标轴的转动自由度
TrillionPairs	指	公司开源的人脸识别数据集
Glint360K	指	公司开源的包含36万类别、1,800万人脸图像的人脸识别数据集
环境光标	指	一个环境光标是由若干不可见光(如近红外)光源按一定的位置编码组成的固定装置，多个不同编码的环境光标按照一定规则布置在深瞳灵境空间中
元、万元	指	人民币元、人民币万元
报告期	指	2024年1月1日-6月30日

第二节公司简介和主要财务指标
一、公司基本情况

公司的中文名称	北京格灵深瞳信息技术股份有限公司
公司的中文简称	格灵深瞳
公司的外文名称	Beijing DeepGlint Technology Co., Ltd.
公司的外文名称缩写	DeepGlint
公司的法定代表人	赵勇
公司注册地址	北京市朝阳区望京东路1号1层101内1A025
公司注册地址的历史变更情况	不适用
公司办公地址	北京市海淀区东升科技园北街6号院中关村科学城?东升科技园 10号楼8-10层
公司办公地址的邮政编码	100096
公司网址	www.deepglint.com
电子信箱	[email protected]
报告期内变更情况查询索引	公司主要办公地址变更情况请查询上交所网站（www.sse.com.cn ）及指定媒体披露的《北京格灵深瞳信息技术股份有限公司关于变更主要办公地址和传真的公告》（2024-002）。

二、联系人和联系方式

	董事会秘书（信息披露境内代表）	证券事务代表
姓名	王政	赵晨希
联系地址	北京市海淀区东升科技园北街6号院中关村科学城?东升科技园10号楼8层	北京市海淀区东升科技园北街6号院中关村科学城?东升科技园10号楼8层
电话	010-62950512	010-62950512
传真	/	/
电子信箱	[email protected]	[email protected]

三、信息披露及备置地点变更情况简介

公司选定的信息披露报纸名称	《中国证券报》（www.cs.com.cn）、《上海证券报》（ www.cnstock.com）、《证券时报》（www.stcn.com）、《证券日报》（www.zqrb.cn）
登载半年度报告的网站地址	www.sse.com.cn
公司半年度报告备置地点	董事会办公室
报告期内变更情况查询索引	不适用

四、公司股票/存托凭证简况
(一) 公司股票简况
√适用 □不适用

公司股票简况
股票种类	股票上市交易所及板块	股票简称	股票代码	变更前股票简称
A股	上海证券交易所科创板	格灵深瞳	688207	不适用

(二) 公司存托凭证简况
□适用 √不适用

五、其他有关资料
□适用 √不适用

六、公司主要会计数据和财务指标
（一）主要会计数据
单位：元币种：人民币

主要会计数据	本报告期（1－6月）	上年同期	本报告期比上年同期增减(%)
营业收入	51,309,820.66	157,437,935.55	-67.41
归属于上市公司股东的净利润	-77,923,906.15	2,115,352.38	不适用
归属于上市公司股东的扣除非经常性损益的净利润	-81,537,571.52	1,112,869.66	不适用
经营活动产生的现金流量净额	-87,404,908.21	-47,776,177.89	不适用
	本报告期末	上年度末	本报告期末比上年度末增减(%)
归属于上市公司股东的净资产	2,209,085,403.76	2,284,240,368.83	-3.29
总资产	2,352,661,347.93	2,472,307,952.09	-4.84

（二）主要财务指标

主要财务指标	本报告期（1－6月）	上年同期	本报告期比上年同期增减(%)
基本每股收益（元／股）	-0.30	0.01	不适用
稀释每股收益（元／股）	-0.30	0.01	不适用
扣除非经常性损益后的基本每股收益（元／股）	-0.31	0.00	不适用
加权平均净资产收益率（%）	-3.47	0.09	不适用
扣除非经常性损益后的加权平均净资产收益率（%）	-3.63	0.05	不适用
研发投入占营业收入的比例（%）	182.75	48.95	增加133.80个百分点

公司主要会计数据和财务指标的说明
√适用 □不适用
1、报告期内,公司营业收入同期减少 67.41%,主要为大客户农业银行提出全面信创需求，公司产品需完成国产化适配和测试工作后方可供货，导致交付时间延后，叠加部分客户所处行业的市场环境下行等因素影响；
2、本报告期，公司实现归属于母公司所有者的净利润、归属于母公司所有者的扣除非经常性损益的净利润转盈为亏，主要系公司当期营业收入同比下降；
3、本报告期，经营活动产生的现金流量净额同比减少，主要系本报告期销售商品收到的现金同比减少。

七、境内外会计准则下会计数据差异
□适用 √不适用

八、非经常性损益项目和金额
√适用 □不适用
单位:元币种:人民币

非经常性损益项目	金额	附注（如适用）
非流动性资产处置损益，包括已计提资产减值准备的冲销部分	502,232.91
计入当期损益的政府补助，但与公司正常经营业务密切相关、符合国家政策规定、按照确定的标准享有、对公司损益产生持续影响的政府补助除外	1,420,400.00
除同公司正常经营业务相关的有效套期保值业务外，非金融企业持有金融资产和金融负债产生的公允价值变动损益以及处置金融资产和金融负债产生的损益	4,822,085.50
计入当期损益的对非金融企业收取的资金占用费
委托他人投资或管理资产的损益
对外委托贷款取得的损益
因不可抗力因素，如遭受自然灾害而产生的各项资产损失
单独进行减值测试的应收款项减值准备转回
企业取得子公司、联营企业及合营企业的投资成本小于取得投资时应享有被投资单位可辨认净资产公允价值产生的收益
同一控制下企业合并产生的子公司期初至合并日的当期净损益
非货币性资产交换损益
债务重组损益
企业因相关经营活动不再持续而发生的一次性费用，如安置职工的支出等
因税收、会计等法律、法规的调整对当期损益产生的一次性影响
因取消、修改股权激励计划一次性确认的股份支付费用
对于现金结算的股份支付，在可行权日之后，应付职工薪酬的公允价值变动产生的损益
采用公允价值模式进行后续计量的投资性房地产公允价值变动产生的损益
交易价格显失公允的交易产生的收益
与公司正常经营业务无关的或有事项产生的损益
受托经营取得的托管费收入
除上述各项之外的其他营业外收入和支出	-310,827.37
其他符合非经常性损益定义的损益项目	-2,820,225.90
减：所得税影响额
少数股东权益影响额（税后）	-0.23
合计	3,613,665.37

对公司将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》未列举的项目认定为的非经常性损益项目且金额重大的，以及将《公开发行证券的公司信息披露解释性公告第 1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目，应说明原因 □适用 √不适用

九、非企业会计准则业绩指标说明
□适用 √不适用

第三节管理层讨论与分析
一、报告期内公司所属行业及主营业务情况说明
（一）公司所属行业
根据国家统计局《国民经济行业分类》（GB/T4754-2017），公司属于“软件和信息技术服务业”（行业代码为I65）。根据《战略性新兴产业分类（2018）》，公司属于“新一代信息技术产业”中的“人工智能”行业。

伴随人工智能技术的加速演进，围绕大模型等前沿热点领域的研究持续深入，生成式人工智能等新赛道为产业注入新的增长点。大模型已成为孕育新质生产力的沃土，自然语言处理、多模态等领域研发提速，通用大模型、行业大模型、端侧大模型如雨后春笋般涌现，大模型将广泛赋能社会多个领域，产业应用将进一步加速落地，推动新一轮的科技革命与产业变革。

我国高度重视人工智能行业的发展，出台了一系列扶持政策和规划，强调人工智能和产业发展融合，为高质量发展提供新动能。2024年2月，国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会，强调中央企业要把发展人工智能放在全局工作中统筹谋划，加快布局和发展人工智能产业，深入推进产业焕新，进一步深化开放合作，开展AI+专项行动，加快重点行业赋能，构建一批产业多模态优质数据集，打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态；2024年3月，《2024年国务院政府工作报告》提出深化大数据、人工智能等研发应用，开展“人工智能+”行动，打造具有国际竞争力的数字产业集群，这是“人工智能+”首次被写入政府工作报告中，体现了国家对数字经济和人工智能产业的重视。各地方政府也在积极实施“人工智能+”行动，印发各类政策推动构建人工智能生态，加强科技、产业与金融的协同，开放更多人工智能应用场景，与企业共同探索落地的商业模式。

（二）公司主营业务情况
公司以“让AI造福人类，让世界更安全更宜居更健康”为愿景，专注于将先进的计算机视觉技术、大数据分析技术、机器人技术和人机交互技术与应用场景深度融合，提供面向智慧金融、城市管理、智慧商业、轨交运维、体育健康、元宇宙的人工智能产品及解决方案。

公司经过多年的技术研发与积累，已有效掌握了多模态大模型技术、3D立体视觉技术、大规模跨镜追踪技术、自动化交通场景感知与事件识别技术、机器人感知与控制技术、沉浸式交互感知技术等方向的多项核心技术，凭借过硬的技术能力和长期的商业化经验，已成功在智慧金融、城市管理、智慧商业、轨交运维、体育健康五大领域实现落地应用，其中：智慧金融领域已覆盖农业银行全国各省市的上万家网点，包含智能安保、智能运营、智能风控等多个金融业务场景，同时，公司参与搭建某国有银行总行AI平台，并开始在其他国有银行分支行进行试点；城市管理领域已覆盖全国多省市的公安局、公安交通管理局、政法委员会等政府机关或企事业单位，车路协同感知MEC产品已进行交付，同时车载视频违规事件取证产品已在多省市开展试点；智慧商业领域主要收入来自排名前列的地产类客户，进一步完善的智慧油站产品和解决方案在中国石化重新启动试点应用；轨交运维领域公司自研的列车智能检测解决方案已在高铁和地铁项目中落地应用，为列车的安全运维提供保障，在研产品己涵盖轨交机务、电务和工务三大场景；体育健康领域公司发布了深瞳阿瞳目体育训考系统、体感交互系统、体育大数据系统系列产品和解决方案，开发体育教育市场的渠道产品，建设了国家人工智能学生体质健康测试标准化考场，体育训考全流程解决方案已在全国多个校园试点应用、销售，大规模应用于北京、河北等多个区县的初中学业水平考试体育现场中，也应用于北京某区的国家学生体质健康考试统测和某区的高中年级体育毕业会考等场景中。除此之外，公司在元宇宙等领域进行前瞻性的布局，探索元宇宙领域发展运营模式、开发多类型交互内容，公司产品、整体解决方案和基于大模型的行业应用的研发和落地工作按计划有序推进。公司从客户需求出发，面向智慧金融、城市管理、智慧商业、轨交运维、体育健康、元宇宙不同领域的客户，提供相应的行业解决方案。（三）主要经营模式 1、盈利模式公司主要从事计算机视觉技术、大数据分析技术、机器人技术和人机交互技术的研发和应用。公司的盈利来源于向客户提供面向应用场景的人工智能产品及解决方案获得销售收入。公司自主研发的人工智能产品主要包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台。人工智能产品既可以标准化模式销售，也可根据客户需求进行产品组合，提供定制化服务，以整体行业解决方案向客户交付。 2、研发模式公司拥有完整的研发组织架构与创新机制，以用户需求为核心，采用迭代、循序渐进的敏捷方法进行研发活动，并对整个产品生命周期进行管理，在过程中不断对执行结果和阶段目标进行总结复盘，通过不断迭代完善产品质量和改进研发过程。公司具体的研发过程如下图所示：（1）在产品需求调研阶段，公司对行业发展趋势、市场规模和用户核心需求进行调研分析，并结合公司产品战略规划，由产品团队完成需求分析，确定产品的核心目标特性和功能，由研发团队进行技术路线规划。

（2）在可行性验证阶段，公司进行大量算法实验以寻找合理科学的解决方案，产品经理、算法工程师、软硬件开发工程师和测试团队密切配合，在产品负责人的协调下进行多次短平快的软件原型迭代，每一次迭代都会在产品实际使用场景中进行反复实验确认，通过与客户持续沟通，调整和优化，确认产品最终形态的各功能模块和参数指标，并明确研发周期。在整个过程中，算法团队负责完成实验场景的建设和数据收集，并进行验证性实验；软件开发团队负责针对应用场景进行原型验证和开发；智能硬件团队负责对硬件产品的相关指标进行可行性实验和评估。

（3）在产品研发阶段，产品经理将总结可行性验证阶段的成果，转化为产品功能指标及开发任务，确保产品交付节点和产品定义与用户预期保持一致；算法和工程团队协同完成算法模型设计开发、数据收集清洗、功能特性开发等工作；测试团队按照产品定义对产品每个开发版本进行验收，并完成自动化测试脚本；智能硬件团队完成新硬件产品的选型评估和整体设计，有效评估产品适用性、稳定性、可靠性、国产化率等特性，并负责设备软件开发和集成，交付少量可以进行测试认证的工程样机。该阶段产品会发布多个内外部测试版本，在实践中进行快速迭代。

（4）产品发布阶段是在产品完成核心功能开发后，产品经理建立产品的标准文档、销售价格、实施方案、售后体系，通过与质量、市场、销售等部门确认，满足目标市场的销售条件时，产品正式发布；新的硬件产品会在这一阶段完成小批量验证和量产导入，实现加工生产工艺所需要的工装硬件和工具软件；测试团队进行大量密集的现场测试，确保产品满足产品定义的各类功能指标，并完成质量验收。这一阶段的完成标志产品正式版本发布。

（5）产品运营阶段在产品正式发布后，产品经理结合市场反馈与发展趋势，制定多个后续产品版本，不断创新，推出符合市场需求的产品新版本，以对产品进行持续的运营、维护和改进。

3、采购模式
公司专注于人工智能产品及解决方案的研发和销售，不涉及硬件的直接生产。

针对标准硬件、配件及服务类采购，公司直接向供应商提出待采购产品或服务的需求，供应商按照指定的时间和地点进行交付；针对定制化硬件，公司采购主要原材料并发货至委外加工厂，由其进行生产加工。公司选择专业的代工厂，依托其已有的完善的品质控制、生产制造管理和硬件设施进行专业的代工生产。公司通过新产品导入、质量检验标准发布、生产工艺发布、测试检验工具发布等方式确保产品生产的有效性、一致性和稳定性。

4、销售模式
公司结合下游行业的业务特点与主要产品的市场定位，在直接销售体系的基础上，积极开发渠道商，向终端客户或渠道客户（含集成商）销售人工智能产品及解决方案，使产品以不同的方式触达更多的客户，提供更加及时、高效的销售服务。其中终端客户是指直接使用公司产品及解决方案的各行业领域客户，包括金融机构、政府部门、公安机关、企事业单位等；集成商是指承担系统集成、安装部署、运营维护等职能的企业，包括终端客户的项目总包方或其指定的工程服务商等。公司与客户直接对接需求，通过商务谈判、参与招投标等方式获取订单。公司建立了完善的直销服务体系，目前已在全国划分了华东、华中、华北、东南、西南、东北、西北七个大区进行区域化和行业化的矩阵式管理，以提供及时、高效的销售服务。

二、核心技术与研发进展 1. 核心技术及其先进性以及报告期内的变化情况公司打造了底层AI技术平台——深瞳大脑，深瞳大脑作为公司核心技术的驱动平台，赋能公司人工智能产品及解决方案的技术实现。深瞳大脑包含数据平台和训练平台，由数据采集、数据预处理、数据标注、模型训练、模型优选、数据管理等模块组成。数据平台支持多源多模态数据的自动收集和清洗归类，通过构建自动化处理为主、人工标注为辅的标注体系，形成海量增长的标签数据池，有效节省标注成本，提高了算法模型的研发效率；通过组建具有专业背景的标注团队，用人工标注加AI模型自动化预识别的方法，为算法提供精准的基础训练数据，同时通过数据团队对开放数据的收集和挖掘，为公司在海量数据下训练高水平模型做好数据准备；训练平台则有效提高了模型训练的自动化水平，降低算法多平台部署应用的迁移难度，为算法高效生产及快速商业化应用奠定了重要基础；训练平台同时支持在海量数据中进行挖掘，主动触发模型更新训练，可以有效的提高算法的准确率和生产效率，并进一步提高产品的交付能力。目前，公司深瞳大脑可支持数十亿训练数据、数亿类别任务，数百亿参数多模态大模型的训练。训练平台生产高质量的算法，推动应用的落地，数据平台收集应用产生的高质量数据又促进算法的提升，从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环，为公司的高效研发创新与产业应用提供了有力支持。

（1）多模态大模型技术
公司利用自研的底层 AI 技术平台深瞳大脑对数十亿训练数据进行清洗和预处理，并基于大规模数据训练数百亿参数的大模型，在海量数据下，研发了基于图像、语言、语音多种模态的弱监督大模型训练算法，节省了大量数据标注资源。针对海量数据中存在噪声的问题，研发了标签重写算法，高效地提升了数据质量。上述算法已投稿到国际顶级会议 ICLR2023、ICCV2023 和ECCV2024并被接收，公司已在业务中利用该大模型提升少样本场景的准确率，在复杂场景中效果远优于传统小模型。结合高质量的语言模型，公司正在研发多模态大模型，该模型能接受图像、语言等多种模态的输入，能够完成多模态融合理解，提升业务的应用潜力。

跨平台模型训练技术用于简化AI算法生产，该技术基于自主研发的训练框架，和自主研发的预训练模型可实现常用业务AI算法的一键式训练，为常见业务中的分类、检测、分割等算法提供便捷快速的实用模型。针对不同应用场景的算法开发，公司自主研发的跨平台模型训练技术可将训练任务管理平台产出的模型自动发布到各种类型的显卡或平台，包括英伟达显卡、海思系列芯片、华为昇腾系列芯片、算能计算平台等，无需人工干预，从而达到模型快速高效交付的目的，可有效的降低研发成本，有助于提升产品的市场竞争力。基于自主学习的训练平台解决方案，也已经在公司多个重点项目上线，实施后大量长尾业务的迭代周期大幅缩短，准确率提升效果显著。

（2）3D立体视觉技术
3D立体视觉一般通过结构光、激光雷达等特殊传感器采集得到场景的深度信息，再利用深度信息和可见光信息一同计算出场景的三维图像。

多目传感器标定与深度估计技术使用一对成本更为低廉的可见光相机组成双目系统，对场景深度信息进行估算，在达到普通结构光相机精度的同时，提高了相机的可靠性和易用性，并能覆盖更多的结构光相机无法工作的光线条件和场景。基于这项技术的输出，使公司的算法能更好地适应多种不同的场景和目标，进而对人体、物体、场景进行高精度的重建。

运动姿态分析技术通过采集不同场景下人体姿态数据，通过自主研发的三维人体姿态估计算法，能够解决人体关键点数据采集不准确或不稳定的问题。公司基于单目相机的三维重构技术结合动作模型库及人体运动功能学的特点，优化了使用单目相机获取三维人体关键点的效果，解决了基于二维人体关键点进行判断的难题，使得运动姿态分析算法在三维人体上做出更为精准的判断，进而可以应用在体育健康与行为分析领域对人体三维姿态的准确识别与分析。

运动姿态分析技术在智慧金融领域可以协助银行客户进行员工履职分析与管控，人员重点区域违规管控（如非授权人进入、员工缺岗等）、人员操作异常管控（如单人加钞、大额现金遗留等）、人员动作异常管控（如异常倒地、打架、各类防护舱业务等）等项目均达到较高的检测精度；而在体育健康领域，该技术可评判用户动作是否完成及标准程度，评判仰卧起坐、引体向上、跳绳、篮球交替运球、篮球护球训练等17项基础测试和训练动作时，也可具备较高水平的检测精度，公司在由北京图象图形学学会、清华大学、蚂蚁安全实验室等机构联合发起第一届花样滑冰动作识别挑战赛中，运用领先的运动姿态分析技术获得了冠军。3D重建与立体视觉分析技术在轨交运维场景可将离散的局部列车零部件数据进行融合和重构，得到列车标准模型，将几何模型分析、深度学习等技术运用到列车标准模型、点云数据、图片等多维度数据，进行零部件匹配和故障诊断。公司基于深度学习的点云配准技术已在多个学术数据集上取得第一，通过点云几何结构和基于Transformer的多层特征投票机制提升正确匹配点云比例，提升点云配准精度，在真实业务测试集上旋转向量误差小于 1 度、平移向量误差小于 0.3mm，该技术对产品落地起到了至关重要的作用。目前，公司产品已覆盖列车常见的190余种故障项点，项点处理速率超过20,000个/小时，在高级重要性项点的故障诊断成功率大于 95%，对于高精度测量的项点，测量精度到达亚毫米级别。

（3）自动化交通场景感知与事件识别技术
公司拥有国内领先的车辆识别技术，能够运用高精度目标检测与跟踪技术对大陆号牌、港澳号牌、非机动车号牌等多种类型的车牌进行多种尺寸和角度的识别，支持倾斜角度在45°范围内的车牌，准确率在 99%以上。同时，公司支持的机动车、非机动车、人体属性识别多达 50 余项，重点属性识别准确率超过95%。

在对交通场景中车辆进行分析时，公司结合在人脸识别技术上的优势研发了多目标属性识别与对象关联技术。该技术可以将车内驾驶员与车辆绑定，协助交通管理部门和公安部门查找可疑人员，提供破案线索。由于车内光线较暗、抓拍受挡风玻璃干扰、司乘人员人脸姿态不受控、人脸有遮阳板墨镜口罩等遮挡的原因，普通的人脸识别算法都会有较大的下降，公司在人脸识别技术上的优势可以做到在以上困难环境下仍能达到较高的识别率。

公司研发的交通场景理解及事件检测识别技术，基于自适应交通场景理解和车辆特征识别的技术能力，无需人工标注，可自动化识别闯红灯、不按导向行驶、不礼让行人等11种交通违法场景，同时结合车辆重识别技术可准确定位车辆位置，实现对交通视频的自动分析、事件预警和违法事件的自动审核。

（4）大规模跨镜追踪技术
公司拥有完全自研的人脸识别算法和引擎技术，在多种光线条件、人脸角度的场景下都能达到较高的识别准确度。公司在研发过程中开源了TrillionPairs和Glint360K两个人脸识别数据集以及PartialFC训练代码，其中PartialFC相关论文已被视觉顶尖会议CVPR2022接收，推动了行业技术的发展。公司的人脸识别技术在公开数据集MegaFace上识别准确率达到99.1%。公司在公安部治安管理局亿级人像算法测试中，1比1人像比对测试万分之一误识率下的通过率为99.97%，5万样本比1亿级人像比对测试中首位命中率超过98%，均高于行业平均水平。

公司研发的百亿级人员聚类技术可支撑上万路摄像头接入并实时完成动态聚类，支持室内场景和光照、质量和姿态等都不受控的室外复杂场景中的大规模商用。

为了达到上万路摄像头接入并实时完成动态聚类的应用要求，公司研发了海量数据以图搜图技术。公司研发的以图搜图引擎支持多架构、不同计算设备上的图片检索功能。针对检索频率高实时要求强的场景，以图搜图引擎支持英伟达全系显卡以及华为计算卡的图片检索。针对检索频率低实时要求不强，但图片数量较大的场景，单机可实现上亿人脸图片秒级返回，集群可实现数十亿级图片秒级返回。针对海量图片检索场景，以图搜图引擎实现了单机检索 30 亿人脸图片 20秒内返回结果的性能。配合集群可实现百亿级图片数十秒检索的性能。针对上亿特征占用显存巨大的问题，公司研发了短特征技术，利用该技术能节省至少 4 倍显存，同时召回率达到 99.9%。

该技术已广泛应用在公司多个应用场景的产品及解决方案中。

人脸属性表达技术在公共安全等场景具有广泛应用，同时也能辅助大规模人员聚类。公司研发的人脸属性包括年龄、性别、种族、表情、姿态、遮挡、模糊等多项属性。该技术使用单模型、多任务协同训练策略，利用各个属性任务之间的相关性来辅助训练单个模型，可在缩减运算资源的同时保证每个属性的精度。

公司多场景广覆盖人脸活体识别技术可应用在闸机口等通行相关的场景，公司已积累了千万级的攻击样本，可防止人员通过打印照片、屏幕、3D面具等非活体人脸通过闸机。

（5）机器人感知与控制技术
公司将实时定位与建图技术、机械臂视觉反馈技术、机器人路径规划与自主导航技术运用于轨交运维机器人等场景，算法适应性良好，机器人该场景中，以最高1m/s的速度做无碰撞运动，达到轨交运维应用所需的技术水平。其中，机器人实时定位与建图技术，又称SLAM技术，在室内和半户外场景下拥有良好的定位精度，在结构化的室内场景下，定位精度可达毫米级，在工业现场的半户外场景下，定位精度可达厘米级。同时，公司针对SLAM普遍算力要求较高的问题做出了优化，完成SLAM模块向特定型号嵌入式主板的迁移和适配工作；机械臂视觉反馈技术，又称手眼协同技术，在机械臂重复性动作的场景中收到良好效果，得到视觉反馈之后的机械臂定位，较普通机械臂定位的精度有较大提升。同时，在保证精度的前提下，时间延迟不超过1秒，保证了精度和实时性；机器人路径规划与自主导航技术，包含机器人定点巡逻、远程临场、人员跟随等功能模块，运用于自动化检修场景中。

公司的机器人虚拟示教技术，能够通过高精度3D重建技术，搭建虚拟列车检修空间，构建一个包含作业坑道、列车、机器人等元素，同时考虑物体碰撞、真实设备性能、环境噪声等因素的虚拟机器人作业空间。在虚拟空间内进行机器人示教，通过控制虚拟空间中的机器人进行采集位置确认工作，支持多人协作和远程操作，极大缓解项目实施过程中对真实列车的依赖，提升3倍以上的实施速度。

公司的机器人遥感技术则通过将虚拟点位下发给机器人，通过坐标空间变换、运动分解、轨迹规划等技术，使机器人获取在物理空间中可执行的动作指令，该技术既支持异步动作执行，也支持在线的虚拟机器人-真实机器人实时动作执行。为了提升机器人自主规划和控制能力，公司将自主研发的多模态大模型作为机器人的大脑，使其逐步向具身智能靠拢。

（6）沉浸式交互感知技术
基于先进的人体跟踪和姿态分析技术，以及领先的三维场景重建技术，公司自主研发了“深瞳灵境”全新沉浸式交互感知系统，通过自研的边端结合的软硬件一体解决方案，深瞳灵境创新性的实现了多项全新技术和系统，包括支持远距离精确同步的多相机协同系统、在投影场景下完成人体成像的光学方案、高度精确的3D人体姿态重建技术等，能够在全国产高性能AI处理芯片支持的相机和边缘智能计算设备上实现完整的非侵入式人体位姿动捕方案。

同时，公司还自主开发了游戏道具实时交互系统，通过部署环境光标和为人员佩戴或在道具上装载自研接收感应装置，依据环境光标，实时计算出位置和姿态，为用户提供高度代入的交互体验，在给予用户沉浸体验的同时，通过高速计算系统使系统给出准确的交互反馈，达到了声、光、动一体的全新交互体验。

公司利用多年积累的人体姿态估计技术和三维重建技术，建设了完整的软件框架来支持上层内容开发者，通过标准接口和标准能力，允许开发者快速完成交互内容建设，无需额外的门槛即可得到AI能力的加持。基于深瞳灵境解决方案，公司已经在互动娱乐、文旅博展、教育培训创新教育等多个方向展开试点探索。

国家科学技术奖项获奖情况
□适用 √不适用

国家级专精特新“小巨人”企业、制造业“单项冠军”认定情况
□适用 √不适用
公司入选北京市专精特新“小巨人”企业。

2. 报告期内获得的研发成果
截至报告期末，公司及控股子公司、孙公司共计拥有有效专利（不包含权利终止和转让）53项、有效软件著作权（不包含权利终止和转让）159项。

报告期内获得的知识产权列表

	本期新增		累计数量
	申请数（个）	获得数（个）	申请数（个）	获得数（个）
发明专利	3	3	107	36
实用新型专利	4	2	18	10
外观设计专利	0	2	8	7
软件著作权	4	7	159	159
其他	0	0	0	0
合计	11	14	292	212

3. 研发投入情况表
单位：元

	本期数	上年同期数	变化幅度（%）
费用化研发投入	93,768,088.20	77,061,529.55	21.68
资本化研发投入
研发投入合计	93,768,088.20	77,061,529.55	21.68
研发投入总额占营业收入比例（%）	182.75	48.95	133.80
研发投入资本化的比重（%）

研发投入总额较上年发生重大变化的原因
□适用 √不适用

研发投入资本化的比重大幅变动的原因及其合理性说明
□适用 √不适用

4. 在研项目情况
√适用 □不适用
单位：元

序号	项目名称	预计总投资规模	本期投入金额	累计投入金额	进展或阶段性成果	拟达到目标	技术水平	具体应用前景
1	人工智能算法平台升级项目	344,798,500 .00	36,303,935 .71	142,389,870 .66	开发阶段（2024年7 月已结项）	1、研发全生命周期运营、一站式的数据治理平台，包含数据集成、规范设计、数据质量监控、数据资产管理、数据服务、数据安全等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，构建从数据接入到数据分析的端到端智能数据系统，实现数据平台数字化转型。 2、研发基于主动学习机制的自动化算法模型训练生产系统，服务于公司的各个领域，平台可满足公司各产品线所需算法模型的需求，获取和挖掘原始业务数据，为各业务领域提供高识别率的算法模型。 3、完成智慧金融领域的大模型和知识库建设，能够从监控视频中识别危险和异常行为，利用大模型的表达能力，提升复杂场景的识别精度。 4、实现机器人在室内和半户外场景拥有稳定的自动驾驶能力，达到毫米级精度。并实现实时时定位与建图技术（SLAM）、移动体的轨迹规划与运动控制技术、多机调度与协同技术。 5、提升大规模人群中人脸遮挡的算法识别能力，优化带口罩、带帽子及质量较差图像的识别效果。 6、研发自有图像预训练大模型，实现视频分类、图片分类、少样本检测模型、少样本事件任务，提升行为任务效果。 7、研发局部特征匹配算法，应用在依赖图像精确	行业领先	用于支撑公司所有业务场景。
						配准方向，也为后续目标定位、异常检测、多图像融合、图像校对等任务提供支持。 8、研发基于单目的人体3D姿态估计算法和人体表面重建算法，使金融、体育等场景中运动姿态表达达到传统多目算法精度。 9、研发运动场景下的智能算法，实现对非标准动作的评价与纠正，使多类运动项目达到或超越行业标准的识别精度。 10、预研自有多模态大模型和相关技术，使其在业务场景应用落地。
2	人工智能创新应用研发项目	151,263,200 .00	26,154,846 .69	119,170,610 .86	开发阶段（2024年7 月已结项）	1、完成研发具有实时智能、自主控制能力的工业巡检机器人设备和交互系统，可适应各种场景和列车，实现空间内的低速自动驾驶、机械臂视觉引导、远程示教等功能，具有故障智能诊断、缺陷自动定位、障碍物自主感知的能力。 2、完成研发一套高检测效率、高准确性、轻便、快装的工务线路巡检设备，实现自动快速检测轨道状态、缩短检修时间目标，完成线路巡检的数字化、标准化流程建设，实现降本增效且适应提速、高密度行车的要求。 3、完成研发面向轨交行业的可穿戴AI设备，基于自研的算法、应用和硬件提供标准作业流程履职助手，提高作业过程的规范性和安全性。 4、打造针对多种体育场景的三维运动交互产品及多目协同解决方案，可支持100+的运动训练与考试项目，具备视觉算法精度高、运动姿态评价准的特点，体育运动解决方案已初步研发完成，在多个用户场景持续迭代中；打造满足国家体质健康统测、九年级中考、高中会考等场景下的人工智能体育考试和评价方案，支持30+考核科目，并结合体育考试系统平台，实现体育考试中组考、	行业领先	1和2、应用于飞机、铁路、公路、桥梁等工业检修领域。 3、应用于轨交行业标准作业流程的数字化、智能化场景，及其它关注生产安全和生产质量的工业巡检场景。 4、应用于学校、教培等技能训练和考试领域。 5、应用于文旅、文博、
						检录、考试、成绩仲裁、检出等全流程管理。 5、开发面向沉浸式交互体验的基础设施、计算设备、游戏应用和管理平台，软件方面，通过自研的虚拟ID技术、视觉动捕技术、空间定位技术、数字孪生技术，打造可部署在不同体量的沉浸式体验场景；硬件方面，应用公司自研的高性能智能摄像机产品和边缘计算产品，实现便捷易部署的深瞳灵境感知系统，支撑大规模沉浸式交互系统的商业化落地；打造深灵之心运管平台，提供其全生命周期管理，包括设施管理、内容分发、场馆运营支撑、开发者管理等。		研学、大型沉浸式多人互动游戏领域。
3	“金砖”智慧金融管理系统	58,200,000. 00	5,940,866. 09	46,469,983. 18	大规模商业化	实现面向银行的智能视频图像分析和物联网解决方案，覆盖云边端架构，具有合规操作监控、风险事件预警、运营效率分析、大模型预训练、物联网管理等功能。	行业领先	应用于银行网点、金库、办公大楼、产业园区等领域。
4	“战狼”公安视图大数据分析平台	95,528,700. 00	1,950,099. 73	62,885,192. 59	大规模商业化	推出面向公安行业的视图大数据解决方案，开发集视图大数据系统、视图库系统、地图服务、运维管理平台、数据治理系统、多生物特征管理等系统为一体的安防大数据平台。	与同行业可比公司接近	应用于公安业务场景，包括但不限于科信、刑侦、图侦等业务领域。
5	车路协同感知 MEC	5,324,000.0 0	480,495.54	1,907,051.8 5	试点及产品迭代阶段	通过接入路口的高清摄像机视频流，基于视频图像结构化识别算法引擎，完成路口交通参与者的视觉识别，同时对路口各个方向，进行视频融合，再结合雷达的探测数据，依赖雷视拟合技术，完成雷达和视频数据的融合，最终形成各路口完整的感知融合数据。	行业领先	应用于智慧高速、城市交通等领域。
6	智慧交通全息感知设备	1,175,000.0 0	5,595.12	137,229.75
7	车载移动违法	3,482,200.0 0	553,645.42	1,852,909.4 3	试点及产品迭代阶段	实现车载移动状态下各类违法行为的分析，包括压线、占用公交车道、不礼让行人、占用应急车	行业领先	应用于交通管理领域。
	抓拍设备					道、非机动车不戴头盔、非机动车超载等20余种违法行为；支持场景包括城市、高速、农村、铁骑；支持记录违法车辆结构化信息及GPS位置；支持报警记录的短视频及图片输出；支持车辆布控报警及车辆实时结构化；支持行车记录视频存储及配置；支持RTSP协议的视频流接入及远程预览；支持远程升级。
8	智慧油站大数据分析平台	28,037,000. 00	2,395,157. 48	20,601,175. 75	大规模商业化	推出面向加油站智能化、数字化升级改造场景的智慧油站解决方案，通过自研算法、引擎、应用软件和硬件为加油站的经营决策提供量化数据支撑，为加油站的安全管理提供智能化方法，为其现场服务水平提供衡量指标。	在该应用领域的商业化布局领先同行业可比公司	应用于传统加油站智能化、数字化升级改造场景。
9	智慧能源农场	50,580,000. 00	3,046,359. 86	5,295,758.0 5	开发阶段	运用人工智能和可控光合作用等技术手段，开发高效的光反应器和自动化控制工艺，实现稳定、高产的微藻养殖技术并进行试产，提供以微藻为基础的稳定饲料来源；建立一套主要基于太阳光、空气和水的具有较高自动化程度的自洽系统，自组织的持续稳定经济的生产某种特定藻类，并以该藻类作为生物质原料，进行深入开发。	与同行业可比公司接近	应用于饲料、食品和生物能源生产领域。
10	自主飞行机器人研究项目	11,810,000. 00	687,940.69	2,480,966.7 9	开发阶段	研发无人机自主飞行负载模块，构建不依赖于卫星定位的自主无人机系统，从事工业巡检任务。	与同行业可比公司接近	应用于铁路公务段、桥梁边坡、通讯铁塔及设施、采矿业、电力、建筑等领域的工业巡检。
11	边缘计算产品平台	21,128,000. 00	5,743,652. 51	18,362,313. 29	大规模商业化	依托公司多年嵌入式硬件平台的积累，开发具有不同算力、不同业务应用的国产化边缘计算产品，输出公司领先的AI算法能力。通过云边结合，实现算法动态从云端下发到边缘端，支持灵活的规模化部署和运维。	行业领先	应用于智慧金融、智慧体育、智慧商业和元宇宙等领域。
12	深瞳智能物联网平台	6,020,000.0 0	1,847,901. 98	4,787,098.9 1	大规模商业化	提供跨平台统一的系统环境、服务接口、打包升级方案和稳定高效的底层操作系统，开发便于管理、支持多种设备运维方式、支持算法下发、灵活部署的智能物联网平台。	行业领先	应用于智慧金融、体育健康、智慧商业、元宇宙等领域。
13	可穿戴助手	8,870,000.0 0	4,406,876. 82	7,873,235.1 4	试点及产品迭代阶段	完成可穿戴智能相机开发，实现对高安全性行业的实时智能分析和指导。	与同行业可比公司接近	应用于轨交、航空、医疗、特种设备等领域。
14	智能摄像机产品平台	5,370,000.0 0	444,130.85	4,511,356.7 9	试点及产品迭代阶段（2024年7 月已结项）	开发支持不同算法模型的多目智能摄像机产品，具有高算力、帧同步、姿态识别、场景感知等能力。	与同行业可比公司接近	应用于沉浸式人机交互、体育健康领域。
15	可穿戴语音记录分析设备	7,574,000.0 0	1,146,729. 85	6,596,288.8 3	已结项	完成语音检索、对话呈现、工作量化等基础功能，在业务数字化分析和风险防控能力上达到金融行业的要求。	与同行业可比公司接近	应用于银行、保险、证券等金融机构。
16	智能认知系统	3,752,000.0 0	1,566,949. 92	2,770,238.7 4	大规模商业化	开发面向线下场景、以降本增效为目标的智能认知系统，提供由端到云的整体解决方案，包含视频图像的结构化识别、对比、聚类等基础能力，通过大数据分析提供快速、准确的通用功能和稳定、可靠的服务，满足各类场景的业务需求。	行业领先	应用于商业地产、智慧通行等领域。
合计	/	802,912,600 .00	92,675,184 .26	448,091,280 .61	/	/	/	/

注：项目1、2的累计投入金额超过募集资金累计投入金额的部分为根据研发费用分摊表分摊的间接费用。（未完）