[年报]格灵深瞳(688207):格灵深瞳2022年年度报告
原标题:格灵深瞳:格灵深瞳2022年年度报告 公司代码:688207 公司简称:格灵深瞳 北京格灵深瞳信息技术股份有限公司 2022年年度报告 1 / 247 重要提示 一、 本公司董事会、监事会及董事、监事、高级管理人员保证年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。 二、 公司上市时未盈利且尚未实现盈利 □是 √否 三、 重大风险提示 公司已在本报告中详细阐述公司在经营过程中可能面临的各种风险及应对措施,敬请查阅本报告第三节“管理层讨论与分析”之“四、风险因素”。 四、 公司全体董事出席董事会会议。 五、 容诚会计师事务所(特殊普通合伙)为本公司出具了标准无保留意见的审计报告。 六、 公司负责人赵勇、主管会计工作负责人王艳及会计机构负责人(会计主管人员)杜家芳声明:保证年度报告中财务报告的真实、准确、完整。 七、 董事会决议通过的本报告期利润分配预案或公积金转增股本预案 公司2022年度利润分配预案为:以实施权益分派股权登记日登记的总股本为基数,公司拟以资本公积向全体股东每10股转增4股,不派发现金红利,不送红股。以上利润分配暨资本公积转增股本预案已经公司第一届董事会第十七次会议和第一届监事会第十一次会议审议通过,尚需提交公司股东大会审议。 八、 是否存在公司治理特殊安排等重要事项 □适用 √不适用 九、 前瞻性陈述的风险声明 √适用 □不适用 本报告所涉及的公司未来计划、发展战略等前瞻性陈述,不构成公司对投资者的实质承诺,请投资者注意投资风险。 2 / 247 十、 是否存在被控股股东及其他关联方非经营性占用资金情况 否 十一、 是否存在违反规定决策程序对外提供担保的情况 否 十二、 是否存在半数以上董事无法保证公司所披露年度报告的真实性、准确性和完整性 否 十三、 其他 □适用 √不适用 3 / 247 目录 第一节 释义 ..................................................................................................................................... 4 第二节 公司简介和主要财务指标 ................................................................................................. 8 第三节 管理层讨论与分析 ........................................................................................................... 13 第四节 公司治理 ........................................................................................................................... 50 第五节 环境、社会责任和其他公司治理 ................................................................................... 65 第六节 重要事项 ........................................................................................................................... 70 第七节 股份变动及股东情况 ....................................................................................................... 99 第八节 优先股相关情况 ............................................................................................................. 108 第九节 债券相关情况 ................................................................................................................. 108 第十节 财务报告 ......................................................................................................................... 109
4 / 247 第一节 释义 一、 释义 在本报告书中,除非文义另有所指,下列词语具有如下含义:
7 / 247 第二节 公司简介和主要财务指标 一、公司基本情况
二、联系人和联系方式
三、信息披露及备置地点
四、公司股票/存托凭证简况 (一) 公司股票简况 √适用 □不适用
(二) 公司存托凭证简况 □适用 √不适用 五、其他相关资料
六、近三年主要会计数据和财务指标 (一) 主要会计数据 单位:元 币种:人民币
9 / 247 (二) 主要财务指标
报告期末公司前三年主要会计数据和财务指标的说明 √适用 □不适用 1. 报告期内,公司归属于上市公司股东的净利润、归属于上市公司股东的扣除非经常性损益的净利润、基本每股收益、稀释每股收益、扣除非经常性损益后的基本每股收益较上年同期分别增长 147.67%、138.51%、138.78%、138.78%、129.79%,主要原因系公司报告期内营业收入增长、毛利率增长、软件收入增长带来的增值税即征即退收益增长、资金管理取得的利息收入增长和股份支付费用减少等因素的共同影响带来的利润增长。 2. 报告期内,公司经营活动产生的现金流量净额较上期增长280.09%,主要原因系公司报告期内客户回款情况较好。 3. 报告期期末,公司总资产、归属于上市公司股东的净资产较报告期初分别增长224.42%、282.12%,主要原因系公司于2022年3月完成首次公开发行,带来公司总资产和净资产规模的大幅增加。 七、境内外会计准则下会计数据差异 (一) 同时按照国际会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况 □适用 √不适用 (二) 同时按照境外会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况 □适用 √不适用 (三) 境内外会计准则差异的说明: □适用 √不适用 10 / 247 八、2022年分季度主要财务数据 单位:元 币种:人民币
□适用 √不适用 九、非经常性损益项目和金额 √适用 □不适用 单位:元 币种:人民币
对公司根据《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》定义界定的非经常性损益项目,以及把《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因。 □适用 √不适用 十、采用公允价值计量的项目 √适用 □不适用 单位:元 币种:人民币
十一、非企业会计准则业绩指标说明 □适用 √不适用 十二、因国家秘密、商业秘密等原因的信息暂缓、豁免情况说明 □适用 √不适用 12 / 247 第三节 管理层讨论与分析 一、经营情况讨论与分析 2022 年是公司登陆科创板元年,在这段新征途的起始之年,公司保持了良好的增长态势,实现营业收入35,365.35万元,同比增长20.47%,归属于母公司所有者的净利润3,261.49万元,归属于母公司所有者的扣除非经常性损益的净利润 2,507.14 万元,较上年同期分别增加10,103.26万元、9,018.02万元,实现扭亏为盈。 (一)持续加大研发投入,增强竞争优势 人工智能行业是技术密集型、人才密集型行业,高水平技术人员是公司获得持续竞争优势的基础和发展的关键,更是保持不断研发创新的重要保障,公司以技术研发为核心驱动力,持续加强各领域研发投入,不断增强技术储备,加速研发团队构建,核心技术团队涵盖算法、智能应用、产品设计、硬件开发等多领域的资深人才,拥有丰富的学术知识与研发创新经验,持续在核心算法技术、应用场景相关技术进行前瞻性的研究和探索,为公司持续较快发展提供坚实支撑。公司按计划并行推进多个研发项目,一方面对人工智能算法平台和自研硬件进行重点投入,而在应用领域方面,则是重点强化对轨交运维、体育健康和元宇宙领域的研发投入。报告期内,公司研发投入13,234.24万元,占营业收入比例为37.42%,研发投入同比持续增长,截至报告期末,研发人员数量为276人,同比增长49.19%,人才储备不断完善。 (二)深耕现有落地场景并积极寻求拓展 公司凭借高效的算法生产技术以及对各下游行业与应用场景的深度理解,在市场上拥有良好口碑,目前多款人工智能产品及解决方案已经在智慧金融、城市管理、商业零售、轨交运维等多个业务场景得到应用,在应用的同时公司根据下游客户的需求不断优化、升级核心技术,确保持续的技术创新。在不断夯实现有的商业落地场景的同时,公司积极寻求其他商业落地场景的拓展,在体育健康、轨交运维、元宇宙等方向推进试点应用工作,并开展前沿性探索,增强公司落地场景的丰富度。 (三)推动智能网联交通业务公司化运营 伴随智能网联汽车进入飞速发展阶段的契机,2022 年 11 月,公司设立控股子公司北京开云以推动智能网联交通业务的公司化运营,增强该业务的市场竞争力。北京开云基于公司自动识别各类车辆、智能分析交通行为的技术储备和智能网联交通行业快速发展的情况,实现车、路、人、环境之间实时动态的交互联动,在提高交通行车安全、减轻驾驶员负担方面具有重要作用,并有助于节能环保和提高交通效率。 13 / 247 北京开云设立后,已经完成车路协同感知MEC和车载移动违法抓拍设备的产品研发立项,正逐步组建专业的研发和产品团队,相关业务正在有序推进中。 二、报告期内公司所从事的主要业务、经营模式、行业情况及研发情况说明 (一) 主要业务、主要产品或服务情况 公司以“让计算机看懂世界,让 AI 造福人类”为愿景,专注于将先进的计算机视觉技术、大数据分析技术、机器人技术和人机交互技术与应用场景深度融合,提供面向智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙的人工智能产品及解决方案。公司经过多年的技术研发与积累,已有效掌握了基于深度学习的模型训练与数据生产技术、3D 立体视觉技术、大规模跨镜追踪技术、自动化交通场景感知与事件识别技术、机器人感知与控制技术等方向的多项核心技术,凭借过硬的技术能力和长期的商业化经验,已成功在智慧金融、城市管理、商业零售、轨交运维四大领域实现落地应用,其中:城市管理领域已覆盖全国多省市的公安局、公安交通管理局、政法委员会等政府机关或企事业单位;智慧金融领域已覆盖农业银行全国各省市的上万家网点,包含智能安保、智能运营、智能风控等多个金融业务场景,同时,公司参与搭建某国有银行总行 AI 平台,并开始在其他国有银行分支行进行试点;商业零售领域主要收入来自排名前列的地产类客户;轨交运维领域公司自研的列车智能检测解决方案已在高铁和地铁项目中通过验收,实现落地应用,为列车的安全运维提供保障,在研产品己涵盖轨交机务、电务和工务三大工种。 除此之外,公司在体育健康、元宇宙等更多领域进行前瞻性的布局,部分在研产品已成功在客户中开展试点,各类产品和解决方案的研发和落地工作按计划有序推进。公司从客户需求出发,面向智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙不同领域的客户,提供相应的行业解决方案。 (二) 主要经营模式 1、盈利模式 公司主要从事计算机视觉技术、大数据分析技术、机器人技术和人机交互技术的研发和应用。 公司的盈利来源于向客户提供面向应用场景的人工智能产品及解决方案获得销售收入。公司自主研发的人工智能产品主要包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台。人工智能产品既可以标准化模式销售,也可根据客户需求进行产品组合,提供定制化服务,以整体行业解决方案向客户交付。 2、研发模式 14 / 247 公司拥有完整的研发组织架构与创新机制,以用户需求为核心,采用迭代、循序渐进的敏捷 方法进行研发活动,并对整个产品生命周期进行管理,在过程中不断对执行结果和阶段目标进行 总结复盘,通过不断迭代完善产品质量和改进研发过程。公司具体的研发过程如下图所示: (1)在产品需求调研阶段,公司对行业发展趋势、市场规模和用户核心需求进行调研分析,并结合公司产品战略规划,由产品团队完成需求分析,确定产品的核心目标特性和功能,由研发团队进行技术路线规划。 (2)在可行性验证阶段,公司进行大量算法实验以寻找合理科学的解决方案,产品经理、算法工程师、软硬件开发工程师和测试团队密切配合,在产品负责人的协调下进行多次短平快的软件原型迭代,每一次迭代都会在产品实际使用场景中进行反复实验确认,通过与客户持续沟通,调整和优化,确认产品最终形态的各功能模块和参数指标,并明确研发周期。在整个过程中,算法团队负责完成实验场景的建设和数据收集,并进行验证性实验;软件开发团队负责针对应用场景进行原型验证和开发;智能硬件团队负责对硬件产品的相关指标进行可行性实验和评估。 (3)在产品研发阶段,产品经理将总结可行性验证阶段的成果,转化为产品功能指标及开发任务,确保产品交付节点和产品定义与用户预期保持一致;算法和工程团队协同完成算法模型设计开发、数据收集清洗、功能特性开发等工作;测试团队按照产品定义对产品每个开发版本进行验收,并完成自动化测试脚本;智能硬件团队完成新硬件产品的结构设计和工业设计,有效评估外观、材质、散热、电气等特性,并负责设备软件开发和集成,交付少量可以进行测试认证的工程样机。该阶段产品会发布多个内外部测试版本,在实践中进行快速迭代。 (4)产品发布阶段是在产品完成核心功能开发后,在目标市场具备销售的条件时,产品经理建立产品的标准文档、销售价格、实施方案、售后体系,研发团队将大量来自客户实际使用的数据进行处理,快速迭代,提高产品成熟度;新的硬件产品会在这一阶段完成小批量验证和量产导入,实现加工生产工艺所需要的工装硬件和工具软件;测试团队进行大量密集的现场测试,确保产品满足产品定义的各类功能指标。这一阶段的完成标志产品正式版本发布。 15 / 247 (5)产品运营阶段在产品正式发布后,产品经理结合市场反馈与发展趋势,制定多个后续产品版本,不断创新,推出符合市场需求的产品新版本,以对产品进行持续的运营、维护和改进。 3、采购模式 公司专注于人工智能产品及解决方案的研发和销售,不涉及硬件的直接生产。 针对标准硬件、配件及服务类采购,公司直接向供应商提出待采购产品或服务的需求,供应商按照指定的时间和地点进行交付;针对定制化硬件,公司采购主要原材料并发货至委外加工厂,由其进行生产加工。公司选择专业的代工厂,依托其已有的完善的品质控制、生产制造管理和硬件设施进行专业的代工生产。公司通过新产品导入、质量检验标准发布、生产工艺发布、测试检验工具发布等方式确保产品生产的有效性、一致性和稳定性。 4、销售模式 公司结合下游行业的业务特点与主要产品的市场定位,制定了直接销售的销售模式,向终端客户或集成商客户直接销售人工智能产品及解决方案。其中终端客户是指直接使用公司产品及解决方案的各行业领域客户,包括金融机构、政府部门、公安机关、企事业单位等;集成商是指承担系统集成、安装部署、运营维护等职能的企业,包括终端客户的项目总包方或其指定的工程服务商等。公司与客户直接对接需求,通过商务谈判、参与招投标等方式获取订单。公司建立了完善的直销服务体系,目前已在全国划分了华东、华中、华北、东南、西南、东北、西北七个大区进行区域化和行业化的矩阵式管理,以提供及时、高效的销售服务。 (三) 所处行业情况 1. 行业的发展阶段、基本特点、主要技术门槛 根据国家统计局《国民经济行业分类》(GB/T4754-2017),公司属于“软件和信息技术服务业”(行业代码为 I65)。根据《战略性新兴产业分类(2018)》,公司属于“新一代信息技术产业”中的“人工智能”行业。公司专注于将先进的计算机视觉技术、大数据分析技术、机器人技术和人机交互技术与应用场景深度融合,提供面向智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙的人工智能产品及解决方案,所属行业为人工智能行业中的计算机视觉行业。 (1)行业发展阶段和基本特点 ①人工智能行业 人工智能行业的产业链可分为基础层、技术层、应用层。其中,基础层主要包括芯片、软件框架、传感器、服务器、数据(集)等软硬件及服务,为技术层提供算力、数据等底层支撑,是人工智能发展的重要基石。 16 / 247 技术层主要通过基础层的算力、数据支持,进行海量模拟训练和机器学习建模,为人工智能 提供核心的算法与应用技术,主要包括以深度学习为代表的算法模型,以及计算机视觉、智能语 音、机器学习、生物特征识别、知识图谱等关键技术。技术层是人工智能发展的核心,对应用层 的智能化发展起到决定性作用。 应用层则是基于基础层与技术层,面向特定应用场景需求而形成的软硬件产品或解决方案。 人工智能应用广泛,可有效赋能下游领域实现人工智能应用,为其转型与发展注入强劲新动能。 人工智能行业的产业链结构如下图所示: 资料来源:iResearch、全国信息安全标准化技术委员会等发布的公开资料整理 人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。全球主要经济体均积极推进制定人工智能发展战略,持续推进技术的产业化发展,在政府推动下,各国科技企业积极跟进,进一步提升人工智能领域投资,根据IDC数据,各主要经济体的人工智能投入占其本国GDP总量的比例均出现不同程度提升,从2015年-2022年,美国人工智能投入占比提高了 3倍,德国提高了5 倍,而中国人工智能投入占比则提高了 13 倍之多。我国把人工智能放在国家战略层面,出台了一系列重要政策鼓励支持人工智能的发展。《新一代人工智能发展规划》明确指出了到 2030 年我国新一代人工智能发展“三步走”的战略目标。十四五规划中明确提出“推动互联网、大数据、人工智能等同各产业深度融合”。随着人工智能技术的不断进步与发展,部分技术进入产业化发展阶段,智能应用已成为当前及未来较长发展周期的核17 / 247 心要义。与此同时,人工智能正与生产生活的各个领域相融合,有效提升各领域的智能化水平,在带动新产业兴起的同时也为传统领域带来变革机遇,从而拥有极为广阔的市场前景。IDC 预测,中国人工智能市场支出规模将在2023年增至147.5亿美元,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率将超20%。 ②计算机视觉行业 根据国家标准化管理委员会指导编制的《人工智能标准化白皮书(2018 版)》,计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解、分析图像以及图像序列的能力。根据解决问题的不同,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类,具体情况如下表所示:
18 / 247 从功能来看,根据中国科学院大数据挖掘与知识管理重点实验室发布的《2019 年人工智能 发展白皮书》,计算机视觉主要功能包括图像获取、预处理、特征提取、检测/分割、高级处理 等,具体功能如下图所示: 资料来源:《2019年人工智能发展白皮书》 目前,计算机视觉作为人工智能中技术率先取得较大突破、应用场景较为明确的关键技术之 一,在人工智能中占据重要地位,已在工业界逐步实现商用价值,步入规模化商业落地阶段。同 时,随着相关设备能力的改善(如算力、内存容量、能耗、图像传感器分辨率和光学器件等), 提升了应用的性能和成本效益,进一步加快了计算机视觉商业应用的扩展。据iResearch数据, 2021年我国计算机视觉产品的市场规模占整个人工智能行业的49.6%,达到990亿元,带动相关 产业规模超过 3,079 亿元。预计至 2026 年,我国计算机视觉核心产业规模和带动相关产业规模 将分别增长至 2,208亿元和 6,733 亿元,年均复合增长率分别为 17.4%和 16.9%。从市场规模、 场景泛用、带动作用来说,计算机视觉领域未来市场空间广阔。 资料来源:iResearch于2022年9月发布的《端边云协同的AI视觉产业研究报告》 19 / 247 (2)主要技术门槛 公司所属人工智能行业属于技术密集型行业,行业进入壁垒高,产品具有高技术含量、高附加值等特点,企业需拥有高效的研发创新和产业应用能力,头部企业拥有深厚的技术积累和不断进行先进技术探索的机制,在经营方面需拥有不同业务场景的快速商业化落地能力和良好市场口碑,对企业的研发、销售等业务管理能力均有较高的要求。 2. 公司所处的行业地位分析及其变化情况 在 AI 算法层面,公司的核心算法多次在国内外人工智能算法竞赛中夺冠,达到行业领先水平;公司在研发过程中向学术界开源了TrillionPairs和Glint360K两个人脸识别数据集,开源了PartialFC训练代码,推动了行业技术的发展;同时,公司承担了国家科技部、北京市科学技术委员会等多项人工智能技术应用的重大科研项目,并与全国信息安全标准化技术委员会、中国安全防范产品行业协会、中国信息通信研究院、中关村标准化协会、国家工业信息安全发展研究中心、中国电子工业标准化技术协会、中关村智慧城市产业技术创新战略联盟、中关村中安公共安全视频智能应用技术联盟等单位开展多项标准化制定工作。 在 AI 应用层面,公司已将核心算法技术运用在主营产品中,形成了面向智慧金融、城市管理、商业零售、体育健康、轨交运维、元宇宙等领域的人工智能产品及解决方案,并根据下游客户的需求不断优化、升级核心技术,确保持续的技术创新。公司的主营业务产品在下游主要核心客户的认可程度高,良好的市场口碑为公司市场拓展及持续发展奠定了重要基础。 人工智能下游的应用领域众多,目前与公司同行业的人工智能企业在下游应用领域的布局方面各有侧重,未来市场空间较大。公司作为计算机视觉领域的创新型人工智能企业之一,目前尚处于产业化与市场拓展的快速发展阶段,在多个人工智能细分应用领域中已较早完成了产品布局,未来在新应用领域的业务拓展将持续提升公司的市场份额和竞争地位。 3. 报告期内新技术、新产业、新业态、新模式的发展情况和未来发展趋势 近年来,由于人工智能已成为科技创新的关键领域和数字经济时代的重要支柱,在国家及地方多项政策和资金支持下,我国人工智能技术和产业蓬勃发展,进入了新的发展阶段,应用场景也在不断的拓宽、融合和多元化发展,产业结构逐渐完善,2022 年,人工智能在各个行业的渗透率均有提升,在互联网、金融、政府、电信和制造业等行业的应用渗透率居前,成为企业寻求提升用户体验和保持竞争力的重要能力。我国人工智能领域在企业、专利和论文数量等方面都进入国际领先行列,自主研发的开源深度学习框架、开源工具集、开源应用软件、开源社区快速发展,在国际人工智能开源社区的贡献度已成为仅次于美国的第二大贡献国。借助数据获取渠道广、行业应用场景丰富以及总体投资水平高等优势,我国人工智能企业在技术创新与快速商业化方面20 / 247 形成了良好的发展环境,但在人工智能基础理论和原始创新方面仍相对较弱,核心智能芯片和基础元器件的自主研发生产能力与国际领先水平尚存在较大的差距。 数据、算力和算法是人工智能发展的三驾马车。在数据层面,人工智能技术需要大量的标注数据,推动数据规模不断增长,数据服务走向深度定制化,高质量知识集加速构建。在算力层面,2022年2月国家启动实施的“东数西算”工程和智能计算中心的建设通过算力基础设施从点到网的升级,逐步构建起更健全的基础设施结构,而数据的攀升、算法和模型领域的突破更加要求人工智能产品快速、精准地处理大量数据或执行复杂的指令,这对算力提出更高的需求,在技术发展的客观要求、政策的支持和资本的推动等多重因素驱动下,各类人工智能芯片快速演进发展。 在算法层面,超大规模预训练模型成为热点,推动人工智能技术效果不断提升,继续朝规模更大、模态更多的方向发展,多模态技术的支持使得单一自然语言处理或计算机视觉模型发展成语言文字、图形图像、音视频等多模态、跨模态模型,推动了AIGC内容多样性的提升,使AIGC拥有了更为通用的能力,引发 AIGC 技术能力的质变。AIGC 作为当前新型的内容生产方式,已率先在传媒、电商、影视和娱乐行业等数字化程度高、内容需求丰富的场景取得进展,展现出了一定的市场潜力,同时,在加快产业升级的进程中,AIGC 在金融、医疗、工业等领域的应用也将迅速发展。 作为在人工智能行业技术成熟度较高、商业化进程较快的细分领域,计算机视觉技术从最初的静态人脸识别和光学字符识别起步,逐渐扩展到了人脸识别分析、活体检测、人体识别分析、物体检测识别、行为识别分析等诸多方向,应用场景也从较早的城市管理、金融、互联网、商业零售等领域,扩展到轨道交通、医疗健康、元宇宙、人机交互等创新领域。神经网络和深度学习是计算机视觉的基石,而数据、算力和算法三驾马车的发展极大拉动了计算机视觉技术的发展。 海量的应用场景数据为计算机视觉算法提供训练基础,使得算法精准度提升,让机器实现更为精准的视觉识别;人工智能芯片的发展大幅提升了数据处理速度,缩短了计算过程和模型架构调整时间,为计算机视觉的发展提供了算力支持;深度学习算法的发展提升了计算机视觉准确度。目前计算机视觉企业的技术成熟度均已达到较高水平,同行业企业间的技术差异在逐渐缩小,在大部分应用场景下,各企业的技术水平都已经可以较好的满足用户需求,因而未来计算机视觉企业间的竞争将从技术领先性竞争逐步转向以拓展落地场景和理解用户需求为核心的综合服务能力竞争。 21 / 247 (四) 核心技术与研发进展 1. 核心技术及其先进性以及报告期内的变化情况 公司打造了底层 AI 技术平台——深瞳大脑,深瞳大脑作为公司核心技术的驱动平台,赋能 公司人工智能产品及解决方案的技术实现。深瞳大脑包含数据平台和训练平台,由数据采集、数 据预处理、数据标注、模型训练、模型优选、数据管理等模块组成。 数据平台支持多源多模态数据的自动收集和清洗归类,通过构建自动化处理为主、人工标注为辅的标注体系,形成海量增长的标签数据池,有效节省标注成本,提高了算法模型的研发效率;训练平台则有效提高了模型训练的自动化水平,降低算法多平台部署应用的迁移难度,为算法高效生产及快速商业化应用奠定了重要基础。目前,公司深瞳大脑可支持数十亿训练数据、数亿类别任务,数十亿参数模型的训练。训练平台生产高质量的算法,推动应用的落地,数据平台收集应用产生的高质量数据又促进算法的提升,从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环,为公司的高效研发创新与产业应用提供了有力支持。 (1)基于深度学习的模型训练与数据生产技术 公司自研的海量数据算法生产技术通过自有的核心算法结合大数据平台的分析处理技术,支持在海量数据中进行挖掘,主动触发模型更新训练,有效的提高了算法的准确率和生产率。同时,公司自建的数据标注平台,通过组建具有专业背景的标注团队,用人工标注加 AI 模型自动化预识别的方法,为算法提供精准的基础训练数据,可覆盖公司内部99%的算法标注任务。 公司利用自研的底层 AI 技术平台深瞳大脑对数十亿训练数据进行清洗,并基于大规模数据训练大模型,在海量数据下,研发了基于多模态弱监督的大模型训练算法,节省了大量数据标注22 / 247 资源。该算法已投稿到国际顶级会议 ICLR2023 并被接收,公司已在业务中利用该大模型提升少样本场景的准确率,进一步验证了该大模型在下游任务中的泛化能力。 跨平台模型训练技术用于简化 AI 算法生产,该技术基于自主研发的训练框架,可实现常用业务 AI 算法的一键式训练,为常见业务中的分类、检测等算法提供便捷快速的实用模型。针对不同应用场景的算法开发,公司自主研发的跨平台模型训练技术可将训练任务管理平台产出的模型自动发布到各种类型的显卡或平台,包括英伟达显卡、嵌入式平台、海思平台、华为Altas计算卡等,无需人工干预,从而达到模型快速高效交付的目的,可有效的降低研发成本,有助于提升产品的市场竞争力。 (2)3D立体视觉技术 3D 立体视觉一般通过结构光、激光雷达等特殊传感器采集得到场景的深度信息,再利用深度信息和可见光信息一同计算出场景的三维图像。 多目传感器标定与深度估计技术使用一对成本更为低廉的可见光相机组成双目系统,对场景深度信息进行估算,在达到普通结构光相机精度的同时,提高了相机的可靠性和易用性,并能覆盖更多的结构光相机无法工作的光线条件和场景。基于这项技术的输出,使公司的算法能更好地适应多种不同的场景和目标,进而对人体、物体、场景进行高精度的重建。 运动姿态分析技术通过采集不同场景下人体姿态数据,通过自主研发的三维人体姿态估计算法,能够解决人体关键点数据采集不准确或不稳定的问题。公司基于单目相机的三维重构技术结合动作模型库及人体运动功能学的特点,优化了使用单目相机获取三维人体关键点的效果,解决了基于二维人体关键点进行判断的难题,使得运动姿态分析算法在三维人体上做出更为精准的判断,进而可以应用在体育健康与行为分析领域对人体三维姿态的准确识别与分析。 运动姿态分析技术在智慧金融领域可以协助银行客户进行员工履职分析与管控,人员重点区域违规管控(如非授权人进入、员工缺岗等)、人员操作异常管控(如单人加钞、大额现金遗留等)、人员动作异常管控(如异常倒地、打架、各类防护舱业务等)等项目均达到较高的检测精度;而在体育健康领域,该技术可评判用户动作是否完成及标准程度,评判仰卧起坐、引体向上、跳绳、篮球交替运球、篮球护球训练等 17 项基础测试和训练动作时,也可具备较高水平的检测精度。3D 重建与立体视觉分析技术在轨交运维场景可将离散的局部列车零部件数据进行融合和重构,得到列车标准模型,将几何模型分析、深度学习等技术运用到列车标准模型、点云数据、图片等多维度数据,进行零部件匹配和故障诊断。公司基于深度学习的点云配准技术已在多个学术数据集上取得第一,通过点云几何结构和基于Transformer的多层特征投票机制提升正确匹配点云比例,提升点云配准精度,在真实业务测试集上旋转向量误差小于1度、平移向量误差小于0.3mm,该技术对产品落地起到了至关重要的作用。目前,公司产品已覆盖列车常见的 190 余种23 / 247 故障项点,项点处理速率超过 20,000 个/小时,在高级重要性项点的故障诊断成功率大于 95%,对于高精度测量的项点,测量精度到达亚毫米级别。 (3)自动化交通场景感知与事件识别技术 公司拥有国内领先的车辆识别技术,能够运用高精度目标检测与跟踪技术对大陆号牌、港澳号牌、非机动车号牌等多种类型的车牌进行多种尺寸和角度的识别,支持倾斜角度在 45°范围内的车牌,准确率在 99%以上。同时,公司支持的机动车、非机动车、人体属性识别多达 50 余项,重点属性识别准确率超过95%。 在对交通场景中车辆进行分析时,公司结合在人脸识别技术上的优势研发了多目标属性识别与对象关联技术。该技术可以将车内驾驶员与车辆绑定,协助交通管理部门和公安部门查找可疑人员,提供破案线索。由于车内光线较暗、抓拍受挡风玻璃干扰、司乘人员人脸姿态不受控、人脸有遮阳板墨镜口罩等遮挡的原因,普通的人脸识别算法都会有较大的下降,公司在人脸识别技术上的优势可以做到在以上困难环境下仍能达到较高的识别率。 公司研发的交通场景理解及事件检测识别技术,基于自适应交通场景理解和车辆特征识别的技术能力,无需人工标注,可自动化识别闯红灯、不按导向行驶、不礼让行人等 11 种交通违法场景,同时结合车辆重识别技术可准确定位车辆位置,实现对交通视频的自动分析、事件预警和违法事件的自动审核。 (4)大规模跨镜追踪技术 公司拥有完全自研的人脸识别算法和引擎技术,在多种光线条件、人脸角度的场景下都能达到较高的识别准确度。公司在研发过程中开源了TrillionPairs和Glint360K两个人脸识别数据集以及PartialFC 训练代码,其中 PartialFC相关论文已被视觉顶尖会议 CVPR2022接收,推动了行业技术的发展。公司的人脸识别技术在公开数据集MegaFace上识别准确率达到99.1%。公司在公安部治安管理局亿级人像算法测试中,1 比 1 人像比对测试万分之一误识率下的通过率为99.97%,5万样本比1亿级人像比对测试中首位命中率超过98%,均高于行业平均水平。 公司研发的百亿级人员聚类技术可支撑上万路摄像头接入并实时完成动态聚类,支持室内场景和光照、质量和姿态等都不受控的室外复杂场景中的大规模商用。 为了达到上万路摄像头接入并实时完成动态聚类的应用要求,公司研发了海量数据以图搜图技术。公司研发的以图搜图引擎支持多架构、不同计算设备上的图片检索功能。针对检索频率高实时要求强的场景,以图搜图引擎支持英伟达全系显卡以及华为计算卡的图片检索。针对检索频率低实时要求不强,但图片数量较大的场景,单机可实现上亿人脸图片秒级返回,集群可实现数十亿级图片秒级返回。针对海量图片检索场景,以图搜图引擎实现了单机检索 30 亿人脸图片 2024 / 247 秒内返回结果的性能。配合集群可实现百亿级图片数十秒检索的性能。该技术已广泛应用在公司多个应用场景的产品及解决方案中。 人脸属性表达技术在公共安全等场景具有广泛应用,同时也能辅助大规模人员聚类。公司研发的人脸属性包括年龄、性别、种族、表情、姿态、遮挡、模糊等多项属性。该技术使用单模型、多任务协同训练策略,利用各个属性任务之间的相关性来辅助训练单个模型,可在缩减运算资源的同时保证每个属性的精度。 公司多场景广覆盖人脸活体识别技术可应用在闸机口等通行相关的场景,公司已积累了千万级的攻击样本,可防止人员通过打印照片、屏幕、3D面具等非活体人脸通过闸机。 (5)机器人感知与控制技术 公司将实时定位与建图技术、机械臂视觉反馈技术、机器人路径规划与自主导航技术运用于轨交运维机器人等场景,算法适应性良好,机器人该场景中,以最高 1m/s 的速度做无碰撞运动,达到轨交运维应用所需的技术水平。其中,机器人实时定位与建图技术,又称 SLAM 技术,在室内和半户外场景下拥有良好的定位精度,在结构化的室内场景下,定位精度可达毫米级,在工业现场的半户外场景下,定位精度可达厘米级。同时,公司针对 SLAM 普遍算力要求较高的问题做出了优化,完成 SLAM 模块向特定型号嵌入式主板的迁移和适配工作;机械臂视觉反馈技术,又称手眼协同技术,在机械臂重复性动作的场景中收到良好效果,得到视觉反馈之后的机械臂定位,较普通机械臂定位的精度有较大提升。同时,在保证精度的前提下,时间延迟不超过1秒,保证了精度和实时性;机器人路径规划与自主导航技术,包含机器人定点巡逻、远程临场、人员跟随等功能模块,运用于自动化检修场景中。 公司的机器人虚拟示教技术,能够通过高精度 3D 重建技术,搭建虚拟列车检修空间,构建一个包含作业坑道、列车、机器人等元素,同时考虑物体碰撞、真实设备性能、环境噪声等因素的虚拟机器人作业空间。在虚拟空间内进行机器人示教,通过控制虚拟空间中的机器人进行采集位置确认工作,支持多人协作和远程操作,极大缓解项目实施过程中对真实列车的依赖,提升 3倍以上的实施速度。 公司的机器人遥感技术则通过将虚拟点位下发给机器人,通过坐标空间变换、运动分解、轨迹规划等技术,使机器人获取在物理空间中可执行的动作指令,该技术既支持异步动作执行,也支持在线的虚拟机器人-真实机器人实时动作执行。 国家科学技术奖项获奖情况 □适用 √不适用 国家级专精特新“小巨人”企业、制造业“单项冠军”认定情况 25 / 247 □适用 √不适用 公司入选北京市专精特新“小巨人”企业。 2. 报告期内获得的研发成果 截至报告期末,公司拥有专利34项、软件著作权82项。其中,报告期内新增专利4项、软件著作权11项。 报告期内获得的知识产权列表
3. 研发投入情况表 单位:元
研发投入总额较上年发生重大变化的原因 □适用 √不适用 研发投入资本化的比重大幅变动的原因及其合理性说明 □适用 √不适用 26 / 247 4. 在研项目情况 √适用 □不适用 单位:元
|