[年报]海天瑞声(688787):海天瑞声2024年年度报告
原标题:海天瑞声:海天瑞声2024年年度报告 公司代码:688787 公司简称:海天瑞声北京海天瑞声科技股份有限公司 2024年年度报告 重要提示 一、本公司董事会、监事会及董事、监事、高级管理人员保证年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。 二、公司上市时未盈利且尚未实现盈利 □是√否 三、重大风险提示 公司已在本报告中详细描述可能存在的风险,敬请查阅“第三节管理层讨论与分析”(之四)“风险因素”部分,请投资者注意投资风险。 四、公司全体董事出席董事会会议。 五、容诚会计师事务所(特殊普通合伙)为本公司出具了标准无保留意见的审计报告。 六、公司负责人贺琳、主管会计工作负责人吕思遥及会计机构负责人(会计主管人员)王超声明:保证年度报告中财务报告的真实、准确、完整。 七、董事会决议通过的本报告期利润分配预案或公积金转增股本预案经公司第三届董事会第四次会议审议,公司拟定2024年度利润分配预案如下:拟以实施权益分派股权登记日登记的总股本扣除回购专户股份后的股本为基数分配利润,向全体股东每10股派发现金股利3.50元(含税),截至2025年3月31日,公司总股本60,325,180股,回购专户股份数466,117股,以此计算合计拟分派现金红利20,950,672.05元(含税);根据《上市公司股份回购规则》等有关规定,上市公司以现金为对价,采用要约方式、集中竞价方式回购股份的,视同上市公司现金分红,纳入现金分红的相关比例计算。公司在2024年度以集中竞价交易方式累计回购906,014股,支付的资金总额为人民币49,987,510.15元(不含印花税、交易佣金等交易费用),视同现金分红。综上,公司2024年度现金分红总额为70,938,182.20元(含税),现金分红比例为625.77%;2024年度不进行资本公积转增股本,不送红股。 2024年度利润分配预案披露后至实施权益分派的股权登记日期间,若公司总股本发生变动,公司拟维持每股现金分红金额不变,相应调整现金分红总额。 上述利润分配方案尚需提交公司2024年年度股东大会审议通过。 八、是否存在公司治理特殊安排等重要事项 □适用√不适用 九、前瞻性陈述的风险声明 √适用□不适用 本报告中所涉及的未来计划、发展战略等前瞻性陈述,不构成本公司对投资者的承诺,敬请投资者注意投资风险。 十、是否存在被控股股东及其他关联方非经营性占用资金情况 否 十一、 是否存在违反规定决策程序对外提供担保的情况 否 十二、 是否存在半数以上董事无法保证公司所披露年度报告的真实性、准确性和完整性否 十三、 其他 □适用√不适用 目录 第一节 释义......................................................................................................................................5 第二节 公司简介和主要财务指标..................................................................................................9 第三节 管理层讨论与分析............................................................................................................14 第四节 公司治理............................................................................................................................70 第五节 环境、社会责任和其他公司治理....................................................................................94 第六节 重要事项..........................................................................................................................102 第七节 股份变动及股东情况......................................................................................................132 第八节 优先股相关情况..............................................................................................................141 第九节 债券相关情况..................................................................................................................142 第十节 财务报告..........................................................................................................................143
一、 释义 在本报告书中,除非文义另有所指,下列词语具有如下含义:
第二节 公司简介和主要财务指标 一、公司基本情况
(一)公司股票简况 √适用□不适用
□适用√不适用 五、其他相关资料
(一)主要会计数据 单位:元 币种:人民币
(1)报告期内,公司营业收入为2.37亿元,较去年同期增长39.45%,主要系受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互联网公司等为代表的国内外科技巨头纷纷加大多模态数据投入以支撑其智能终端、内容生成等领域的AI能力建设所致。在此背景下,以多语种、多音色等为代表的智能语音业务需求、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长,整体上驱动公司营业收入同比显著增加。 (2)报告期内,归属于上市公司股东的净利润、扣非净利润分别为1,133.61万元、497.35万元,较去年同期增加4,172.13万元、4,844.42万元,主要系营业收入大幅增长的同时,具有高毛利特点的数据集产品收入占比以及定制服务毛利率提升,驱动公司整体毛利率增加所致。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同驱动2024年度归属于母公司所有者的净利润、归属于母公司所有者的扣除非经常性损益的净利润由亏转盈,同比实现显著增长。 (3)报告期内,经营活动产生的现金流量净额为2,873.34万元,较去年同期增加5,977.96万元,主要系报告期内收入整体增长较为明显、客户回款同比增加所致。 (4)报告期内,基本每股收益、稀释每股收益均为0.19元/股,较去年同期增加0.69元/股,主要系归属于母公司所有者的净利润相比同期大幅增长所致。 (5)报告期内,扣除非经常性损益后的基本每股收益为0.08元/股,较去年同期增加0.80元/股,主要系归属于上市公司股东的扣除非经常性损益的净利润相比同期大幅增加所致。 七、境内外会计准则下会计数据差异 (一)同时按照国际会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况 □适用√不适用 (二)同时按照境外会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况 □适用√不适用 (三)境内外会计准则差异的说明: □适用√不适用 八、2024年分季度主要财务数据 单位:元 币种:人民币
□适用 √不适用 九、非经常性损益项目和金额 √适用□不适用 单位:元 币种:人民币
□适用√不适用 十、非企业会计准则财务指标情况 □适用√不适用 十一、采用公允价值计量的项目 √适用□不适用 单位:元 币种:人民币
√适用□不适用 公司部分信息涉及商业秘密,根据《上海证券交易所科创板股票上市规则》《上海证券交易所科创板上市公司自律监管指引第1号——规范运作》的相关规定,公司已按照《信息披露暂缓与豁免业务管理制度》完成相应的审批程序。 第三节 管理层讨论与分析 一、经营情况讨论与分析 2024年,受益于多模态大模型的快速发展以及“AI+”在应用端的进一步落地,全球训练数据需求快速增长。一方面,大模型语音交互需求持续攀升,公司凭借多年在语音数据方面的积累,获得以智能终端厂商、科技互联网公司等为代表的国内外科技巨头多类语音数据订单,带动大模型相关业务收入快速增加,并成为公司收入增长的核心引擎。另一方面,为更好拥抱新一轮全球化市场机遇,公司持续加大海外市场拓展力度,丰富品牌营销策略、推动销售提速,并通过建设海外交付能力完善海外供应链体系,启动海外全链条服务能力的延展,进一步带动境外业务收入显著复苏。此外,公司不断拓展智能驾驶服务能力边界,抢抓车企出海机遇,积极探索布局境外数据采集业务;同时继续保持有竞争力的研发投入,持续优化迭代智能驾驶数据处理相关算法研发和平台建设,以及智能化标注能力数据服务能力逐步延伸至4D数据标注、大点云分割等更复杂场景,以更好适应以BEV技术为主、稳步向OCC技术方向探索的高阶智能驾驶技术需求。受上述各项积极因素带动,公司整体营业收入实现同比增长。 此外,由于标准化数据集产品收入占比大幅提升,同时公司整体数据交付能力在管理能力优化、平台技术提升、供应链进一步整合和扩展等因素的共同推动下,使训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至66.46%。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同驱动公司全年净利润大幅增长,实现扭亏为盈。 报告期内,公司实现营业收入2.37亿元,较上年同期增长39.45%;归属于母公司所有者的净利润1,133.61万元,较上年同期增加4,172.13万元;归属于母公司所有者的扣除非经常性损益的净利润为497.35万元,较上年同期增加4,844.42万元;经营性现金流净额2,873.34万元,较上年同期增加5,977.96万元。截至报告期末,公司总资产为8.08亿元,归属于母公司的所有者权益为7.43亿元,分别较期初减少1.95%和4.99%。2024年公司具体经营情况如下:(一)核心业务板块经营情况 1. 训练数据全球化业务 2024年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。在此背景下,公司凭借多年在语言研究方面的技术积累、以及全球领先的标准化数据集产品储备,进一步赢得了境外客户信赖。 与此同时,《促进和规范数据跨境流动规定》等法规出台,为数据出境提供了更为高效简明的路径。得益于行业发展以及政策环境的改善,截至报告期末,公司境外业务收入较上年同期显著增长89.53%至1.14亿元。 此外,为更好把握行业机遇、进一步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、营销推广等多维度提升业务、客户触达及服务能力。报告期内,公司持续加强境外销售团队建设,进一步织密客户服务网络;同时,通过参与包括WebSummitQatar、ICASSP、AIEXPOTOKYO、AutosenseandInCabin、CVPR、ACL、Interspeech、SLT及NeurlPS等全球知名行业及AI学术顶会,以及布局搜索广告投放、社交媒体矩阵等多类宣传渠道等方式,向全球市场展示公司先进技术实力及创新产品,提升行业影响力和美誉度。2024年公司获得由AcquisitionInternationalMagazine颁发的"BestAI-PoweredDataSolutionsCompany"奖项和Datarade颁发的"TopAITrainingDataProvider"奖项。截至报告期末,公司境外客户数量已超过260家。 报告期内,公司通过在新加坡投资设立控股公司的方式拓展海外首个自主可控的数据交付基地,在订单、产能两端同步实现增量覆盖,不仅有助于培育新的营收增长点,更为下一步提升海外定制化业务能力奠定基础。 2. 大模型数据服务业务 伴随大模型技术的不断突破,人工智能行业被按下发展“快进键”,数据作为大模型的“燃料”,已成为模型公司打造差异化优势的战略性资源,高质量数据需求快速增加。报告期内,公司不断拓展自身大模型数据服务能力,从预训练、后训练、到指令微调、对齐、评测等全链条环节为客户提供立体支撑;同时,也逐渐从通用的基座模型的数据服务,拓展至艺术、工业、教育、医疗等多类垂直领域;服务的客户范围也已覆盖至主要大模型厂商和研究机构。报告期内,公司持续加大大模型数据方向的研发投入,增厚大模型领域的数据储备,新增开发了多类多语种、多音色、多情感、多场景的ASR和TTS语音数据集;以及服务视觉理解以及视觉生成的视觉数据集;同时,前瞻性建设了用于提升大模型推理能力的CoT数据集,通过详细的推理步骤注释,让大模型学习从问题到答案的逻辑推导过程,有效填补传统数据集缺乏推理结构的空白。与此同时,为更好理解大模型技术方向,报告期内,公司通过前瞻性研究,探索大模型数据的规模化生产方式,全面助力公司大模型业务的扩张。公司已和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新的E-Branchformer、CTC-Attention技术,自研东方40语种、以及中国22方言数据清洗技术,训练了0.1B-1.7B等4个不同规模的语音大模型,模型效果达到了业界同等尺寸的领先水平。公司的算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备,充分发挥各自所长,促进大模型技术在数据生产领域的更深层次的应用。 3. 智能驾驶行业数据服务业务 2024年,为更好抢抓智能驾驶行业机遇,同时应对更为复杂的数据处理需求,公司加大了对高级别数据标注工具的研发力度,截至报告期末,DOTS-AD平台新增3D动静分离标注工具,BEV多图层4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和大点云分段加载、点云区域分割等核心能力,有效支撑了自动驾驶BEV和OCC主流算法演进对数据标注工具的需求。此外,公司不断优化算法中台中枢能力,开发了2D&3D融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效30%以上;迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效20%以上;研发3D点云预刷式跟踪技术、4D点云重建技术,均取得了20%以上的提效成果。 此外,为进一步支撑我国车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。截至报告期末,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。同时,舱内支撑DMS和OMS研发需求的采集业务也已拓展至俄罗斯、奥地利等多个欧洲国家,为众多客户出海业务提供有力数据支持。 (二)核心技术能力建设情况 2024年,按照技术+产品双轮驱动的定位,公司继续保持有竞争力的研发投入强度,不断提升技术和平台工具先进性、在大模型数据处理技术方向进行积极探索储备、巩固标准化数据集产品储备、增厚语音语言学基础研究领先性,持续巩固公司核心竞争力。报告期内,公司研发费用共计6,343.91万元,占当期营业收入的26.76%。截至报告期末,公司研发人员数量79人。 1. 算法及平台能力建设、大模型数据处理技术持续探索储备 报告期内,公司持续加大基础研发投入,进一步提升人工智能基础算法、一体化数据处理平台、前沿技术研发等领域能力;在智能驾驶数据处理综合性平台上继续提升自动化能力,并落地更多面向智能驾驶数据预处理的相关算法;同时,在面向大模型预训练、后训练、微调、对齐及评测技术上持续保持技术探索、储备,推动相关领域的数据服务,并形成了一些代表性成果:1.1算法 智能语音领域,完成Whisper推理框架升级、显存占用降低59%、推理延迟降低59%,新增ASR模型11个、语音识别算法支持语种数增至130+个,大幅提升了算法在实际项目中的降本增效能力。在计算机视觉领域,引入Detzero-track、CenterPoint、Lane-Marking-Detection、FaceFusion、roop、Ultralytics、BoT-SORT等有代表性的计算机视觉框架或算法,上线3D点云目标检测多模型融合算法、4D大点云车道线检测算法、GDINO-零样本目标检测等算法,优化2D细分类视频跟踪算法、2D异形红绿灯跟踪算法、4D车道线长度动态自适应调整算法等多个智能驾驶场景下的模型,并新增超过27种不同场景的视觉类算法预处理技术。在大模型算法领域,针对公司自有知识产权的语音数据集,设计通用的数据清洗、模型训练、模型评测框架,已完成数据清洗pipeline搭建,并初步清洗出通用格式的语音数据数十万小时,同时完成语音大模型训练所需要的算力集群搭建、算法框架研发、模型训练pipeline搭建、并完成东方语种语音大模型的训练、微调、评测等。针对视觉大模型应用领域,构建起基于特征向量的去重技术、美学评分模型、图文生成模型等多个基础能力,并在项目中投入应用,取得了良好的降本效果。 1.2平台 公司在训练数据生产与管理的一体化平台建设方向精耕细作,展现了一系列创新成果,具体可归结为以下核心维度: (1)重点推进以数据为核心的一体化平台体系建设,通过集中研发DataX数据中台,优化整合原有数据存储、数据可视化和数据流转等功能,全面提升一体化数据处理平台的处理过程柔性管理能力,数据处理管道新增可视化编排工具,集成20+新型算子,实现了十余类核心预处理算法模型自动化对接、数据切片、数据加工处理管道的快速搭建与灵活编排,以及数据处理算子集成与统一管理,共计近60个功能点。 (2)实现贯穿数据采标、模型训练、模型效果展示全生命周期管理:重点优化多源多模态非结构化与结构化数据的标准化与一致性管理,以及点云与图像类算法模型对比与模型评测支撑能力。深度集成预处理算法库,算法评测体系扩展至15+量化指标,支持多模型对比测试与算法结果可视化展示,扩展模型版本效果量化对比展示及分析能力等超60个功能点,大幅提升公司对训练数据的一站式全生命周期管理能力,形成从数据管理到模型迭代的完整算法增强闭环。 (3)积极投入人工智能数据运营平台的全链路智能化体系革新,重点建设数据共建共享机制、全面升级多模态AI标注算法矩阵、有效优化分级流通合规保障体系等核心功能,创新研发自动化标注工具集群,搭建覆盖开源开放、成员共建、可信空间的三级数据生态,形成覆盖文本、语音、图像、视频的智能化处理矩阵。同时,逐步建设形成从资质认证、脱敏加密到合规审计的全流程安全管控体系,强化跨平台数据流动追溯与多角色协同能力,构筑起集数据汇聚、生产、治理、流通、应用于一体的智能化基础设施平台,推动数据要素市场基础设施向智能化、合规化、生态化方向加速演进。 通过上述投入,截至报告期末,公司共获得专利授权41项,获得登记的软件著作权180项。 同时,公司实质性地提升了自身的数据全生命周期管理与运营能力、算法能力、工程化数据研发及生产能力,形成了更为合理、高效的人机协同智能化解决方案,持续降低训练数据开发成本,以AI赋能训练数据开发,以训练数据驱动AI产业发展。 2. 标准化数据集产品 标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争力之一,标准化产品是公司基于未来行业需求的研判,在市场需求出现之前,预先开发的数据集,具有即用即取的特点,可帮助客户大幅缩短模型研发周期并有效降低数据投入成本。 同时,由于产品本身的知识产权由公司享有,具有一次性研发生产、可重复多次销售的特点,因此可更好帮助公司实现未来可持续性销售、以及毛利空间提升。 因此,为更好适应行业发展需求,公司2024年在产品研发方面持续投入,用于开发覆盖智能语音、计算机视觉以及自然语言等传统深度学习以及大模型领域的相关数据集产品。截止报告期末,公司新增研发超150个训练数据集产品,自有知识产权的训练数据产品储备超过1,700个,尤其在多语种及多音色语音数据集和发音词典、动作捕捉等多模态数据集、以及多语种OCR和手写体数据集等方面积累了更丰富的标准化产品资源,并建成包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”等在内的多领域大模型数据集。截止报告期末,公司标准化数据集产品储备情况如下:
3. 语音语言学能力 随着全球化扩张成为头部AI企业收入增长的重要引擎,多语种数据的作用和价值更加凸显。 为更好满足客户多语种拓展需求,公司持续保持语音语言学研究力度,在语音语言学基础研究方面,公司不断丰富合作语言学家团队资源,成员遍布世界各地的学校及研究机构,在语音语言学领域具备丰富经验和技术储备。截止报告期末,公司已经拥有超过205个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具备竞争优势。同时,公司建立了成熟的发音词典构建流程,公司已积累下近140个多语种的发音词典,覆盖波斯尼亚语、塞尔维亚语、巽他语、尼泊尔语、奥利亚语、基隆迪语、茨瓦纳语、达利语等小语种,累计词条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心技术之一。 (三)其他综合能力建设情况 1. 数据安全及合规 2024年,中央和地方出台了一系列有关数据要素、数字经济的法律法规和政策,同时,《促进和规范数据跨境流动规定》等法规出台,都对企业的数据安全水准和能力提出了更高要求,也为企业在数据要素、人工智能等领域的发展提供了新的机遇。 公司一直以来非常重视数据安全管理以及相关能力的提升,并将其作为把握新发展机遇所必须练好的“基本功”。2024年,公司在数据安全方面取得了多项工作成果。公司“AIGC训练数据业务的综合合规管理机制”案例荣获中国互联网协会首届“金灵光杯”中国互联网创新大赛企业合规赛道优秀奖。公司积极参与行业发展,提出立法建议、参与行业调研,数据安全能力获得广泛认可。 公司也一直坚持统筹安全与发展并重的原则,在守住安全合规底线的前提下积极拓展包括数据跨境流通在内的数据要素业务。 2. 供应链体系 2024年,在AI大模型技术快速迭代的驱动下,公司战略布局医疗、金融、法律、艺术等垂直领域,深度整合产学研资源,通过与各行业的专业机构及专家的合作成功构建了覆盖诊断、智能投顾、合规风控、数字版权等细分场景的供应链资源池,不仅提升了供应链体系的响应敏捷度与行业适配性,更通过知识图谱与区块链技术的融合应用,实现了跨领域资源的智能匹配与全流程可信溯源,显著增强了供应链生态的多样性与专业壁垒。 在战略供应商生态构建方面,公司深度践行“共生共赢”理念,与战略供应商建立了长期稳定的合作关系,加强了与供应商的风险共担机制,共同应对市场波动和不确定性。 公司也进一步优化了供应链网络,特别是在海外一手资源群体的扩展方面取得了重要进展。 通过建设大型数据基地及精细化管理资源池,供应链的多样性和稳定性得到了显著提升,为实现可持续性产能扩张和成本优化奠定了坚实基础。 在供应链管理体系建设方面,通过建立更细致的成本核算模型和流程监控节点,实现了对供应链各环节成本和效率的精准把控。同时,全面升级线上管理系统,实现了订单处理、资源配置和结算审批的一体化和实时化。 3. 人力资源 报告期内,公司完成销售、生产、研发体系的绩效管理机制优化,并对内部反馈机制及奖金核算机制进行迭代,以期增强绩效牵引力实现更加公平和富于激励性的管理效果。上半年公司组织多种类专项培训及人才发展项目,在大模型领域的探索与应用进行广泛深入的内部交流,组织销售、生产、职能等多体系的软技能培训,对应届高潜毕业生、新锐力量、中坚力量、中高层管理人员采取不同的梯队建设规划,以保障人才队伍的不断夯实。文化建设方面,强化高度敬业和持续创新文化,进行榜样之星等多样化的文化倡导和活动辐射,打造更加尊重信赖和追求卓越的组织基因。同时在人才引进方面,启动海外人才招募、研发专项人才和高潜毕业生吸引计划,引入多名欧美同业专家、优质研发人员、及卓越背景应届毕业生,充实销售、研发及项目交付队伍的人才密度,发展健康、可持续、多元化的人才队伍。 非企业会计准则业绩变动情况分析及展望 □适用√不适用 二、报告期内公司所从事的主要业务、经营模式、行业情况及研发情况说明 (一)主要业务、主要产品或服务情况 1. 主要业务情况 公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数 据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软 件形式向客户交付。 自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需 的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国 内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据 涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于 人机交互、智能家居、智能驾驶、智慧金融、智能安防等多种创新应用场景。 公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、 亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音 箱、语音导航、内容生成、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的 算法模型训练过程中。目前公司客户累计数量超过1,050家,覆盖了科技互联网、社交、IoT、智 能驾驶、大模型等领域的主流企业,以及政企、教育科研机构。图:公司产品服务矩阵示意 2. 主要产品及服务情况 2.1主要产品及服务按业务类型分类 公司研发、生产的训练数据覆盖了智能语音、计算机视觉及自然语言处理三大AI核心领域,广泛应用于算法模型的开发、训练、优化、应用场景拓展等环节。此外,公司还提供与训练数据相关的应用服务。 (1)智能语音 人工智能在语音领域的应用技术主要包括语音识别、语音合成等。 语音识别(AutomaticSpeechRecognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器自动将语音信号转换为对应的文本信息。 语音合成(TexttoSpeech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。 以日常生活中的情景为例,语音输入法、即时通讯软件运用了语音识别技术将用户输入的语音实时转换为文字,实现了软件“听懂”语音并“听写”出文字的效果;而地图、导航软件则运用语音合成技术,实现了软件“发声说话”的效果,为用户提供即时语音导航。 公司通过设计(设计训练数据集结构、供发音人朗读录制的语料文本或对话场景、发音人分布、录音设备场景等)、采集(定义合适的发音人、选取录音设备及软件、组织发音人朗读录制音频)、加工(对音频文件进行切分、标注各类声音特征,形成带时间戳和特征标签的文本和标注文件等)、质检(对数据集进行质量检测,如音字一致性、标注准确率检查等)等训练数据集生产环节;或者针对客户提供的原料音频文件执行加工、质检工作,最终形成客户所需的智能语音训练数据集。 (2)计算机视觉 计算机视觉(ComputerVision,CV)是使机器具备“看”的功能的技术,它使得智能驾驶、智能家居、手机、安防设备等机器能够代替人眼对目标进行识别、跟踪和测量等。 以日常生活中的情景为例,在汽车的自动驾驶功能中,计算机视觉技术使得汽车能够“看见”并识别行车过程中的各种行人、路况场景,为后续作出相应的反应奠定基础;在机场、车站安检中,计算机视觉技术使得人脸识别设备能够识别被检验人员是否为其出示的身份证件显示的人员。 公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按照要求拍摄照片、录制视频等)、加工(对图像、视频文件进行打点、拉框、分割标注等)、质检(对数据集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需的计算机视觉训练数据集。 (3)自然语言处理 自然语言处理(NaturalLanguageProcessing,NLP)是使机器能够像人一样理解语言意图的技术。 以日常生活中的情景为例,寄送快递时使用的“智能填写”功能即运用了自然语言处理技术,在输入框中填入整段联系信息,软件应用能够理解语义,并从中识别及提取“收件人”、“联系方式”、“地址信息”等所需信息,完成自动填写;智能客服、聊天机器人等人机交互程序也运用了自然语言处理技术,使得程序、机器能够读懂人类语言的真正意图,并相应做出反应、提供服务等。 公司通过设计训练数据集结构、采集(收集或编写自然语言文本、对话等数据信息)、加工(对自然语言文本数据进行单词分割、词性标注、语义语法标注、情感属性标注等)、质检(对数据集进行质量检测,如检验文本、词性或者语义的标注结果是否准确等);或者对客户提供的自然语言文本执行加工、质检工作,最终形成客户所需的自然语言训练数据集。 (4)训练数据相关的应用服务 公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。 公司基于自身生产的训练数据提供算法相关的模型训练服务、模型评测服务及模型应用服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。 前述产品、服务均以公司生产的专业训练数据集为核心或基础。公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。 成品训练数据集主要由数据文档、说明文档、技术文档三部分构成。以智能语音训练数据集为例,成品训练数据集包含原始采集形成的音频文件、与音频文件对应的带有时间戳的标注文件,训练数据集相关的设计文档、训练数据集说明,发音词典,数据集参数信息文件等,图示如下:图:训练数据集结构(智能语音)示例 2.2主要产品或服务的终端应用场景 公司提供的高质量、大规模、结构化的训练数据,为算法模型的训练拓展提供了可靠的训练 素材,助力AI技术实现实践应用及商业化落地,赋能AI技术与实体经济深度融合。公司提供的 训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、内 容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、 智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息 提取、情感分析、OCR识别等多种应用场景。图:训练数据集服务的算法模型应用场景示意 (二)主要经营模式 1. 盈利模式 与主要产品及服务类型对应,公司的盈利模式主要包括以下三类: (1)定制服务:公司根据客户需求提供定制训练数据集并收取服务费。在此种模式下,公司 享有服务费收入,不享有最终生成的训练数据的知识产权,不可将此类业务生产的训练数据向其 他客户重复销售。 (2)标准化产品:公司开发自有知识产权的训练数据集产品,通过销售训练数据集产品的使 用授权许可,获取让渡资产使用权收入。此类训练数据集一经开发完成,可多次销售并获取授权 许可收入。 (3)训练数据相关的应用服务:公司基于积累的训练数据和多年行业经验提供数据处理工具 集及平台服务、算法相关的模型训练、模型评测及模型应用服务,通常以软件授权或软硬件一体 化形式交付平台产品、算法模型拓展、开发成果等,获取让渡资产使用权收入和技术服务等收入。 2. 生产或服务模式 (1)训练数据集生产模式 公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成 可供算法模型训练使用的专业数据集。图:训练数据生产过程示意图 公司的训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、加工(数据标注)及质检(各环节数据质量、加工质量检测)。 (2)训练数据相关的应用服务模式 公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。 公司基于其生产的训练数据提供算法模型相关的训练、评测及应用服务,助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景(例如特定行业、特定口音等)的专属算法模型,提高AI技术应用效果。 以某大型科技公司客户项目为例,客户研发了特定语音识别算法模型,需要根据算法模型的实际场景(如法院庭审场景)开发落地应用。公司承担了部分落地应用拓展相关的开发工作,围绕客户的算法模型和接口开发,最终协助客户算法模型实现多个麦克风收集庭审语音内容并实时转成文字记录入系统的功能。 3. 采购模式 按照采购的内容及主体划分,公司的采购包括: 数据服务采购:公司在数据采集、加工环节中,向人力资源服务等类型的公司等供应商采购的,非核心技术环节的原料数据采集、标注服务。 岗位服务采购:主要针对临时性的、不设长期岗位的业务领域的外包采购,如保洁、临时招聘服务、少量实习生招聘等。 其他采购:(1)训练数据生产所需的资产,主要包括软、硬件设备及其他需求物品采购;(2)日常运营所需的资产及物品,如办公用房、车辆、办公家具、计算机设备等;(3)日常专项服务采购等,主要包括审计服务、会议服务、差旅服务等。 上述原料数据采集、加工环节所涉及的数据服务采购,为公司最主要的采购类别,由集采中心负责;各部门岗位服务采购由人力资源部负责;其余日常运营相关的资产物品采购、专项服务采购等非业务采购由集采中心负责。财务中心负责参与采购供应商的遴选、监督与管理,并对采购费用进行核算及结算。 经过多年的发展,公司已经建设有完善的《海天瑞声采购管理制度》、《海天瑞声项目资源采购管理制度》、《海天瑞声供应商管理制度》、《海天瑞声岗位服务采购管理制度》等内部规范制度,设立有完善的采购流程和体系,并与主要的供应商形成了良好稳定的长期合作关系。 4. 营销模式 公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高质量的训练数据集及相关服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过直接拜访潜在客户、参与学术会议和行业展会新产品发布、搭建并持续升级公司官方网站和建立自媒体矩阵等方式提升品牌知名度、开拓新客户,后续再通过商务谈判、招投标等形式获取具体业务机会。 (三)所处行业情况 1、行业的发展阶段、基本特点、主要技术门槛 1.1行业的发展阶段、基本特点 (1)政策、技术、应用协同共振,全球AI产业迈入高速发展新阶段 当前,全球人工智能产业正迎来历史性发展拐点,政策、技术与应用的三重共振推动行业进入高速增长通道。中、美、欧三大经济体持续加码AI布局:中国通过《新一代人工智能发展规划》和《"十四五"数字经济发展规划》等构建了涵盖技术研发、资源建设和标准制定的全链条政策体系;美国则依托《人工智能行政令》和星际之门计划(Stargate)等,持续巩固其在人工智能基础设施领域的领先优势;欧盟以《人工智能大陆行动计划》为纲领,配套《数字欧洲计划(2025-2027年工作方案》专项资金,重点培育AI与高性能计算融合创新。技术层面,人工智能也正在经历革命性突破,DeepSeekR1等开源模型通过性能提升与成本优化的双重突破,显著降低了技术应用 门槛;多模态大模型(如Sora、GPT-4o)也在不断拓展AI能力边界,实现全模态互动能力。这 种技术平权运动正在加速AI向千行百业渗透,大模型已逐步开始向金融、医疗、制造等核心领域 进行新一轮的赋能,智能风控、AI辅助诊断、智能制造等应用场景不断丰富,推动各行业效率提 升和模式创新。全球AI产业也将在上述政策引导、技术迭代与商业落地的正向循环下,迎来前所 未有的发展机遇,加速向规模化、价值化阶段迈进。 根据国际数据公司(IDC)的数据,2024年全球人工智能(AI)IT总投资规模为3,158亿美元, 预计在2028年增至8,159亿美元,年复合增长率(CAGR)为32.9%。数据来源:国际数据公司(IDC)(未完) ![]() |