[中报]拓尔思(300229):2023年半年度报告

时间:2023年08月25日 22:02:32 中财网

原标题:拓尔思:2023年半年度报告

拓尔思信息技术股份有限公司
2023年半年度报告
2023-083




2023年08月

第一节 重要提示、目录和释义
公司董事会、监事会及董事、监事、高级管理人员保证半年度报告内容的真实、准确、完整,不存在虚假记载、误导性陈述或者重大遗漏,并承担个别和连带的法律责任。

公司负责人李渝勤、主管会计工作负责人崔哲敏及会计机构负责人(会计主管人员)林义声明:保证本半年度报告中财务报告的真实、准确、完整。

所有董事均已出席了审议本次半年报的董事会会议。

本半年度报告中涉及未来计划或规划等前瞻性陈述的,均不构成公司对投资者的实质承诺,投资者及相关人士均应对此保持足够的风险认识,并且应当理解计划、预测与承诺之间的差异,敬请投资者注意投资风险。

公司在本报告第三节“管理层讨论与分析”中“十、公司面临的风险和应对措施”部分,详细描述了公司经营中可能存在的风险及应对措施,敬请投资者关注相关内容。

公司计划不派发现金红利,不送红股,不以公积金转增股本。


目录
第一节 重要提示、目录和释义 ......................................................... 2 第二节 公司简介和主要财务指标 ....................................................... 7 第三节 管理层讨论与分析 ............................................................. 10 第四节 公司治理 ...................................................................... 41 第五节 环境和社会责任 ................................................................ 42 第六节 重要事项 ...................................................................... 43 第七节 股份变动及股东情况 ........................................................... 61 第八节 优先股相关情况 ................................................................ 67 第九节 债券相关情况 .................................................................. 68 第十节 财务报告 ...................................................................... 71
备查文件目录
(一)载有公司负责人、主管会计工作负责人、会计机构负责人(会计主管人员)签名并盖章的财务报表。

(二)报告期内公开披露过的所有公司文件的正本及公告的原稿。

(三)其他有关资料。


释义

释义项释义内容
中国证监会中国证券监督管理委员会
深交所深圳证券交易所
中国结算深圳分公司中国证券登记结算有限责任公司深圳分公司
党中央、中共中央中国共产党中央委员会
国务院中华人民共和国国务院
中央网信办中共中央网络安全和信息化委员会办公室
人民银行中国人民银行
工业和信息化部中华人民共和国工业和信息化部
科技部中华人民共和国科学技术部
公安部中华人民共和国公安部
财政部中华人民共和国财政部
海关总署中华人民共和国海关总署
税务总局国家税务总局
国家发改委、国家发展改 革委中华人民共和国国家发展和改革委员会
国家互联网信息办公室中华人民共和国国家互联网信息办公室
专利局国家知识产权局专利局
中国信通院中国信息通信研究院
公司、拓尔思拓尔思信息技术股份有限公司(曾用名:北京拓尔思信息技术股份有限公司)
TRS公司的注册商标、英文简称和软件产品的统一品牌
控股股东、信科互动信科互动科技发展有限公司(曾用名:北京信科互动科技发展有限公司)
实际控制人李渝勤女士
AI人工智能(Artificial Intelligence)的英文缩写
NLP自然语言处理(Natural Language Processing)的英文缩写
OCR光学字符识别(Optical Character Recognition)的英文缩写
AIGC利用人工智能技术来生成内容(AI Generated Content)的英文缩写
ChatGPT美国人工智能研究实验室OpenAI推出的一种人工智能技术驱动的自然语言处理工 具(Chat Generative Pre-trained Transformer)的英文缩写
GPT-3.5、GPT-4是OpenAI为聊天机器人ChatGPT发布的语言模型
SaaS“数据即服务”(Data as a Service)的英文缩写,是以数据为对象,以数据加 工、数据建模、数据挖掘、机器学习等技术为工具,为客户提供各类精准的信息, 实现数据驱动客户业务发展
MaaS“模型即服务”(Model as a Service)的英文缩写,是一种云计算模式,提供了 一种将机器学习模型作为服务的方式,允许用户在不需要拥有自己的硬件设备或专 业技能的情况下,使用高质量的机器学习算法和模型
数字经济以数据资源作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的 有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动
信创即信息技术应用创新产业,它是数据安全、网络安全的基础,也是新基建的重要组 成部分
大模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是 指具有数百万到数十亿参数的神经网络模型
天行网安拓尔思天行网安信息技术有限责任公司(曾用名:北京天行网安信息技术有限责任 公司),公司全资子公司
广拓公司、科韵大数据广州拓尔思大数据有限公司(曾用名:广州科韵大数据技术有限公司,广州科韵大
释义项释义内容
  数据技术股份有限公司、广州科韵信息股份有限公司等),为公司持股86.43%的控 股子公司
金信网银北京金信网银金融信息服务有限公司,公司持股80%的控股子公司
成都子公司成都拓尔思信息技术有限公司,公司全资子公司
可转债、可转换公司债 券、拓尔转债向不特定对象发行可转换公司债券
江南等4名自然人江南、宋钢、李春保、王亚强,科韵大数据原自然人股东
本报告期、报告期2023年1月1日-2023年6月30日
元、万元人民币元、人民币万元

第二节 公司简介和主要财务指标
一、公司简介

股票简称拓尔思股票代码300229
股票上市证券交易所深圳证券交易所  
公司的中文名称拓尔思信息技术股份有限公司  
公司的中文简称(如有)拓尔思  
公司的外文名称(如有)TRS Information Technology Co., Ltd.  
公司的外文名称缩写(如有)TRS  
公司的法定代表人李渝勤  
二、联系人和联系方式

 董事会秘书证券事务代表
姓名李党生薛可然
联系地址北京市海淀区建枫路(南延)6号院 金隅西三旗科技园3号楼7层北京市海淀区建枫路(南延)6号院 金隅西三旗科技园3号楼7层
电话010-64848899010-64848899-6618
传真010-64879084010-64879084
电子信箱[email protected][email protected]
三、其他情况
1、公司联系方式
公司注册地址、公司办公地址及其邮政编码、公司网址、电子信箱等在报告期是否变化 □适用 ?不适用
公司注册地址、公司办公地址及其邮政编码、公司网址、电子信箱等在报告期无变化,具体可参见2022年年报。

2、信息披露及备置地点
信息披露及备置地点在报告期是否变化
□适用 ?不适用
公司披露半年度报告的证券交易所网站和媒体名称及网址,公司半年度报告备置地在报告期无变化,具体可参见2022年
年报。

3、注册变更情况
注册情况在报告期是否变更情况
□适用 ?不适用
公司注册情况在报告期无变化,具体可参见2022年年报。

四、主要会计数据和财务指标
公司是否需追溯调整或重述以前年度会计数据
□是 ?否

 本报告期上年同期本报告期比上年同期增减
营业收入(元)444,429,563.49424,948,556.344.58%
归属于上市公司股东的净利润(元)69,644,080.8474,630,877.99-6.68%
归属于上市公司股东的扣除非经常性 损益的净利润(元)50,293,577.9146,344,040.698.52%
经营活动产生的现金流量净额(元)-36,453,678.92-39,602,783.357.95%
基本每股收益(元/股)0.09070.1044-13.12%
稀释每股收益(元/股)0.09070.1044-13.12%
加权平均净资产收益率2.21%2.88%-0.67%
 本报告期末上年度末本报告期末比上年度末增减
总资产(元)3,790,834,392.043,883,748,027.43-2.39%
归属于上市公司股东的净资产(元)3,384,852,481.892,687,074,613.4325.97%
五、境内外会计准则下会计数据差异
1、同时按照国际会计准则与按照中国会计准则披露的财务报告中净利润和净资产差异情况 □适用 ?不适用
公司报告期不存在按照国际会计准则与按照中国会计准则披露的财务报告中净利润和净资产差异情况。

2、同时按照境外会计准则与按照中国会计准则披露的财务报告中净利润和净资产差异情况 □适用 ?不适用
公司报告期不存在按照境外会计准则与按照中国会计准则披露的财务报告中净利润和净资产差异情况。

六、非经常性损益项目及金额
?适用 □不适用
单位:元

项目金额说明
非流动资产处置损益(包括已计提资产减值准备的冲销部分)95,800.76 
计入当期损益的政府补助(与公司正常经营业务密切相关,符合国家 政策规定、按照一定标准定额或定量持续享受的政府补助除外)6,782,014.86 
委托他人投资或管理资产的损益2,492,213.47 
除同公司正常经营业务相关的有效套期保值业务外,持有交易性金融 资产、交易性金融负债产生的公允价值变动损益,以及处置交易性金 融资产、交易性金融负债和可供出售金融资产取得的投资收益11,873,005.08 
除上述各项之外的其他营业外收入和支出40,402.64 
其他符合非经常性损益定义的损益项目297,190.47 
减:所得税影响额2,141,923.53 
少数股东权益影响额(税后)88,200.82 
合计19,350,502.93 
□适用 ?不适用
公司不存在其他符合非经常性损益定义的损益项目的具体情况。

将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益
项目的情况说明
□适用 ?不适用
公司不存在将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为
经常性损益的项目的情形。


第三节 管理层讨论与分析
一、报告期内公司从事的主要业务
(一)公司所处行业发展情况
1、不断做强做优做大数字经济,构筑国家竞争新优势
近年来,国内数字经济规模维持着较高的增长速度,数字经济增速也远高于 GDP整体的增长速度,数字经济正在成
为稳定经济增长的重要力量。顶层设计、经济转型、国家安全是数字经济的三大驱动力。从政策层面看,数字经济政策
定调级别高,已上升为国家战略。从经济层面看,长期而言以数字经济为代表的新兴产业是转型期的经济发动机。二十
大报告提出,“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”。

2022年 1月,国务院发布《“十四五”数字经济发展规划》,从数字基础设施、大数据、产业数字化转型、数字产
业化等多方面规划了数字经济发展前景。

2022年 7月,国务院发布公告,同意国家发改委牵头联合中央网信办等 20个部委建立数字经济发展部际联席会议制度,强化了数字经济发展的顶层设计。

2022年 10月,国务院在第十三届全国人民代表大会常务委员会第三十七次会议上就数字经济发展情况进行报告,并且重点提及了核心技术攻关、数字基础设施建设、数字产业创新发展、产业数字化转型等工作安排。同时,在二十大
报告中再次提及建设数字中国,密集政策推动下数字经济有望迎来快速发展。

2023年政府工作报告中提到数字经济不断壮大,新产业、新业态、新模式增加值占国内生产总值的比重达到 17%以
上。推动产业向中高端迈进,促进数字经济和实体经济深度融合。加快建设现代化产业体系,大力发展数字经济,提升
常态化监管水平,支持平台经济发展。从地方来看,各地政府工作报告对数字化转型的目标和路径着墨较多。例如上海
市提出“着力推动城市数字化转型,加快建设具有世界影响力的国际数字之都”;北京市提出“加快建设全球数字经济
标杆城市,加快智慧城市建设”;浙江省致力于做强做优做大数字经济,大力实施数字经济“一号发展工程”等。

2023年 6月,财政部、工业和信息化部联合发布《关于开展中小企业数字化转型城市试点工作的通知》,拟分三批
组织开展中小企业数字化转型城市试点工作。支持试点城市选择重点行业和相关中小企业,梳理行业共性和企业个性需
求,采取市场化手段公开遴选数字化服务商,支持数字化服务商为被改造企业提供诊断、咨询等服务,开发集成“小快
轻准”的数字化服务和产品,供企业自愿选择,开展数字化改造。同时,总结集成通用性强、效果好的数字化解决方案,
推动跨区域复制推广,放大政策效果。


2、大力加强培育数据要素市场,助推数字经济高质量发展
当前,数据已成为重要的生产要素,大数据产业作为以数据生成、采集、存储、加工、分析、服务为主的战略性新
兴产业,是激活数据要素潜能的关键支撑,是加快经济社会发展质量变革、效率变革、动力变革的重要引擎。党中央、
国务院高度重视大数据产业发展,频繁出台数据要素相关政策文件,推动数据要素市场深化改革,推动实施国家大数据
战略。

2022年 3月,《中共中央国务院关于加快建设全国统一大市场的意见》提出加快培育数据要素市场,建立健全数据
安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推
动数据资源开发利用。

2022年7月,《数据出境安全评估办法》国家互联网信息办公室令第11号文件出台,提出了数据出境安全评估的具体要求,规定数据处理者在申报数据出境安全评估前应当开展数据出境风险自评估,并明确了重点评估事项。此外,还
明确了数据出境安全评估程序、监督管理制度、法律责任以及合规整改要求等。

2022年 12月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》从数据要素、流通交易、收
益分配、安全治理四方面初步搭建我国数据基础制度体系,提出20条政策举措,包括提出构建数据基础制度体系,促进
数据合规高效流通使用,建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易
月9日,财政部发布《企业数据资源相关会计处理暂行规定(征求意见稿)》,拟规范企业数据资源相关会计处理,强化相
关会计信息披露,发挥数据要素价值,服务数字经济发展和数字中国建设。

国家的顶层设计逐步对数据要素各环节提出更细致的目标和要求,为推动数据在更大范围内有序流动和合理集聚、
进一步促进数据价值转化应用指明了方向。企业数据资源相关会计处理规定的出台,将极大地激活数据要素的活力,数
据要素产业市场有望迎来井喷式发展,以数据为核心驱动的数字经济将迎来大爆发。根据国家工业信息安全发展研究中
心测算,“十四五”期间我国数据要素市场规模预计 2025年将突破 1749亿元,复合增速将达到 26.3%,整体上进入高
速发展阶段。

2023年 7月,人民银行发布的《中国人民银行业务领域数据安全管理办法(征求意见稿)》提出,鼓励数据处理者
在保障安全合规前提下,积极促进数据高效流通和创新应用。

2023年上半年,多个省市已相继发布“数据要素”政策规划。北京市印发的《关于更好发挥数据要素作用进一步加
快发展数字经济的实施意见》提出,形成一批先行先试的数据制度、政策和标准。推动建立供需高效匹配的多层次数据
交易市场,充分挖掘数据资产价值,打造数据要素配置枢纽高地。促进数字经济全产业链开放发展和国际交流合作,形
成一批数据赋能的创新应用场景,培育一批数据要素型领军企业。力争到 2030年,北京市数据要素市场规模达到 2000
亿元,基本完成国家数据基础制度先行先试工作,形成数据服务产业集聚区。上海市印发的《立足数字经济新赛道推动
数据要素产业创新发展行动方案(2023-2025年)》明确,到 2025年,上海数据要素市场体系基本建成,国家级数据交
易所地位基本确立;数据要素产业动能全面释放,数据产业规模达 5000亿元,年均复合增长率达 15%,引育 1000家数
商企业;建成数链融合应用超级节点,形成1000个高质量数据集,打造1000个品牌数据产品,选树20个国家级大数据
产业示范标杆;数据要素发展生态整体跃升,网络和数据安全体系不断健全,国际交流合作全面深化。


3、不断深化升级数字政府建设,驱动数字中国新发展
加强数字政府建设是适应新一轮科技革命和产业变革趋势、引领驱动数字经济发展和数字社会建设、营造良好数字
生态、加快数字化发展的必然要求,是建设网络强国、数字中国的基础性和先导性工程,是创新政府治理理念和方式、
形成数字治理新格局、推进国家治理体系和治理能力现代化的重要举措,对加快转变政府职能,建设法治政府、廉洁政
府和服务型政府意义重大。

2022年2月,《国务院关于加快推进政务服务标准化规范化便利化的指导意见》国发〔2022〕5号文件从四个方面部
署了重点工作任务:一要推进政务服务标准化。二要推进政务服务规范化。三要推进政务服务便利化。四要全面提升全
国一体化政务服务平台服务能力。

2022年4月,《国务院办公厅关于印发 2022年政务公开工作要点的通知》国办发〔2022〕8号文件主要提出了五方面重点工作要求,持续深化政务公开,更好发挥以公开促落实、强监管功能。

2022年6月,国务院印发《关于加强数字政府建设的指导意见》国发〔2022〕14号文件,明确了数字政府建设的七方面重点任务:构建协同高效的政府数字化履职能力体系;构建数字政府全方位安全保障体系;构建科学规范的数字政
府建设制度规则体系;构建开放共享的数据资源体系;构建智能集约的平台支撑体系;以数字政府建设全面引领驱动数
字化发展;加强党对数字政府建设工作的领导。

2022年9月,《国务院办公厅关于印发全国一体化政务大数据体系建设指南的通知》国办函〔2022〕102号文件明确
了全国一体化政务大数据体系建设的目标任务、总体框架、主要内容和保障措施,重点从统筹管理一体化、数据目录一
体化、数据资源一体化、共享交换一体化、数据服务一体化、算力设施一体化、标准规范一体化、安全保障一体化等八
个方面,组织构建全国一体化政务大数据体系,推进政务数据依法有序流动、高效共享,有效利用、高质赋能,为营造
良好数字生态,提高政府管理服务效能,推进国家治理体系和治理能力现代化提供有力支撑。上述系列政策文件的出台
是推进国家治理能力和治理体系现代化的重要举措,为下一阶段数字政府建设指明了方向。

据 IDC(国际数据公司)预测,在“十四五”规划和数字政府政策的引导下,数字政府市场迎来重要发展窗口期,
整体市场到 2025年将保持相对高速的增长,预计到 2026年将达到 2173亿元人民币的市场规模,复合增长率(CAGR)为
12%,是有效推动数字中国建设的重要组成部分。


4、举国体制下的机构改革深化,对信创发展意义重大
信创旨在实现信息技术领域的自主可控,保障国家信息安全。其核心在于通过行业应用拉动构建国产化信息技术软
硬件底层架构体系和全周期生态体系,解决核心技术关键环节“卡脖子”问题。信创产业是数字经济、信息安全发展的
基础,也是“新基建”的重要内容,将成为拉动中国经济增长的重要抓手之一。在地方政府中,以安徽省、辽宁省、福
建省等为代表的地方政府发布的政策文件中,加速企业信创产品国产化替代,赋能企业数字化转型,以信创产业为主攻
方向,加快企业新一代信息技术应用创新也多有提及。

中央全面深化改革委员会第二十七次会议审议通过《关于健全社会主义市场经济条件下关键核心技术攻关新型举国
体制的意见》。中共中央政治局2023年1月31日第二次集体学习会议强调,要加快科技自立自强步伐,解决外国“卡脖
子”问题,健全新型举国体制,强化国家战略科技力量。2023年 3月 8日,《学习时报》刊发中国电子党组书记、董事
长曾毅的署名文章《以新型举国体制打造网信事业核心战略科技力量》。2023年 3月,中共中央、国务院印发了《党和
国家机构改革方案》,提出组建中央科技委员会,加强党中央对科技工作的集中统一领导,统筹推进国家创新体系建设和
科技体制改革,研究审议国家科技发展重大战略、重大规划、重大政策,统筹解决科技领域战略性、方向性、全局性重
大问题,研究确定国家战略科技任务和重大科研项目,统筹布局国家实验室等战略科技力量,统筹协调军民科技融合发
展等。作为党中央决策议事协调机构,中央科技委员会一要加强科技工作统一领导,体现高层对科技产业的高度重视。

机构的改革表明这次党和国家机构改革,加强党中央对科技工作的集中统一领导,组建中央科技委员会,中央科技委员
会办事机构职责由重组后的科学技术部整体承担;二是中央科技委员会的组建对高水平科技自立自强具有重大战略意义。

新型举国体制、科技创新全链条管理、科技成果转化、促进科技和经济社会发展相结合等职能将进一步加强,对加强基
础科学研究、集中力量在一些“卡脖子”工程上取得成绩等方面具有重要的战略性意义。

市场普遍认为,未来五年是“大信创”发展的关键时期,发展空间广阔。据《2022中国信创生态市场研究及选型评
估报告》显示,2022年信创产业规模达9920亿元,近五年复合增长率为35.7%,预计2025年将突破2万亿元。


5、通用大模型开启AI新时代,加速人工智能产业发展
人工智能是引领新一轮科技革命和产业变革的战略性技术。2022年 12月,全球顶级人工智能研究机构之一的OpenAI公司推出了基于GPT-3.5的新型AI聊天机器人ChatGPT,在发布两个月后拥有1亿用户,成为史上用户增长最快
的应用。2023年3月,OpenAI正式推出多模态大模型GPT-4,该模型可对图文多模态输入生成应答文字,以及对视觉元
素的分类、分析和隐含语义提取,并表现出优秀的应答能力。GPT-4被业界认为是具有里程碑意义的一代,因为多模态
的GPT-4会从视觉角度和视觉-文字语义融合方面涌现出更多的能力。继GPT-4之后,谷歌、微软、百度、阿里、腾讯、
华为等海内外科技公司纷纷加速了通用大模型的研发,并将陆续推出各自的大模型。未来,各科技厂商或将更加聚焦于
大模型的产品定位和商业化落地,越来越多的知识计算能力会融入到行业大模型中,行业AI应用的渗透率将全面提速。

近年来,我国陆续出台多项政策,鼓励人工智能行业发展与创新。《新一代人工智能发展规划》《关于支持建设新一
代人工智能示范应用场景的通知》《新型数据中心发展三年行动计划(2021—2023年)》等产业政策,为人工智能产业发
展提供了保障。我国还依托领军企业建设了10余家国家新一代人工智能开放创新平台,依托地方建设国家新一代人工智
能创新发展试验区和国家人工智能创新应用先导区等。党的二十大报告指出,推动战略性新兴产业融合集群发展,构建
人工智能等一批新的增长引擎,加快发展数字经济,促进数字经济和实体经济深度融合。上海深入贯彻落实国家发展人
工智能的战略,将人工智能作为重点发展的三大先导产业之一,已成为全国发展人工智能产业的排头兵和先行者。

2023年 2月,上海市人民政府副市长李政在 2023全球人工智能开发者先锋大会上表示,上海将全力夯实产业基础,
加快多模态通用大模型研发攻关,积极培育智能内容生成、科学智能等新赛道。北京市经济和信息化局在北京人工智能
产业创新发展大会上,正式发布《2022年北京人工智能产业发展白皮书》。白皮书中提出,全面夯实人工智能产业发展
底座,支持头部企业打造对标 ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。北京将持续推动建设具
有全球影响力的人工智能创新策源地。在中央政治局集体学习强调要加强基础研究的会上,科技部部长王志刚称,AI这
个领域是大方向、大领域,并且它的影响绝不仅仅在科技领域本身,可能还涉及在其他领域的赋能应用。这方面科技部
已经作了很多部署:包括 AI本身技术发展的一些课题,已经部署了很多年;中国首先提出 AI治理方面的“八项原则”;
在AI转化应用方面最近推出智能码头等若干个示范应用场景,推动AI转化应用。

大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、
迁移性方面都表现出显著优势和巨大潜力。大模型的发展是大势所趋,大模型未来将会助推数字经济,为智能化升级带
来新范式。随着GPT-4大模型的最新发布,多模态技术让AIGC可应用的广度不断扩展,可跨文字、图像、音频、视频等
多种类型数据进行关联,提高内容生产能力。据Gartner预测,至2023年将有20%的内容被生成式AI所创建,至2025
年,生成式AI产生的数据将占所有数据的10%(目前不到1%)。另据全球著名风险投资公司红杉资本预测,生成式AI将
产生数万亿美元经济价值,到2025年,国内生成式AI应用规模有望突破2000亿元。

2023年 8月,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《办
法》)于8月15日正式施行,这也是我国首个针对生成式人工智能产业的规范性政策。《办法》提出国家坚持发展和安全
并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包
容审慎和分类分级监管。在促进发展具体措施上,《办法》明确鼓励生成式人工智能技术在各行业、各领域的创新应用,
生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系;鼓励生成式人工智能算法、框架、芯片
及配套软件平台等基础技术的自主创新,参与生成式人工智能相关国际规则制定。《办法》明确生成式人工智能服务提供
者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得
侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;采取有
效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性。此外,明确了数据标注的相关要求。


(二)报告期内公司从事的主要业务
公司作为人工智能、大数据和数据安全产品及服务提供商,为各行业用户的数智化赋能。公司业务根据行业应用的
不同,可划分为数字政府、融媒体、金融科技、数字企业、公共安全五个版块;根据技术领域的不同,可划分为人工智
能、大数据、数据安全、信创四个领域;根据服务模式的不同,又可划分为软件产品、大数据服务、订阅制SaaS服务、
软硬一体化产品四种模式。


1、行业应用
(1)数字政府
数字政府是公司的成熟业务版块,主要面向各级政府和职能部门提供政府网站集约化、智慧监管、政务舆情、产业
招商、数字机关等领域政务应用的解决方案、软件产品及数据服务。政府网站集约化主要包括政府网站群、政务公开平
台、政策文件库、政务新媒体矩阵、政民互动、用户智能推送服务、政务虚拟人等。智慧监管主要聚焦金融监管,具体
包括非法集资监管和非法金融活动监管。政务舆情主要帮助政府单位及时了解公众对政府的重大政策、重要决策部署、
政务工作的评价、社会公共事件的意见、情绪与观点等,进行网络政务舆情监测,帮助用户有效监测舆情态势。产业招
商主要帮助政府招商部门、产业研究部门等围绕产业发展全生命周期,基于产业经济发展科学规划,实现产业招商、产
业治理、政策惠企与精准施策、区域强链补链、产业经济运行监测的全流程数字化、智能化、精准化,帮助建立“一企
一档、一人一档、园区档案、政策档案、产品档案、机构档案”,为地方产业发展提供一站式精准服务。数字机关主要
包括政务运行知识底座、政策智能研读、机关事务知识问答、政务知识搜索等,为提高共性办公应用、机关运行效能、
政府决策科学化水平进行数智赋能。

目前,公司的数字政府业务主要以“软件产品+大数据服务+订阅制SaaS服务”的融合模式为客户提供服务。政府用
户已经覆盖80%的中央和国务院机构,60%的省级政府,50%的地市政府。

报告期内,公司在数字政府方面,省级政府网站群、政务公开平台等业务进入运维期,地市级政府网站集约化业务
与政务新媒体业务稳步增长,政务大模型的应用探索需求旺盛。公司将持续拓展生态合作,定位专精特新,基于云和数
据服务以及政务行业大模型开辟新赛道,增加新商机。在智慧监管方面,公司的防非处非SaaS云产品链条更加完整,经
济金融风险监测方面加大了业务创新探索,如基于大众媒体情绪和公开财务债务测算地方城投债务真实风险。在智慧水
利方面,公司控股子公司广拓公司推出了融合知识图谱与行业大模型的水利知识服务平台解决方案,得到多地水利部门
的高度认可。


(2)融媒体
融媒体是公司的成熟业务版块,主要面向各级新闻媒体单位围绕新闻生产策、采、编、发、评、运、屏全流程提供
融媒体内容生产、用户行为资产、媒体大数据等综合服务。融媒体内容生产服务平台是以内容资产为核心的新一代数据
型媒体业务平台,涵盖了报、网、端、微、视和自媒体平台的全流程内容生产发布管理。该平台由数据资源聚合、融合
生产创作、选题策划分析、传播效果分析、协调指挥调度、用户资产运营、大屏综合管理等多个平台组成。用户行为资
产管理平台是从各个媒体传播渠道搜集的读者用户的静态信息和用户行为信息进行汇集和整理,基于海量用户特征和挖
掘技术对用户建立标签化信息全景,形成360°用户画像完善的数据管理及输出流程,满足个性化推荐服务等多种业务
应用的需要。媒体大数据云服务是以“多维知识库+智能语义”的方式对资讯数据进行结构化标引,通过对数据的精细化
运营加工,提供多元垂直数据型分析应用场景,贯穿媒体业务的各个环节,为媒体用户提供高信源、精加工、个性化的
数据产品云服务,提升媒体大数据的价值密度。目前,公司的融媒体业务主要以“软件产品+大数据服务”的融合模式为
客户提供服务。公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。

报告期内,融媒体业务版块经营业绩稳步增长,营业收入较上年同期增长了 17.56%。其中,行业报数据业务在稳步
增长,央国企融媒体平台建设在加快推进。随着拓天.M媒体行业大模型发布,AIGC服务在媒体领域的落地将迎来新一波
商机。


(3)金融科技
金融科技是公司的成长业务版块,主要面向银行业金融机构提供智能风控、智能消保、普惠助贷、绿色金融等金融
科技领域的软件产品及数据服务。智能风控云服务主要面向银行、投研机构提供全面监控海量金融实体多维风险,实现
高频异构数据自动化分析、风险知识化分析、跨场景知识延展和异动风险监测。智能消保管控中台面向银行业消保、业
务部门,打通各业务系统消保数据,从非结构化投诉数据挖掘相关知识并分析应用,实现对各渠道消保数据的科学精细
化管理。普惠助贷与绿色金融主要面向银行基于特色产业标签与企业价值分析模型,快速挖掘绿色产业、高新技术产业
细分领域下的潜力、低风险、优质客群,精准放贷。目前,公司的金融科技业务主要以“软件产品+大数据服务+订阅
SaaS服务”的融合模式为客户提供服务。公司智能风控业务的用户已经覆盖了5大国有银行、3大政策性银行、92%的股
份制商业银行。

报告期内,金融科技业务版块实现了经营业绩的大幅提升,营业收入较上年同期增长了 95.68%,其中传统业务稳中
微增,主要增长来自AI与数据业务,消保、风控延展类业务需求较为旺盛。


(4)数字企业
数字企业是公司重点拓展业务版块,主要面向能源、消费电子、餐饮等行业用户提供智能内容管理、企业融媒宣传、
企业声誉风险管理、企业开源情报等企业应用。目前,公司的数字企业业务主要以“软件产品+订阅制 SaaS服务”的融
合模式为客户提供服务。公司数字企业版块订阅制SaaS服务用户已经覆盖了中国能建、中国铁路、国投集团、国家电网、
南方电网、中国人民保险、潍柴动力、海尔集团、鲁信集团、百胜集团、中国通用、上汽通用、九毛九集团、山东航空、
浙江国贸等大型企业。

报告期内,央国企客户融媒体项目需求旺盛,公司加大了央国企客户的开拓,新增了航天科工集团等客户。


(5)公共安全
公共安全是公司的成长业务版块,主要面向网信、公安、防务等涉密和安全机构,提供公安情指行(情报、指挥、
行动)、开源情报、知识图谱、数据安全等领域的产品和数据服务。目前,公司的公共安全业务主要以“解决方案+软硬
产品+数据服务”的融合模式为客户提供服务。

报告期内,公安、防务等业务版块的软件产品营业收入稳定增长,较去年同比增长了 33%。边界安全等硬件产品营
业收入,较去年同比增长了31.43%。


2、技术领域
(1)人工智能
公司具有 20年的自然语言处理(以下简称:NLP)研发经验,是国内最早研发人工智能技术的企业之一,在 NLP、
知识图谱、OCR、图像视频结构化等领域都具备自主可控的多模态内容处理底层技术,处于行业领先地位。公司一直密切
关注人工智能的前沿技术发展,并积极探索相关技术在产品及业务中的应用。

报告期内,拓天大模型聚焦优势行业,融合公司多年在 NLP领域的综合研发实力及关键技术持续创新能力,利用自 有的高质量数据进行预训练。2023年6月底,公司正式发布了“拓天大模型”,推出适用媒体、金融、政务的三大行业 大模型,具备较好的合规性、安全性、准确性、可控性,可满足行业用户的专业化智能创新需求。同时,公司还启动了 拓天网信行业大模型、公安行业大模型、法律大模型的业务场景规划与预训练。 ①拓天.M媒体行业大模型 公司基于自有的 1000亿+互联网媒体资讯数据,100亿+官媒数据,200万+人民数据,14大类知识标引规范, 12000+知识标引规则作为专业训练数据,打造了媒体专业大模型,主要功能覆盖内容生产智能助手、新一代搜索与推荐、 多模态传播与服务三大业务场景。 ●大模型+大数据:智能选题策划
实时接入最新、最热和具有公信力的外部互联网数据,通过大模型的能力实现媒体大数据的知识增强,应用到报社
内容生产的智能选题策划环节,帮助媒体工作者更方便地从各种维度获取需要的外部互联网数据。具体应用场景包括实
时新闻热点、网民最新关注、实时问答互动等。编辑记者以互动问答的方式向大模型发出指令,可要求给出特定时间段、
特定领域的统计分析结果,大模型能够快速准确的给出结果,为表现结果的真实性,每个结果都会给出来源出处。

●大模型+编辑器:内容生产智能助手
利用主流媒体垂直领域大模型的核心能力为内容生产过程赋能,通过大模型与富媒体编辑器的深度融合形成内容生
产智能助手,提升编辑记者日常工作效率,具体应用包括拟定新闻标题、文章段落续写、内容智能摘要、文章风格改写、
文字智能配图等。 ●大模型+知识库:知识搜索与推荐 将媒体单位自有的私域数据和行业知识相结合,提供知识搜索与推荐服务,应用于领导人金句引用、权威法典引用、 报道文集引用、权威数据素材搜集等场景,编辑记者可利用大模型实现不同来源的权威数据集的素材搜集、整理工作。 可根据用户个性化的要求(比如:包含时间、标题、摘要等),将不同主题的内容数据集按照要求整理到一篇文档中,也 可以对新闻报纸中包含某种关键性信息的版面进行汇总整理。 ●大模型+分析报告:多模态传播与服务 利用大模型强大的分析统计能力,对互联网采集的媒体新闻报道内容和互动数据进行分析计算,自动生成各种传播 分析结果,并按照特定的报告格式进行输出。利用媒体大模型的统计分析能力,针对特定主题事件实现宣传报道的智能 归纳与总结,并根据要求智能生成总结报告进行输出。 ②拓天.F金融行业大模型 公司基于自有的110亿+金融主题数据、百亿级产业指标数据、30亿+产业要素明细数据、2亿+产业动态本体、500+ 以上标引维度、10000+知识标引规则、10万+产业标签作为专业训练数据,打造了金融专业大模型,主要功能覆盖智能 风控、智能客服、智能投研等业务场景。 ●大模型+智能风控 提供风险预警助手、风险报告生成助手、风险知识查询助手功能,在原有智能风控产品基础上,全面升级基础技术 底座,利用大模型技术提供以下功能升级: 风险预警助手,多模态风险信息的获取、风险自动化摘要、风险分类、风险定级与信息排重。 风险报告生成助手,在贷前尽调、贷后排查等环节,提供智能化报告生成助手,可提供报告标题生成、目录生成与 报告全文生成等自动化功能,并可集成大模型插件数据智能化生成各类风险报告。 风险知识查询助手,利用自然语言输入的方式,对内部数据与知识数据实现海量数据智能化搜索。 ●大模型+智能投研 人工智能在提升投研效率和科学性方面体现了较为明显的优势,拓尔思将利用大模型推出投研智能搜索引擎与研报 生成助手。 投研搜索引擎,通过自然语言处理、深度学习等人工智能技术拓宽投资信息来源,金融信息系统可抓取与投资目标 相关的宏观经济指标、舆情走向和监管政策等数据,大幅提高获取信息的及时性,利用自然语言处理技术来分析新闻文 章和社交媒体上的评论,更好地了解市场情绪和趋势,并根据其预测结果制定投资策略,减少投资顾问进行金融处理基 础数据的工作量。 研报生成助手,利用大模型技术能力,结合数星产业大脑上百类宏观、中观、微观相关数据,提供智能化研报生成 助手,自动化生成研报标题、研报目录、研报内容,并结合各类插件化数据提供精准实时数据的插入与内容生产。 ●大模型+智能客服(消保) 利用大模型技术,实现金融机构接诉即办,提升客服能力。 客服数据智能分析助手,可对语音、文本等各类投诉数据完成客户投诉原因、投诉渠道、投诉诉求、是否高危、是 否重复等核心要求完成自动化分析。 客服投诉处理助手,利用投诉知识库与投诉处理意见库等,自动化生成投诉建议处理意见、定责意见、排查意见等, 提升客服处理投诉效率,降低客户投诉率。 ③拓天.G政务行业大模型 拓尔思基于自有的300万+篇公文类数据、200万+篇政策法规类数据、8000万+篇政务资讯类数据等数据作为专业训 练数据,打造了政务专业大模型,主要功能覆盖公文辅助写作、政策大脑和新一代政务互动等业务场景。 ●公文辅助写作
在公文写作过程中提供更快速、准确的帮助和建议,支持生成横跨多专业领域的内容建议、改进文章结构等,帮助
节省作者的时间和精力,并提高公文写作的效率。

基于公文标题和提示信息,依次完成公文概要、目录、目录内容的生成,形成公文写作结果。

支持基于输入的少量文字,自动生成内容连贯、富有逻辑的公文正文。

支持与内容编辑器集成,作为辅助写作助手与内容编辑过程实时交互;可指出不合适的词汇、修正语法错误、改进
句子结构,并提供更生动、吸引人的表达方式,提升内容的可读性和吸引力。

●政策大脑
支持对最新发布的政策进行智能解读,具备实时数据接入模型进行识别、问答。

支持对政策核心内容进行解读,生成总结,包括总体目标、重点任务、政策措施等。

支持对政策内容中企业扶持、补贴等信息进行解读,为企业参考提供支持。

支持对不同地区的产业政策,或者相同地区不同时间段政策进行比对,进一步为企业提供政策研究支持。

●新一代政民互动
可应用于政府网站智能问答、办事 APP实时咨询、政务服务大厅机器人引导等场景。网民通过自然语言表达自己的
需求,无需复杂的菜单或过滤器,可自由地以最自然、最方便的方式来表达诉求。


(2)大数据
公司自成立之初就从事中文全文检索技术的研发,是国内最早从事该技术领域研发的企业。在大数据技术平台方面,
公司拥有完整的大数据产品矩阵,涵盖数据采集、汇聚、加工、治理、存储、共享、开放等全流程。在数据资产方面,
公司2010年就自建了大数据中心,以长期服务多行业用户持续积累的开源数据为基础,拥有了规模及质量均位列业界前
茅的公开信源数据,目前数据总量超1500亿+,并仍保持日均亿级数据的采集增长。

报告期内,公司在数据资产平台、数据技术平台等方面做了以下工作。

①在数据资产平台方面,公司分别对三大经营性数据资产平台进行了架构、性能、功能方面的优化迭代。

●在产业大脑平台方面,公司重构了底层 4大子系统,优化了 100多类数据的架构与存储,进一步提升了系统稳定
性。在数据方面,对专利数据、精准营销相关线索数据等进行专项增强。在模型方面,对产业标签及各类场景项目级进
行专项优化。在应用方面,进行非核心功能瘦身,提升客户体验。

●在数家资讯平台方面,公司对分布式采集管理平台进行了全面优化,初步完成了数据服务线研发。

●在网察大数据平台方面,公司优化了平台代码和架构,进一步提升了平台安全性和稳定性。

②在数据技术平台方面,为提高数据中台的数据高可复用性以及数据应用开发敏捷性,公司投入了较大研发力量进
行新中台架构(一中心五中台)的升级迭代。

●在数据治理、数据分析、数据存储等进行了全方位的优化,增加了数据中台云服务处理模式,为无条件落地的小
B端用户大数据建设提供了简单快捷方案,降低实施落地难度,同时满足智能化需求。

●在搜索型数据库方面,公司主要聚焦信创替换以及向量数据库两个方向。今年 4月,公司发布了海贝 10加强版(Hybase10 Pro),完成了海贝的稠密向量索引核心功能的开发。今年 5月,在中国信通院组织的首批可信数据库“搜索
型数据库”产品能力评测中,公司的海贝搜索数据库系统顺利完成了搜索型数据库产品能力评测。

●在数据处理方面,公司对 TRS ETL进行了新版本研发,完成了 ElasticSearch(以下简称 ES)生态兼容处理工具
的升级,增强了 ETL任务的断点续传能力,实现了多种 CDC实时数据同步类型,新增 SQL和 JAR类型任务,从 ETL到
ELT等,使TRS ETL在生态兼容、性能、处理能力等方面得到进一步提升。


(3)数据安全
在网络信息内容安全治理方面,公司主要聚焦网络低俗色情、饭圈乱象、网络暴力等网络生态问题的监测、追踪和
分析。在内容安全审核方面,公司的文字校对云服务平台能够比较准确、全面、智能地对发布内容进行审核,包括文字
类差错、敏感词过滤、常识错误等内容。在网络安全方面,公司子公司天行网安是国内最早从事网络安全和数据交换的
企业,发明了国内第一台安全隔离网闸,在数据视频交换、单向导入等方面具有雄厚的技术实力。目前,公司主要面向
政府、公检法、海关等单位提供以数据交换为核心的边界安全、物联网安全、大数据安全三大阵营产品线和解决方案。

其中,边界安全产品在全国公安边界安全市场处于领先地位。受益于国家对数字中国建设的重视,天行网安充分发挥自
身在公安行业的优势,积极参编GA/T1788.3等标准,并致力于服务公安边界安全建设。

报告期内,在边界安全产品方面,天行网安基于统一架构的边界产品升级改造,有效提高开发效率及产品性能,提
升产品竞争力,已完成边界安全基础平台开发。同时,启动了数据服务安全网关和视频交换平台 3.2版本的合作研发工
作。

在大数据安全方面,天行网安完成了公安安全大数据平台项目开发,发布了安全管理平台 V1.0。同时启动了边界运
维平台(BOP)2.0版本的研发工作。

同时,天行网安未来实验室已完成天行隐私计算平台 V1.1的研发,新一代 FPGA隔离板卡研发也基本完成,准备进
行实验局。


(4)信创
自2018年我国将信创纳入国家战略以来,公司已经实现了主要软件产品与国内信创领导厂家的基础产品,包括海光、
鲲鹏、飞腾、龙芯等芯片,以及统信 UOS、中标麒麟、银河麒麟、中科方德等国产操作系统的适配工作。公司的海贝大
数据管理系统是一款从内核到系统完全国产自研的搜索型数据库,是构建搜索引擎应用的核心支撑软件。作为一款纯国
产自研的搜索引擎数据库,海贝大数据管理系统支持所有数据类型,功能完备,安全可靠,兼容主流国外搜索引擎数据
库常用接口,对接主流生态。美国搜索型数据库产品 ElasticSearch利用开源优势,迅速成为该领域的全球领导者,我
国使用量排名全球第一,且深度应用到各行业的关键系统。但ES是全球发生数据安全事件最多的数据库产品,导致我国
数据安全风险极大。报告期内,公司拓展了不同行业的合作渠道,积极推进对ES搜索引擎数据库的国产替代。纯国产自
研的“海贝”具备与之媲美的产品力,公司具有众多国家标杆项目成功经验以及本土化服务能力,完全可以平滑替代 ES。

报告期内,拓尔思进一步扩大主流产品的全面适配信创国产化,完成了 TRS Server、Hybase、ETL、雷达、API GW、
DL-CKM、WCM、IDS、MAS等产品与飞腾 S2500的适配测试,完成了 ETL、IDS、MAS等产品与海量数据库的适配测试,配
合海量数据库完成测试报告,已获互认证书。


3、服务模式
(1)软件产品
公司拥有人工智能和大数据技术领域的通用产品,包括海蜘大数据采集平台、海聚数据融合平台、海贝大数据管理
系统、天骄数据中台、智拓人工智能技术平台等,在项目中主要用于构建人工智能底座和大数据底座,为上层业务应用
提供数智化能力。公司还拥有数字政府、融媒体、公共公安等领域的行业产品,包括海云集约化智能门户平台、海融智
能媒体融合平台等,主要聚焦特定的业务场景。目前,公司的软件产品主要按许可组件+套数的模式进行销售。

报告期内,公司启动了新中台架构(一中心五中台)的升级迭代。

在技术中台方面,基于公司原有微服务网关和低代码平台,研发了能力中心 V1.0,并和数据中台能力接入做了内部
拉通,可一键发布数据服务到能力中心,实现申请审批、流控等服务保护。数据中台可快速接入能力中心其他系统发布
的能力,将数据中台变薄,让数据中台更加专注。能力中心对所有接入的数据服务能力、人工智能的能力进行申请和审
批的管理、流控等,现已支撑了项目两个示范应用的运行。

在AI中台方面,公司增加了视频语义分析能力,如改进人脸搜索匹配算法,优化了低头和正脸的匹配度以及不同年
龄的匹配度。

在行业产品方面,公司在海云集约化智能门户平台中持续迭代 TRS校对功能,实现智能校对交互全面优化,新增工
作流,优化抄送功能、政务新媒体入驻号管理等。对金融智能监管中台的架构进行了升级迭代,算法模型也进一步丰富。

同时启动了金融犯罪大数据法律监督平台的研发。


(2)大数据服务
公司采集的公开信源数据通过加工处理,通过不同专业模型转化成不同领域的知识数据,实现数据从资源性到经营
性的数据资产变现,形成了三大数据资产平台:数家(媒体资讯)、网察(舆情)、数星(产业大脑)的格局。目前,公
司的大数据产品主要提供以下计费服务模式:


数据产品计费方式
数据集按数据量购买
 按时长购买(订阅时长)
数据服务按次计费
 按时长计费(年费)
 按项目计费+按时长计费(年费)
数据应用按帐号数量计费
 按版本计费(标准版、高级版、企业版)
 按时长按时长计费(年费)

报告期内,在数据资源方面,公司对数百万个采集点进行了采集清理,保证了采集源的高度权威可信。同时,进一
步扩大了 10万+采集点,使公开可信信源的地域库、短视频数据等方向的采集能力得到高速增长,高质量多模态数据资
源得到大幅充实。另外,公司还加大了数据标注服务的投入,保证数据标注质量得到不断提升。

在数据流通方面,公司已实现了三大经营性数据资产平台的数据服务产品全面细化与优化,数据要素业务也呈良好
增长态势。目前,公司数据服务类Open API已在北京、上海、深圳、郑州数据交易所挂牌,贵阳大数据交易所与西部数
据交易中心的数据服务上架正在同步推进中。

在数据服务方面,公司大力开拓大模型预训练数据集服务业务,以数据推送服务方式为全国大模型服务厂商提供优
质的中文预训练数据集。中文大模型训练需要优质且合法的数据资源,而网信办、具备新闻发布资质的单位以及其他组
织机构所发布的合法稿源、长期数据,无疑具备稀缺性。目前,公司拥有规模位列业界前茅的、经过领域知识加工的权
威高质量公开数据1500亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站
数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂商洽谈数据服务合作业务。未来,公司
有望为全国更多MaaS服务商提供不同垂直领域的高质量预训练数据服务。

在数据资产管理方面,公司积极加强与上海数据交易所的交流,共同探索数据资产入表的操作实践,持续加强对数
据资源的应用场景或业务模式、原始数据类型来源、加工维护和安全保护等相关机制优化、工作细化,以全面提升公司
的数据资产管理能效。


(3)订阅制SaaS服务
公司在经营过程中已经形成了一套“1+1=N”的数据要素商业模式。“1+1”是指一个大数据底座和一个人工智能技
术底座。“N”是指行业SaaS服务集群,未来可实现N个云服务产品的拓展。“1+1=N”的商业模式主要依托拓尔思自建
的大数据中心,基于自研的大数据底座和人工智能技术底座,面向政府、媒体、金融、企业等优势行业,根据不同场景
封装产品,基于公司成熟营销体系迅速推向市场。这种模式实现了同一数据资源在数据资产转化方面的裂变增长,充分
体现了公司深耕行业应用,深挖存量客户衍生价值的行业优势,也体现了公司高质量专业模型和知识数据的优势。

报告期内,数星产业大脑数据服务平台营业收入大幅提升,较去年同比增长了 223.9%。网察大数据服务平台营业收
入平稳增长,较去年同比增长了46%。

公司控股子公司广拓公司推出了天目开源情报数据服务平台 V3.0,构建了全新底座,推出了三大中心(透视中心、
报告整编中心、情报服务中心),初步实现了开源情报各类数据服务产品的自增长体系构建。



公司需遵守《深圳证券交易所上市公司自律监管指引第 3号——行业信息披露》中的“软件与信息技术服务业”的披露
要求
报告期内,公司客户所处行业相关的宏观经济形势、行业政策和信息化投资需求等外部环境因素变化,请参阅本节
“(一)公司所处行业基本情况”的相关内容。

二、核心竞争力分析
(一)专注20年自然语言处理技术的积累
自成立以来,公司始终坚持核心技术自主研发,拥有 40+发明专利、700+软件著作权,一直引领全文检索和搜索引
擎数据库、自然语言处理(NLP)技术的原始创新和应用场景落地,是国内最早从事NLP研发的企业之一,专注的语义智
能细分领域属于人工智能中的认知智能领域。公司从 2000年开始自主研发NLP,率先将中文分词、自动分类、相似文本
检索等相关技术深度集成到公司的全文检索系统中,用于商业落地。经过 20多年的发展,目前,公司聚焦 NLP、知识图
谱、图像检索三大核心技术,结合机器人流程自动化技术,面向不同应用场景,形成了一套完整的多模态人工智能产品
体系,可为广大用户提供文本、音视频、多模态等全栈 AI服务能力。公司将行业知识图谱等语义知识应用于深度学习
中,通过知识驱动+大数据驱动,实现 AI学习效果提升。同时,公司实现了图像、视频、音频与文本的多模态融合的深
度语义匹配,通过 OCR识别、以图搜文、以文搜图、视频搜索、音频搜索等功能,可实现图像、声音与文本之间的跨模
态语义识别与检索。公司专注 20年自然语言处理技术的研发,以商业化、市场化、产业化为目的,每次迭代的人工智
能技术都能及时高效地融入到各行业产品中,实现科技成果转化到技术商业化。

报告期内,公司及子公司共计新增软件著作权36项,具体情况如下:
序号证书编号文件名取得方式发证日期
1软著登字第10816632号TRS天枢云原生技术中台系统[简称:TRS天枢]V1.0原始取得2023.02.13
2软著登字第10871880号TRS社交网络群体分析系统V1.0原始取得2023.02.28
3软著登字第10875912号TRS网络舆情传播与观点分析系统V1.0原始取得2023.03.01
4软著登字第10999062号海关风险规则知识库系统V1.0原始取得2023.03.29
5软著登字第11113987号TRS海贝搜索数据库系统[简称:TRS Hybase]V10.0原始取得2023.05.09
6软著登字第11113985号TRS用户行为分析系统[简称:TRS TA]V5.0原始取得2023.05.09
7软著登字第11113782号TRS智拓人工智能技术平台[简称:TRS DT-AI]V9.0原始取得2023.05.09
8软著登字第11140641号TRS网察大数据分析平台[简称:TRS NetInsight]V5.0原始取得2023.05.19
9软著登字第11140573号TRS数家媒体大数据采集平台[简称:TRS DataHouse Crawler]V2.0原始取得2023.05.19
10软著登字第11140602号TRS海思百川大数据服务平台V1.0原始取得2023.05.19
11软著登字第11140536号TRS大数据智能征信服务平台V3.0原始取得2023.05.19
12软著登字第11165746号TRS数星智能风控大数据平台[简称:TRS IRM]V7.0原始取得2023.06.02
13软著登字第11166411号TRS场景化智能搜索系统[简称:TRS智能搜索系 统]V1.0原始取得2023.06.05
14软著登字第11295187号TRS消费者权益智能投诉分析系统[简称:TRS CPS]V1.0原始取得2023.06.26
15软著登字第11336806号TRS自动校对云服务平台[简称:TRS Correct]V3.0原始取得2023.06.29
16软著登字第10643455号天行隐私计算平台[简称:Topwalk-PPCP]V1.0原始取得2023.01.10
17软著登字第10993426号天行安全管理平台[简称: Topwalk-SMP]V1.0原始取得2023.03.28
18软著登字第11031643号异痕通-刑事技术多源异构生物特征识别信息融合分 析系统[简称:异痕通]V1.0原始取得2023.04.06
19软著登字第11076712号天行安全接入网关系统[简称: Topwalk-SAG]V1.0原始取得2023.04.20
20软著登字第11115055号天行产品资料管理系统[简称:Topwalk-PDMS]V1.0原始取得2023.05.09
21软著登字第11115056号天行基础开发平台[简称:Topwalk-BDP]V2.1原始取得2023.05.09
22软著登字第11115053号天行准入控制系统[简称: Topwalk-ACG]V1.0原始取得2023.05.09
23软著登字第11127341号天行产品生产安装管理系统[简称:Topwalk- PIMS]V1.0原始取得2023.05.15
24软著登字第11127342号天行产品远程安装管理系统[简称: Topwalk- RIMS]V1.0原始取得2023.05.15
25软著登字第11221246号天行安全服务总线系统[简称:Topwalk-SRA]V1.0原始取得2023.06.12
26软著登字第11221245号天行集控探针系统[简称: Topwalk-TZ]V2.0原始取得2023.06.12
序号证书编号文件名取得方式发证日期
27软著登字第11282539号天行安全接入代理客户端软件[简称:Topwalk- SAGENT]V1.0原始取得2023.06.20
28软著登字第11305762号天行安全隔离与信息交换系统[简称: Topwalk-GAP (HG-C)]V3.04原始取得2023.06.26
29软著登字第11305730号天行安全视频交换系统[简称: Topwalk-MTP (HG- C)]V3.04原始取得2023.06.26
30软著登字第11305731号天行数据安全交换及访问控制系统[简称: Topwalk- DTS (HG-C)]V2.04原始取得2023.06.26
31软著登字第11305761号天行集中监管控制系统[简称: Topwalk-3AS (HG- C)]V4.04原始取得2023.06.26
32软著登字第11143522号基于流程引擎的新型地方金融监管系统[简称:地方 金融监管系统]V1.0原始取得2023.05.22
33软著登字第11143524号基于大数据的私募基金监管及服务应用系统[简称: 私募基金监管服务应用系统]V8.0原始取得2023.05.22
34软著登字第11153584号处置非法集资工作组织管理系统[简称:组织管理系 统]V8.0原始取得2023.05.25
35软著登字第11153585号金融风险现场智能风险排查平台[简称:现场智能风 险排查平台]V9.0原始取得2023.05.25
36软著登字第11041524号天目开源情报服务平台V1.0原始取得2023.04.10
报告期内,公司及子公司取得2项专利证书,具体如下:

序号发明名称专利类型专利号授权公告日证书编号
1标题生成方法和装置发明专利ZL 2017 1 0262158.X2023.06.20第6074220号
2基于领域知识图谱本体中的对象根类 型设计方法及系统发明专利ZL 2019 1 0756506.82023.05.16第5979374号
(二)深耕行业优质客户和AI工程化建设 自1993年成立发展至今,公司已在媒体、政府等行业深耕了20年以上,在金融、安全行业也厚植了15年以上,积 累了一大批行业头部标杆和优质用户,如媒体行业服务了 72%的中央媒体,61%的省级媒体,40%的行业媒体等用户;政 府行业服务了80%的中央和国务院机构,60%的省级政府,50%的地市政府等用户;金融行业服务了5大国有银行、3大政 策性银行、92%的股份制商业银行等用户;公安行业服务了公安部及 32个省市 160多个地市公安用户。长期的行业客户 深耕,推动了公司行业应用向纵深发展,业务主要聚焦在内容管理、大数据、人工智能、数据和云服务等领域。公司从 行业的关键场景切入,用大数据和人工智能技术解决最棘手的问题,为行业创造价值。 (三)1500亿+规模高质量经营性数据资产 公司2010年自建大数据中心,以长期服务多行业用户持续累积的公开信源数据为基础,拥有了规模及质量均位列业 界前茅的公开信源大数据,千亿级“全、准、新”的无监督训练数据和微调优化知识数据,可针对优势行业训练出高质 量的行业大模型,满足行业用户的专业化智能创新需求。 三、主营业务分析
概述

(一)主营业务概述
报告期内,公司实现营业总收入 44,442.96万元,较上年同期同比增长 4.58%;实现归属于上市公司股东的净利润
6,964.41万元,较上年同期同比降低6.68%。实现归属于上市公司股东的扣除非经常性损益的净利润5,029.36万元,较
上年同期同比增长8.52%;报告期末,归属于上市公司股东的净资产为338,485.25万元,较上年末同比增长25.97%。

2023年上半年,公司紧抓国家数字经济发展新机遇,在行业大模型方面取得了新进展,发布了“拓天大模型”。公
司聚焦本身的优势行业,在金融、媒体、政务三大领域推出了三大行业大模型,在赋能千行百业的数字化、智能化转型
过程中占有领先优势。报告期内,公司业绩变化的主要原因如下:
1、受益于国家加快发展数字经济,把握数字化、网络化、智能化方向,大力推进数字产业化和产业数字化,重视通
用人工智能发展,金融、媒体行业客户对大模型的创新应用需求旺盛。其中,AIGC业务实现了营业收入 782.18万元,
较上年同期同比增长 206.02%,主要业务涉及消保报告自动写作、媒体智能辅助写稿等应用。公司的金融科技业务实现
了经营业绩的大幅提升,其中传统业务稳中微增,主要增长来自人工智能与数据业务,消保、风控延展类业务需求较为
旺盛。今年上半年,公司在金融消保和风控领域的签约用户包括中国银行、国家开发银行、民生银行、招商银行、平安
银行、北京银行、上海浦发银行、上海农商银行、渤海银行、中国人保等。在这些项目中,公司将陆续实现金融行业大
模型在消保和风控领域应用,如消保智能审查、消保智能客服、智能风控助手等。大模型也迅速渗透传媒业,促进了数
智融合。从目前来看,大模型在内容管理、主体责任、传播阵地等方面均对现有的意识形态管理模式提出了新的要求。

建设我国自有的主流媒体垂直领域大模型是落实国家科技创新发展战略的重要举措,也是对冲美西方 ChatGPT人工智能
模型对我国意识形态领域冲击的必然选择。随着拓天.M媒体行业大模型发布,大模型应用在媒体领域的落地将迎来新一
波商机。公司已经与传播大脑签定了战略合作协议,联合发布了“传播大模型”,后续双方将共同开拓该领域业务。另
外,公司已中标人民日报某项目,在落地过程中,公司将与用户共创更多媒体AIGC应用。

2、报告期内,公司的云和数据服务业务实现营业收入 18,073.39万元,较上年同期同比增长 21.68%。大模型的自
主性、可控性、安全性是必要且需要重点关注内容,提高这三方面能力是落地部署的前提条件之一。权威主流媒体高质
量内容数据有利于推动通用大模型实现中文特性增强和价值观对齐。公司与深圳云天励飞技术股份有限公司(股票代码:
688343,以下简称云天励飞)签订了数据服务合作协议。公司以数据推送服务方式为云天励飞提供近两年广东省政务网
站(非全量)新闻、公文、公告、政策类数据数百万条,作为其大模型预训练数据集。大模型训练需要优质且合法的中
文数据资源,而网信办、具备新闻发布资质的单位以及其他组织机构所发布的合法稿源、长期数据,无疑具备稀缺性。

目前,公司拥有规模位列业界前茅的权威高质量公开数据1500亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、
新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂
商洽谈数据服务合作业务。未来,公司有望为全国更多MaaS服务商提供不同垂直领域的高质量预训练数据服务。

3、受宏观环境变化及政府预算紧张的影响,公司的政务行业营收水平和利润贡献较上年同期有所下降。


(二)报告期内公司主要经营工作
1、发布《数据要素白皮书》,“1+1=N”商业模式在多领域成功实践。

2023年3月,公司数字经济研究院编写的《拓尔思数据要素白皮书》(以下简称《白皮书》)正式对外发布。《白皮书》基于拓尔思数据要素业务的实践,从我国数据要素市场发展背景到拓尔思数据要素业务发展历程、业务目标、商
业模式、业务体系、数据资产、数据和云服务、市场规模、发展方向等层面进行了全面介绍。《白皮书》重点介绍了公
司以做大做强数据要素业务为发展目标,通过充分发挥海量数据规模和丰富应用场景优势,在经营过程中形成了一套
“1+1=N”的商业模式,即基于自研的大数据底座和人工智能底座,以场景驱动推出N个行业数据和云服务。目前,该模
式已在政务、金融、媒体、舆情、安全、专利等行业或领域获得了成功实践。

2、发布拓知全球基因专利数据库
报告期内,公司与知识产权出版社进行合作,在强化搜索引擎技术与数据资源优势基础上,重磅推出完全自主可控
的“拓知全球基因专利数据库”(以下简称拓知基因)。拓知基因目前涵盖全球40多个国家、地区和组织的生物序列相
关专利数据及32个公共资源库,包含4.2亿条专利基因序列及 11.9亿条公共资源生物序列。系统支持生物序列检索、
序列比对、基因专利检索等丰富检索策略,提供多途径检索追溯、分析手段和辅助工具,以及检索分析报告的查看和下
载,并对基因序列和专利进行深加工,在支持基因序列融合检索基础上,支持多维度揭示基因专利等功能。拓知基因在
性能优势上具备数据范围广、检索策略丰富、系统功能强和图形展示更直观四大特点。典型应用场景包括纳米生物技术、
组织工程与再生、基因测序、基于细胞的检测、发酵工程、PCR技术、色谱技术、生物医药的研发、基因治疗和诊断、
食品保健、农业育种、自然资源与环境、工业加工、生物信息学等多个领域。

3、公司产品完成中国信通院对话式AI首轮专项评测
2023年 3月,公司自主研发的 TRS小思智能问答机器人系统参与中国信通院首轮对话式 AI专项评测工作,并顺利通过对话功能模块评测。此次评测,依据《对话式人工智能技术及产品评估方法》开展,共涉及 8项指标,评估对话式
AI产品的功能完备度。TRS小思智能问答机器人系统的功能完备度较高,全面支持用户私有资源定制、知识库管理、第
三方数据接入功能,支持对话干预、对话引导、多媒体消息交互,具备较好的情绪安抚和格式解析能力。

4、公司产品完成搜索型数据库产品评测
2023年5月10日,在中国信通院组织的首批可信数据库“搜索型数据库”产品能力评测中,公司“TRS海贝搜索数据库”系统顺利完成了搜索型数据库产品能力评测。本次评测依据《搜索型数据库技术要求》,覆盖数据库基本能力、
数据库管理能力、数据库安全能力、数据库兼容能力、数据库扩展能力、数据库高可用能力,共计32个测试项目,包括
12个必选项和 20个可选项。“海贝搜索数据库”是公司自主研发的一款搜索引擎数据库,适用于数字、文本、地理位
置、结构化数据、非结构化数据等所有数据类型,为大数据应用提供高效的数据存储、全文检索、分析统计等数据管理
服务。

5、发布海贝搜索数据库V10及数星产业大脑
在2023年5月举办的2023中关村论坛上,公司正式对外发布海贝搜索数据库V10和数星产业大脑两款产品。

本次最新发布的海贝搜索数据库 V10,在数据存储和数据检索等方面的性能实现了大幅提升。海贝不仅提供了更加
专业的段句位检索、XML检索以及度量衡数据的数值区间检索等高级功能,新增向量检索功能(支持语义/图像/多模态
搜索),让数据检索更加精确;同时,海贝还加强了数据安全控制,通过用户管理、权限控制、安全审计以及索引加密
等机制,保证用户数据的安全可靠。海贝目前已经服务于安全大数据、媒体大数据、政府大数据以及军队大数据等众多
细分行业,拥有公安部、新华社、国家市场监督管理总局、海关总署、专利局、商标局等一系列客户,具有众多国家标
杆项目成功经验以及本土化服务能力,可作为国外开源软件 ElasticSearch的国产替代。在国家层面,几个重大的基础
数据库,例如企业信用信息公示系统、专利检索系统等都构建在海贝之上。依托海贝构建的浙江日报报业集团“媒立
方”,实现了多种媒介的有机融合、新闻数据的流程再造,荣获王选新闻科学技术奖特等奖。目前海贝已完成与龙芯、
海光、飞腾、鲲鹏等国产芯片以及中标麒麟、统信 UOS等国产操作系统的适配工作,完全满足信创要求和国产化替换需
求。

数星产业大脑是一款基于自然语言处理、大模型等语义智能技术的智能信息服务平台,它能够融合海量另类数据,
以产业视角透视风险与机会,洞察产业态势,监测企业风险,获取企业商机。数星产业大脑可满足金融、政府和企业等
机构获取、加工、处理另类数据应用于决策的需求,让信息发现从“人工模式”进入“智能模式”。该平台提供产业链
中心、宏观洞察、产业地图、产业拓客、事件中心、研究中心、企业洞察七大应用功能,支撑跨场景赋能,助力实现产
业高质量发展。平台具备多层次、多形式的服务体系,不仅可提供对外标准化的SaaS化服务,还面向场景端形成智能风
控、科创营销、精准招商及电报小程序四大场景,能够满足用户本地化、模型定制以及产品定制化的多元诉求。数星产
业大脑已在全国多个场景应用,覆盖信用、风控、监管、招商等多个商业化应用领域,为国有银行、政策性银行及 50%
的股份制商业银行等金融行业用户提供一整套风险监控解决方案,为北京经开区、营口、成都等区域的政府精准招商赋
能,构建全面产业分析、提供强链补链策略等等。

6、“拓天大模型”正式发布,聚焦大模型场景化应用和行业落地。

报告期内,基于在 NLP领域 30年技术创新成果、10余年高质量数据和知识资产积累,以及在垂直行业 10000多家企业级用户应用实践,公司隆重发布“拓天大模型”,并面向媒体、金融、政务领域,推出了三大行业大模型。

和通用大模型相比,拓尔思“拓天大模型”基于多年自主研发成果,在自主可控、中文特性加强、专业知识加强、
实时数据接入、内容安全和价值观对齐、客户私有化部署等方面具有领先优势,并与业务场景深度融合,为用户带来生
产力变革。

“拓天大模型”拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、
编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密
向量的跨模态能力加强以及支持外界知识及时更新四大创新点。

公司以三大行业大模型作为产业落地的先行突破:拓天媒体大模型,具有内容生产智能助手、新一代搜索与推荐、
多模态传播与服务三大行业应用;拓天金融大模型,已在投研服务、信贷风控、审查审批、客户服务等场景助力用户实
现智能化转型;拓天政务大模型,在公文辅助写作、政务咨询、政策服务、接诉即办、智能工作助手等场景提高用户办
公效率,提升政务服务质量。2023年下半年,公司计划推出网络舆情、公安、知识产权、法律、审计等行业大模型。

7、收获众多重磅奖项和品牌荣誉,部分核心产品顺利通过权威机构评测 凭借深厚的技术实力与丰富的数智化应用场景,报告期内,拓尔思赢得了众多奖项和荣誉:荣获2022大数据产业年
度创新服务企业、2023爱分析·信创产品及服务创新奖、中国优秀软件产品(网察大数据分析平台/海贝大数据管理系
统)等。公司自主研发的TRS小思智能问答机器人和TRS海贝搜索数据库分别通过中国信通院对话式AI首轮专项评测和
搜索型数据库产品评测。

(未完)
各版头条