
来源: 第一财经资讯
人工智能大模型的应用方兴未艾,但支撑大模型发展的数据仍存在瓶颈。今年全国两会,全国人大代表、海尔集团董事局主席兼首席执行官周云杰,全国人大代表、长虹控股集团董事长柳江就如何打破数据瓶颈和促进数据产业化,都提出了建议。
智能制造、智能家居急需数据支撑
周云杰认为,人工智能在工业大模型的深度应用中面临几大挑战,包括数据质量与语料库的瓶颈、场景适配与模型可靠性的挑战,以及转型切入点和话语体系的错位。因此,他在《以工业大模型为关键变量赋能新型工业化》的建议中提出,首先要发布国家级工业场景图谱、语料库和数据集,为人工智能在工业领域应用提供坚实基础。
其次是支持龙头企业,为工业大模型应用价值做示范。建议以财政补贴,支持家电、汽车、医疗等龙头企业,开展基于工业大模型的人工智能深度应用,提炼并共享其在研发设计、生产制造、经营管理等关键环节深度应用人工智能的典型案例。
此外是扶持平台企业,促进工业大模型服务于中小企业。建议对国家级双跨平台企业出台专项财政扶持政策,培育一批工业大模型与场景图谱精准匹配的标准化、可复用、低成本解决方案,为中小企业提供用得上、用得起、用得好的人工智能服务。
人工智能在智慧家庭的应用,也需要打破数据瓶颈。周云杰在另一份《以高质数据构建智慧家庭大模型 助力家电家居产业升级》的建议中提到,智慧家庭大模型需要算力、算法、数据支撑。DeepSeek等已大幅降低算力需求,然而大规模高质量数据的支撑仍无法替代,行业数据建设仍面临采集成本高、跨域融合难、训练数据少等堵点。
对此,周云杰提议,一是培育数据采集产业,构建智慧家庭大模型的数据源。建议制定统一数据标准体系,规划并发展智慧家庭数据合成、数据标注产业;实施数据贡献参与工程,通过全民共享、群企共创的形式,构建行业全覆盖的垂域数据基础。
二是建议通过政策、资金,支持行业龙头企业牵头建设智慧家庭全场景覆盖的数据仿真平台和训练场,训练高质量垂域大模型,向产业链上下游提供服务,推动具身智能技术在智慧家庭场景中的深度应用,赋能家庭服务型机器人等新质生产力发展。
一位业内资深人士向第一财经记者分析认为,数据产业化有两个层面,一是政府层面,目前政府内部的数据瓶颈没有打破,数据在不同部门之间、在同一部门的不同处室之间,壁垒依然存在;二是市场层面,大数据已经提出了十多年,大模型最近也蓬勃发展,然而目前国内数据市场上能够提供专业的数据分析服务、满足各界数据需求的专业企业较少。“数据产业化虽已提出多年,但还有较长的路要走。”
呼唤加快可信数据空间的建设
2023年中国数据空间市场规模为40.2亿元,同比增长24.4%,产业具备一定市场基础,规模有望持续增长。北京、上海、深圳、广州、重庆、海南、济南、佛山等地均已开展数据空间建设,行业整体呈现集中化及规模化趋势,其中,政务、金融、工业三大数据空间建设的重点领域占比超过52.5%。
所谓可信数据空间,是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。
“数据跨界融合的需求已经明确,但大规模数据流通利用的场景仍在探索。”柳江认为,目前,数据流通利用以公共数据和社会数据的开发利用为主,企业数据、个人数据的规模化利用尚未形成,对AI技术应用的支撑效果尚不明显。实体企业数字化转型经历了业务贯通、数智决策阶段,现正进入数据流通赋能阶段。
国家鼓励建设可信数据空间,但是仍面临一些问题。柳江说,一是可信数据空间技术路线和标准不统一,平台间难以互联互通互认,而且在国际标准制定中话语权仍有待提高。二是数据要素的市场机制不健全,法律法规滞后,数据安全与隐私保护技术检测认证不足,各环节监管不力,影响社会信任。三是跨领域协同难度大、人才短缺问题突出。数据产业政策和资金支持不足,企业技术创新和融合应用动力欠缺。
对此,柳江在今年全国两会期间递交了《关于加快可信数据空间应用落地的建议》。他建议,构建企业、行业、城市、个人和跨境等类型可信数据空间,为数实融合创新提供数据基础设施,加快应用落地。
首先是引导权威机构牵头,联合行业协会、科研机构和企业,共同制定可信数据空间相关技术标准,降低数据流通利用技术壁垒。同时,鼓励相关机构、组织和企业参与国际标准制定,提升国际话语权,探索建立与国际数据空间的互认机制。
其次是建立健全法律法规,鼓励数据流通利用和数据价值挖掘。加强数据安全与隐私保护相关技术检测与认证,建立数据流通利用信任体系。建立数据流通的合规审查机制,加强对数据流通各环节的监管,确保数据流通合法合规,提升社会信任度。
此外是通过政策和资金支持,鼓励企业加大研发投入,推动数据采集、汇聚、加工、流通、应用和安全保障。支持企业运用可信数据空间,进行数据加工、数据开发和应用部署。建立数据专业职称体系、产学研用一体化机制,提供充足人才储备。
广州数据交易所相关人士向第一财经记者说,可信数据空间是畅通数据资源循环、释放数据要素价值的重要载体。目前全国多地都在积极探索可信数据空间建设,但仍存在技术路线和标准不统一、主体参与意愿不足、跨空间数据交互难等问题。建议一方面加快制定相关标准,鼓励各类主体使用可信数据空间;另一方面发挥数据交易所的枢纽作用,推动可信数据空间建设和跨空间互联互通,培育可信数据空间生态体系,实现更大范围数据价值共创,为全国一体化数据市场建设提供有力支撑。