近日,“数·算·网”交融发展暨粤港澳大湾区(南山·前海)算力业绩定约第一期交流磋议会在南山区英特尔大湾区科技立异中心召开。本次磋议会由南山区科技立异局和前海处罚局政务数据处提示维持,国度(深圳·前海)新式互联网交换中心、深圳数据来往所、英特尔大湾区科技立异中心共同经办,集聚了政府垄断换取、企业大咖和业界群众,围绕粤港澳大湾区数据、算力、蚁集产业链的深度合营与立异张开利弊磋议,旨在搭建资源分享、上风互补、技能飞动、利用立异的高端对话平台,股东湾区数字经济迈向新高度,助力粤港澳大湾区东说念主工智能考验场建树。
会上,深圳数据来往所(以下简称深数所)发布了大模子考验数据阶梯图,并连结通达算料定约发布500个垂直行业多模态算料集。深圳数据来往所东说念主工智能行业垄断王吴越进行了主旨发言,并展示了深数所助力粤港澳大湾区东说念主工智能考验场建树的行业推行。
王吴越暗意,在数字经济期间,“数据身分×”与“东说念主工智能+”成为股东新质分娩力的双轮开动,共同引颈着经济社会的逾越与发展。数据行动一个高效的“乘法”因子,约略与不同业业贯串,显赫晋升行业的分娩效力或立异能力,而东说念主工智能技能则通过“加法”景况为传统产业带来渐进式的改良和优化,两者相互交汇,共同成为数字经济发展的双翼。
王吴越先容了以数据为中心的东说念主工智能(Data-Centric AI)发展理念并发布了大模子考验数据阶梯图。深数所将按照大模子利用的不同阶段(考验、推理、调优),有的放矢地提供数据源,使得国产大模子厂商“寻数有路”。
据先容,现在,通达算料定约&通达群岛大模子SIG在“数据身分×”与“东说念主工智能+”双轮开动发展得回的恶果:一是发布了粤港澳大湾区大模子考验数据舆图;二是提供了端到端的跨模态数据挖掘开源器用;三是构建了数据资源价值发现智能体。
随后,炒股开户深数所与通达算料定约连合髻布了由37家不同的数据商提供的,首批500个东说念主工智能大模子高质料考验数据集,涵盖12个“数据身分×”领域,3家说念外数据商,7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等),本批数据集初度集聚了来自中国喜跃局、中国知网、中译语通、万邦同和、微梦数据(新浪微博)、前海数据、海天瑞声、拓尔想、数据堂、智谋芽、网智天元、柏川数据、降服科技等数据商的数据集行动大模子算料。其中大部分算料为宇宙首发。
会上,深圳数据来往所公开了高质料数据集的真是默契渠说念,具体包括以下要领:第一步,绘图大模子考验数据资源舆图,为数据来往提供明晰的导航;第二步,数据商负责入驻深数所,由数据来往所提供坚实的平台维持;第三步,数据商进行真是的质料评测,确保数据的准确性和可靠性;第四步,合规审核与居品上市,为数据的安全默契提供保险;第五步,数据身分默契来往,竣事数据的价值飞动。这一系列过程组成了高质料数据集从归集到来往的无缺真是旅途。
改日,深数所将充分闪现“双区”开动、“双区”重迭、“双改”示范效应,坚抓立异引颈,为国产大模子厂商提供燃料,并联袂大模子厂商在数据身分×要点举止领域共建垂直行业大模子数据利用。