科技日报记者 崔爽


(资料图片)

伴随国内生成式人工智能的快速发展,相关监管政策正逐步落地。由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)于8月15日正式施行。作为我国首份针对生成式人工智能的规范性监管文件,《办法》以“促进生成式人工智能健康发展和规范应用”为目标,明确国家坚持发展和安全并重、促进创新和依法治理相结合的原则,对生成式人工智能服务实行包容审慎和分类分级监管。

在愈益完善的监管链条之下,我国人工智能产业迎来合规发展新阶段,正如各方专家所言:“不发展是最大的不安全。”

运用监管科技 激活人工智能市场活力

“ChatGPT的问世引发了新一轮人工智能革命,人类与机器、技术与产业、虚拟与现实之间的关系发生着广泛而深刻的改变,迸发出新的想象空间,技术创新也给人类社会文明秩序带来了挑战。”近日,在中国社会科学院法学研究所主办的“全球治理话语竞赛下人工智能立法的中国方案”研讨会上,南方财经全媒体集团合规科技研究院院长虞伟如此表示。

当前全球正在进行智力话语竞赛,掀起新一轮AI监管潮。据虞伟介绍,欧洲谋求AI监管领域主导权,早早将立法提上日程,2019年欧盟委员会发布《人工智能伦理准则》,提出评价人工智能可信赖的七项标准。2020年欧盟出台《人工智能白皮书》,提供多种政策选项。今年6月14日,欧盟议会以压倒性优势的投票结果通过欧盟人工智能法案草案,预计在完成最终谈判后正式审批通过。

南财合规科技研究院首席研究员王俊建议,我国可以在建立基于应用场景的制度、明确政府主导作用并协同社会多方治理、科学应用技术工具等方面借鉴欧洲监管经验。

“我们目前还没有实现对风险全面类型化和场景化的区分,这也是因为风险还是复杂性的,单一的治理技术和多元治理场景是存在矛盾和冲突的,接下来可以基于场景把监管做得更精细化,针对不同技术路线、应用模式和责任主体,在不同场景中对不同的风险点进行差异化监管。”王俊表示,同时,可以采取分级治理的模式,对中低风险领域留出试错和发展空间,积极适用一些监管科技,综合选择适配的监管科技模式,激活人工智能市场活力。

新浪集团法务部总经理谷海燕同样提出,站在企业角度,希望看到更加有区分度的监管措施,比如欧盟的人工智能法案,采用风险区分规制路径,根据风险级别,分为不可接受风险智能,高风险人工智能,低风险智能,以及最小风险人工智能,分别设置法律义务。

“我们必须关注AI热潮中伴生的风险。”虞伟强调,比如在大模型发展中,数据起到压舱石的作用,面对生成式人工智能庞大的数据需求,如何建立高质量的语料数据库,在数据收集、处理、输出的各个环节,数据泄露、隐私侵害等问题成为隐忧,如何加强全流程的数据合规管理。再比如生成式人工智能的结果能否构成著作权法所定义的作品仍存争议,进一步的版权归属问题也需要厘清。此外,歧视、偏见、虚假信息传播等风险在大模型大力出奇迹的训练方式下被相应放大,如何将道德伦理原则交给AI,做到精准纠偏,兼顾公平与效率,都需要进一步研究。

构建算力生态 支撑人工智能产业发展

数据显示,今年上半年,国内发布的各类大模型数量超过100个。据不完全统计,目前国内已有大约80个参数在10亿规模以上的大模型。《办法》提出,推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。

算力是数字时代的底座,也是人工智能发展的引擎。据工信部最新消息,截至今年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS,算力总规模近五年年均增速近30%,存力总规模超过1080EB。

中国工程院院士刘韵洁表示,我国的算力产业有着广阔的发展前景,因为中国是制造大国,实体经济对于算力有着很大的需求,游戏、AR、VR等消费领域算力需求也很大,“有政策支持和技术发展,算力随取随用的前景值得期待。我们未来能够实现像使用水、电一样使用算力。”

但他同时强调,我国的算力网络要赶上大模型的需求,需要方方面面协同发展,比如,做通用大模型或深入做行业大模型都需要训练数据,“这就需要把行业的数据保护好、利用好、管理好,再借助通用大模型的一些能力,集中精力把行业大模型做出来,对发展实体经济非常有价值。”

中国信息通信研究院院长余晓晖表示,随着我国算力产业的加速发展,算力布局逐渐优化,绿色低碳仍是算力产业发展的重点要求,算网融合不断加快,算力调度成为推动全国算力资源优化配置的关键。未来要进一步系统布局新型基础设施,加速推动核心技术创新,完善政策标准体系建设,推动构建完善的算力产业生态。

把握技术趋势 推进行业大模型实践

生成式人工智能的功能远不止于提供信息内容服务,其可以作为“技术基座”给金融、医疗、自动驾驶等多个行业领域赋能,未来将成为社会的“技术基础设施”。

“在以ChatGPT为代表的通用大模型面前,我们短板比较明显,需要各行业结合起来才能够使大模型有更快的发展。”中国工程院院士刘韵洁在2023中国算力大会直言,“中国的机会在于行业大模型。”

通用大模型一般指在多个领域应用广泛的大型深度学习模型,如BERT、GPT等在自然语言处理、计算机视觉、语音识别等领域都有广泛应用的模型。行业大模型是指专门针对某个特定垂直行业所设计的大型深度学习模型,这些模型通常在特定行业中使用的数据集上进行训练,以提高在该行业中的准确度和效率,如金融行业的风控模型、智能分析,如煤矿行业里的安全巡检、智能识别,如医药行业的药物研究、分子组合等。

据刘韵洁介绍,基于通用大模型的基础能力,针对行业垂直领域知识和业务场景需求,发展行业大模型已成为技术发展的必然趋势。一方面,行业特定的知识积累和经验可以被应用到模型中,提高模型的质量和准确性;另一方面,行业大模型可以通过学习不断更新迭代,帮助企业更好地理解行业趋势,做出更为准确的商业决策。

目前,国内已逐步建立起涵盖理论方法和软硬件技术的体系化研发能力,一批具有行业影响力的预训练大模型蓬勃发展,形成了紧跟世界前沿的技术群。以盘古基础大模型为例,据报道,基于数十年的数字化经验以及对行业的理解,华为云盘古大模型已经陆续推出矿山、药物分子、电力、气象、海浪等大模型,在各行业落地创新项目超过1000个,通过提供先进算法和解决方案,深入推进大模型的全栈自主创新,加快推动算力国产化。

同时,相比其他国家,中国坐拥庞大的实体产业基础,并持续构建现代化产业体系,对于人工智能技术与行业应用的深度融合,有着更庞大、更迫切、更具价值的实际需求,也提供了更为广阔的创新实践空间。这也是在大模型时代,国内产业在人工智能领域的机遇所在。

推荐内容