AI狂飙时代,谁在为生成式内容“守门”?
近期,国家网信办指导上海、北京、广东等地网信办,对几家主要的网络平台采取了约谈、责令限期改正等处置处罚措施。围绕互联网平台维护网络空间内容健康、保障数据安全和个人信息权益、确保算法合理性,为用户提供更好更安全的体验等要求仍在逐步加强。
AI安全可控进入新常态
与此同时,AIGC技术正“以日迭代”的速度重塑智能世界,安全防护的“保质期”被急剧压缩。
以前闻所未闻的如AI换脸、AI拟声、AI篡改语义/数据等安全风险与日俱增。追根究底,AI技术打破了内容真实性与身份唯一性的传统边界,并且具备规模化生成、低成本实施、高迷惑性等特征,所以既能够轻松绕过传统算法识别,又让人工审核陷入效率与精度两难的尴尬境地,从而进一步增加了安全防范的复杂度。更让人感到棘手的是,大模型训练数据的“毒性注入”、生成内容的标识合规、未成年人保护等新需求不断涌现,让渴望借助AI实现业务跃迁的企业,面临着更加严峻的合规风险和挑战。从企业和用户的角度,对于AI应用落地,常常会不自觉地发出“想说爱你不容易”的感叹。
根据Statista的预测,2023-2030年,全球AI安全市场规模CAGR为27.60%,2030年的市场规模将达到1340亿美元。一边,AIGC引发的模型投毒、深度伪造等新型威胁猛如虎,而另一边,欧盟《人工智能法案》《中国生成式AI服务管理办法》等法律法规落地实施,这场新的博弈驱动着AIGC安全市场的发展和变化。
国务院《关于深入实施“人工智能+”行动的意见》明确要求,“强化前瞻谋划、系统布局、分业施策、开放共享、安全可控”,将安全可控作为基本原则之一。在“安全与创新并重”的AI治理导向下,企业的AI安全实践应该从技术标识、源头管控、场景监管等多个维度实施主动防御,把握创新活力与风险防控之间的平衡。比如9月施行的《人工智能生成合成内容标识办法》及配套强制性国标,就明确提出了管控的“刚性边界”,即要求文本、音视频等生成内容添加显式标识,文件元数据嵌入隐式标识,从源头解决内容溯源难问题。同时,“柔性考量”也不容忽视,即对技术尚不成熟的隐式标识不作强制要求,此外还要创新低成本的标识方案,避免过度管控抑制发展。
AIGC催生了新的应用范式,相伴而生的安全风险也呈现出新特征、新形态,这使得一些传统的被动式安全方案捉襟见肘。
市场需要的是从“懂政策、懂业务运营”的安全厂商,变成“懂政策、懂业务运营、更要懂AI”的新型“合规守门人”。
九年磨一剑,易盾成为数字内容安全领军者
从2016年到2025年,网易易盾经历了常见的内容安全、业务安全、应用安全,到跑在时下最前沿的AI内容安全,可谓“历九年而弥新”,凭借在AI方面的技术研发沉淀、服务千行百业的成功案例,能够从策略、技术、市场、运营等多个维度,帮助企业构筑起AIGC安全的护城河,实现安全可控与创新发展的双赢。
九年来,网易易盾已累计服务超过10,000家知名企业客户,覆盖游戏竞技、AIGC、广电传媒、金融、泛零售、娱乐社交等行业。走在大模型技术与应用迭代前线的月之暗面、智谱、MiniMax、阶跃星辰都是网易易盾的合作伙伴;有AI“四小龙”之称的云从科技与网易易盾在国家网安基地大模型训推一体化项目中实现了强强合作。从坐稳国内数字内容安全厂商的头把交椅,到快速在AIGC时代抢跑成为AI内容风控的第一厂商,网易易盾是如何在9年时间里实现跨越式发展的?
起步阶段:
聚焦内容安全这一核心,持续夯实技术底座
最初,网易易盾只是服务网易公司内部的一支安全团队,经过长期的内部锤炼和技术钻研,于2016年开始正式对外输出包括文本、图像、视频等内容的审核能力,解决了当时社交、传媒等行业的UGC合规痛点。在这一阶段,网易易盾完成了首批游戏、电商客户的积累,并通过反复的创新性的尝试,验证了“AI+人工”协同审核模式的有效性。
成熟阶段:
不断拓展业务边界,构建起四大安全领域矩阵
从内容安全出发,网易易盾锚定“为企业数字化业务提供数字内容风控服务”的大方向,打造出包含内容安全、业务安全、应用安全和安全专家服务的核心业务矩阵。
内容安全:包括AI内容检测、人工审核服务、智能审核系统等,提供针对文本、图像、音频、视频内容的实时检测服务,助力内容合规、内容质量提升。
业务安全:包括智能风控、行为验证码、身份核验等服务,可以提供针对业务安全的全面防护,从风险防控、业务合规、用户体验、运营效率等维度为客户提供覆盖账号、交易、营销、运营全场景的智能业务风控解决方案。
应用安全:包括应用检测、安全加固等,覆盖从开发至上线运营的全生命周期,提供可靠、优质的安全加固及应用合规检测服务。
安全专家服务:包括算法备案、大模型备案、安全语料、安全培训、安全舆情等专家服务。
网易易盾致力于全方位保障客户业务合规、稳健和安全运营。
升级阶段:
锚定AIGC安全,打造新的增长曲线
AI时代,风险类别的演变正不断加速,从过去单纯的内容合规,扩展到如今多元化的虚假信息治理和侵权治理,覆盖面更广、复杂性更高,AI治理的重要性和必要性凸显。以“AI对抗AI”成为解决之道。
从网易易盾的角度,正不断加大面向AI治理的安全策略和产品能力研发,尤其是在安全大模型、CMA审核智能体等领域尝试更多的可能性。通过产品升级,网易易盾实现了基于AI审核平台和AI模型自训练平台的“内容双筛”。同时,网易易盾还加强了对垂类应用场景的产品研发投入,例如未成年人AI保护解决方案等。另外,网易易盾还推出了大模型测评、安全代答等增值服务。
如今,网易易盾将大模型安全、AIGC内容合规等作为核心的演进方向,推出“内生安全+围栏防护”双维体系,跑在AI时代的前面。纵观AI安全的发展,从风险拦截转向安全赋能是大势所趋。帮助企业在合规前提下推进AI创新,这既是市场的需要,也是网易易盾的发展目标。
他们为什么选择了网易易盾?
网易易盾9年3278天的实时守护、157万小时的内容清朗安全,换来的是客户的安心和笑容:月之暗面安全中心负责人称赞“易盾同学7×24小在线营业,把风险按在地上摩擦”;理想汽车大模型安全部负责人佩服“无论规则如何变化,易盾总是第一个更新方案,确保业务零事故运行”;唯品会首席安全官深刻“感受到了易盾在内容安全领域的专业能力和负责态度,有紧急需要时,总能第一时间响应支持,为我司AIGC业务提供扎实的安全保障”……
到底是什么让各行各业的用户坚定地选择了网易易盾?
是网易易盾的战略眼光。网易易盾自2012年起便持续投入AI领域研发,积累了丰富的技术与内容安全经验。近年来,网易易盾在行业内较早布局AIGC安全赛道,并针对大模型从训练、生成到传播的全流程设计了“安全语料过滤+生成内容审核+合规备案服务”。技术的发展需要标准来驱动和规制。深谙此理的网易易盾主撰或参编了《人工智能安全治理框架》2.0版、《向未成年人提供生成式人工智能服务安全指引》等多份国标、团标,将政策要求转化为产品能力,帮助客户规避合规风险。网易易盾懂技术更懂运营,通过提供7×24小时人工审核协同、定制化舆情报告、蓝军渗透测试等服务,清除AI识别的模糊地带。
是9年时间锻造的硬核技术实力。在技术上,网易易盾不断攻坚克难,累计获得10余项AI赛事冠军,并荣获国家知识产权局第23届中国专利奖、浙江省科学技术进步奖一等奖等,在文本、图像、音频、视频多模态检测中,其产品的准确率与响应速度行业领先,并且在行业内率先发布安全大模型。另外,网易易盾聚焦数据与场景,依托网易20余年在游戏、社交、传媒等内容场景中的积累,年检测数据量超数万亿、处理移动安全风险超2100亿次,打造出行业专属风险模型,比如游戏行业反外挂、金融行业客户资料审核等。
是深耕行业应用领域,打造场景化解决方案的底气。网易易盾始终聚焦行业用户的痛点,“对症下药”,提供与垂直行业需求深度适配的解决方案。举例来说,针对游戏全生命周期风控,提供了反外挂、未成年人防沉迷、游戏社区内容治理等服务。雷霆游戏的内容安全负责人就表示,网易易盾用9年时间将“安全”二字刻进了每一次服务中。针对娱乐社交行业,网易易盾能够有效解决诸如AIGC合规、用户资料审核、低质直播治理等问题。总之,面向垂直行业客户,网易易盾具有提供规模化服务的能力,可快速复制成熟方案至新行业,同时支持定制化开发。
是品牌的美誉度与生态协同的优势使然。作为网易旗下的安全品牌,网易易盾一方面依托集团技术的背书,另一方面通过自身9年的坚守、创新与磨炼,逐渐成为许多AIGC企业,包括大模型厂商、内容平台的首选安全合作伙伴。
不可否认,安全是一个拥有高壁垒的行业。技术是看得见的壁垒,AI技术的引入,对于安全的演进既是促进更是挑战;而经验、合规和信任则是看不见的壁垒,这需要安全厂商经过长时间细致的运营,不断沉淀经验,更深度地理解政策。9年历练,网易易盾通过技术的创新迭代、经验的积累,合规方面实践的打磨,赢得了行业用户的信任,筑就了作为数字内容风控领先者的壁垒。
超越传统数字内容安全
AI时代,市场的不确定性、风险的不确定性日益增加,这就更要求安全具有更高的确定性。可以预见,AIGC技术未来将持续渗透千行百业,而安全需求相应地将从被动防御转向主动预判。网易易盾提出的全链路风控模式将成为行业主流。
作为AI安全的“护航员”,网易易盾在技术端将不断深化大模型安全技术,比如AI生成内容隐性标识、端侧模型防护等;在应用端,将不断开拓央国企AI等新场景;在生态建设上,将持续强化“安全+行业”的生态协作。
9年沉淀,网易易盾已超越单纯的安全服务商定位,成为企业AIGC转型的关键合规伙伴。未来9年乃至更加长远,网易易盾将以“技术不妥协、合规不打折、服务不缺位”的差异化,持续领跑数字内容风控赛道。
