陈敏毅律师
陈敏毅律师
华律网对所有展示的律师实行严格的 四重认证,确保真实可靠:
1)实名与人脸识别:律师本人需完成实名验证及人脸比对;2)执业证照核验:上传的执业证照片经人工与系统双重审核;3)官方执业信息核验:通过官方渠道对其执业证号进行核实;4)手机号验证:绑定手机号并通过验证码完成本人校验。
广东-广州
13560411118查看服务地区

服务地区:广州、韶关、深圳、珠海、汕头、佛山、江门...

咨询我
09:00-21:59

7家财经媒体集体“划线”:AI生成内容时代,使用媒体内容的边界在哪里?

作者:陈敏毅律师时间:2026年05月13日分类:律师随笔浏览:107次举报
2026-05-13

近日,7家主流财经媒体集中发布或更新版权声明,明确提出:未经书面许可,不得将本单位原创内容用于机器学习、数据挖掘、大模型训练、文字转音视频等人工智能应用场景。

这句话看似针对AI公司的后台技术,但其实与普通用户日常使用AI的体验密切相关。现在使用AI软件搜索问题时,系统常会标注“来源于某公众号”“来源于某官网”,有时还会直接整理出摘要、观点甚至完整结论。用户看到的是“AI帮我找到了答案”,但内容机构真正关心的是:这篇文章在背后到底被怎么用了。

7家媒体这次真正要划清的,不是“AI能不能检索或提及媒体内容”,而是:AI平台能不能在未经授权的情况下,通过抓取、解析、向量化等技术手段,把媒体原创内容变成自身的回答能力、搜索能力、训练材料和商业产品。

鉴于此,我们有必要从以下几方面厘清AI使用的法律边界:

一、标注来源不等于取得授权

AI搜索、引用功能通常表现为:用户提出问题后,AI生成答案,并标注信息来自某个网站、公众号或新闻页面。这个动作本身不能直接认定为侵权,但也不能因为标注了来源,就理解为已经取得授权。

这里需要区分两种情况。一种更接近传统搜索,即系统只是提供链接、简短片段或者来源提示,主要作用是帮助用户找到原文;另一种更接近AI检索增强生成,即系统先从网页、知识库或者索引库中检索内容,再由模型整理、概括并生成答案。前者偏向导流,后者则可能已经对原文内容进行了提取、组织和再表达。

AI产品通常具有商业属性。即使用户免费使用,平台也可能通过用户停留、广告展示、会员转化、API调用、企业服务、数据沉淀、模型优化等方式获得商业价值。当第三方媒体内容被用来提升AI回答质量、增强用户停留、形成后续转化时,就已经不只是个人阅读场景。

但商业使用并不当然等于侵权。法律保护的不是所有信息,而是具有独创性并能以一定形式表现的智力成果。单纯事实消息不适用著作权法保护,但媒体围绕事实形成的报道文字、标题表达、采访整理、专题策划、数据图表、研究分析等,如果具有独创性,就可能受到保护。因此,关键不在于AI有没有标注来源,而在于它使用的是事实信息还是原创表达,是帮助用户找到原文,还是替代用户阅读原文。

二、AI训练不只是“读取内容”

7家媒体声明中提到的“机器学习、数据挖掘、大模型训练、文字转音视频”,指向的不是普通阅读,也不是简单标注来源,而是更深层次的内容利用。

大模型训练通常涉及批量抓取、复制、清洗、切分、标注、向量化,并纳入预训练、微调、模型优化或者行业模型建设流程。内容一旦进入这个链条,就不再只是被“读取”,而是可能被转化为模型的回答能力、摘要能力、写作能力和分析能力。

机器学习可能包括推荐算法、分类模型、舆情模型、投研分析模型、智能问答系统等;数据挖掘可能表现为从报道中提取公司名称、人物关系、市场事件、行业趋势、观点判断,并整理成数据库、知识图谱或者投研标签;文字转音视频,则是把媒体文章改写成短视频脚本、AI播报、数字人讲解、课程材料或者行业报告。

这些行为的共同点在于:媒体内容不再只是被阅读,而是被转化为AI产品的训练材料、知识材料、分析材料或者内容生产材料。一旦涉及受保护的原创表达,并发生复制、汇编、改编、信息网络传播等行为,就可能落入著作权人的权利控制范围。生成式AI相关监管规则也要求,训练数据应当具有合法来源,涉及知识产权的,不得侵害他人依法享有的权利。

三、内容价值不能被无偿吸收

媒体之所以禁止这些行为,并不是因为“AI不能用内容”,而是因为这类使用可能改变内容价值的归属。

传统转载时代,侵权通常表现为整篇搬运、摘编、洗稿;AI时代,内容可能不再以原文形式出现,而是被训练、挖掘、摘要、改写、转成音视频,最后变成AI产品的能力。内容没有被完整复制,并不代表内容价值没有被利用。

这会带来三个现实问题:内容生产者的投入可能被无偿吸收;原文阅读可能被AI问答、摘要或者报告替代;授权市场也可能被绕开。如果AI企业可以默认抓取、训练、转化内容,媒体未来与AI企业谈数据授权、内容合作、收益分配的空间就会被压缩。


实务建议

1 内容生产者:不要只写“禁止转载”

第一,版权声明要覆盖AI场景。除“未经许可不得转载”外,建议明确写入:未经书面许可,不得用于机器学习、数据挖掘、大模型训练、检索增强知识库、智能问答、摘要生成、报告生成、文字转音视频等AI应用场景。

第二,原创证据要提前固定。首发记录、后台发布记录、编辑修改痕迹、原始素材、采访材料、图片原图、数据整理过程、作者授权或职务作品安排,都应当留存。

第三,对外授权要分场景约定。是否可以训练模型、是否可以进入知识库、是否可以生成摘要报告、是否可以转音视频、是否可以商业化输出、是否可以再授权,都应当写清楚。


2 AI企业:公开网页≠默认授权

第一,先审查数据来源。公开网页、第三方采购数据、合作机构数据、用户上传内容,对应的权利基础不同,不能混同处理。

第二,按使用方式分层管理。搜索导流、检索增强、知识库建设、模型训练、内容转化,风险层级不同;越接近训练、入库、长期调用和商业输出,越需要取得明确授权。

第三,合同要写清授权边界。授权内容范围、使用目的、使用期限、能否训练、能否入库、能否生成报告或音视频、能否商业化、能否再授权、超范围使用责任,都要明确。

第四,做好合规留痕。数据来源、授权文件、入库时间、使用场景、输出方式、删除机制,都应当有记录。


3 普通企业:用AI生成,需审素材来源

第一,能阅读,不代表能入库。员工可以看文章,不代表企业可以把文章导入AI系统、内部知识库或智能客服。

第二,能引用,不代表能改写成商业材料。少量引用和注明来源,不等于可以改写成企业宣传材料、商业报告、课程内容或客户交付文件。

第三,AI生成,不代表没有侵权风险。发布前应当检查输出内容是否大量复现他人文章表达、结构、图表或核心观点。

第四,内部要定使用规则。哪些素材只能阅读,哪些可以引用,哪些不能导入知识库,哪些不能用于对外宣传或客户交付,建议提前明确。


律师介绍

陈敏毅 律师

广东法丞汇俊(白云)律师事务所律师

南开大学法律硕士,从事法律工作二十年,有较丰富的审判、仲裁和诉讼代理经验,专长于民事、合同法、房地产法、公司法及相关人事劳动制度建设。

【社会职务】

● 最高人民法院诉讼服务专家志愿者

● 广州市律师协会企业法律顾问专业委员会委员

● 深圳大学法学院校友会广佛分会副会长

● 广州市新的社会阶层人士联谊会理事

● 东莞市莞城新的社会阶层人士联合会会员

● 广州市白云区劳动仲裁委劳动仲裁员

● 揭阳仲裁委员会委员

● 汕尾仲裁委员会委员

● 北海仲裁委员会委员


陈敏毅律师现为广东法丞汇俊(白云)律师事务所律师 南开大学法律硕士,从事法律工作二十年,有较丰富的审判、仲裁和诉讼代理... 查看详细 >>
  • 执业地区:广东-广州
  • 执业单位:广东法丞汇俊(白云)律师事务所
  • 执业证号:1440120********50
  • 擅长领域:房产纠纷、合同纠纷、刑事辩护、婚姻家庭、继承
广东法丞汇俊(白云)律师事务所
1440120********50 房产纠纷、合同纠纷、刑事辩护、婚姻家庭、继承