7家财经媒体集体“划线”：AI生成内容时代，使用媒体内容的边界在哪里？-陈敏毅-华律网

这句话看似针对AI公司的后台技术，但其实与普通用户日常使用AI的体验密切相关。现在使用AI软件搜索问题时，系统常会标注“来源于某公众号”“来源于某官网”，有时还会直接整理出摘要、观点甚至完整结论。用户看到的是“AI帮我找到了答案”，但内容机构真正关心的是：这篇文章在背后到底被怎么用了。

7家媒体这次真正要划清的，不是“AI能不能检索或提及媒体内容”，而是：AI平台能不能在未经授权的情况下，通过抓取、解析、向量化等技术手段，把媒体原创内容变成自身的回答能力、搜索能力、训练材料和商业产品。

鉴于此，我们有必要从以下几方面厘清AI使用的法律边界：

一、标注来源不等于取得授权

AI搜索、引用功能通常表现为：用户提出问题后，AI生成答案，并标注信息来自某个网站、公众号或新闻页面。这个动作本身不能直接认定为侵权，但也不能因为标注了来源，就理解为已经取得授权。

这里需要区分两种情况。一种更接近传统搜索，即系统只是提供链接、简短片段或者来源提示，主要作用是帮助用户找到原文；另一种更接近AI检索增强生成，即系统先从网页、知识库或者索引库中检索内容，再由模型整理、概括并生成答案。前者偏向导流，后者则可能已经对原文内容进行了提取、组织和再表达。

AI产品通常具有商业属性。即使用户免费使用，平台也可能通过用户停留、广告展示、会员转化、API调用、企业服务、数据沉淀、模型优化等方式获得商业价值。当第三方媒体内容被用来提升AI回答质量、增强用户停留、形成后续转化时，就已经不只是个人阅读场景。

但商业使用并不当然等于侵权。法律保护的不是所有信息，而是具有独创性并能以一定形式表现的智力成果。单纯事实消息不适用著作权法保护，但媒体围绕事实形成的报道文字、标题表达、采访整理、专题策划、数据图表、研究分析等，如果具有独创性，就可能受到保护。因此，关键不在于AI有没有标注来源，而在于它使用的是事实信息还是原创表达，是帮助用户找到原文，还是替代用户阅读原文。

二、AI训练不只是“读取内容”

7家媒体声明中提到的“机器学习、数据挖掘、大模型训练、文字转音视频”，指向的不是普通阅读，也不是简单标注来源，而是更深层次的内容利用。

大模型训练通常涉及批量抓取、复制、清洗、切分、标注、向量化，并纳入预训练、微调、模型优化或者行业模型建设流程。内容一旦进入这个链条，就不再只是被“读取”，而是可能被转化为模型的回答能力、摘要能力、写作能力和分析能力。

机器学习可能包括推荐算法、分类模型、舆情模型、投研分析模型、智能问答系统等；数据挖掘可能表现为从报道中提取公司名称、人物关系、市场事件、行业趋势、观点判断，并整理成数据库、知识图谱或者投研标签；文字转音视频，则是把媒体文章改写成短视频脚本、AI播报、数字人讲解、课程材料或者行业报告。

这些行为的共同点在于：媒体内容不再只是被阅读，而是被转化为AI产品的训练材料、知识材料、分析材料或者内容生产材料。一旦涉及受保护的原创表达，并发生复制、汇编、改编、信息网络传播等行为，就可能落入著作权人的权利控制范围。生成式AI相关监管规则也要求，训练数据应当具有合法来源，涉及知识产权的，不得侵害他人依法享有的权利。

三、内容价值不能被无偿吸收

媒体之所以禁止这些行为，并不是因为“AI不能用内容”，而是因为这类使用可能改变内容价值的归属。

传统转载时代，侵权通常表现为整篇搬运、摘编、洗稿；AI时代，内容可能不再以原文形式出现，而是被训练、挖掘、摘要、改写、转成音视频，最后变成AI产品的能力。内容没有被完整复制，并不代表内容价值没有被利用。

这会带来三个现实问题：内容生产者的投入可能被无偿吸收；原文阅读可能被AI问答、摘要或者报告替代；授权市场也可能被绕开。如果AI企业可以默认抓取、训练、转化内容，媒体未来与AI企业谈数据授权、内容合作、收益分配的空间就会被压缩。

实务建议

1 内容生产者：不要只写“禁止转载”

第二，原创证据要提前固定。首发记录、后台发布记录、编辑修改痕迹、原始素材、采访材料、图片原图、数据整理过程、作者授权或职务作品安排，都应当留存。

第三，对外授权要分场景约定。是否可以训练模型、是否可以进入知识库、是否可以生成摘要报告、是否可以转音视频、是否可以商业化输出、是否可以再授权，都应当写清楚。

2 AI企业：公开网页≠默认授权

第一，先审查数据来源。公开网页、第三方采购数据、合作机构数据、用户上传内容，对应的权利基础不同，不能混同处理。

第二，按使用方式分层管理。搜索导流、检索增强、知识库建设、模型训练、内容转化，风险层级不同；越接近训练、入库、长期调用和商业输出，越需要取得明确授权。

第三，合同要写清授权边界。授权内容范围、使用目的、使用期限、能否训练、能否入库、能否生成报告或音视频、能否商业化、能否再授权、超范围使用责任，都要明确。

第四，做好合规留痕。数据来源、授权文件、入库时间、使用场景、输出方式、删除机制，都应当有记录。

3 普通企业：用AI生成，需审素材来源

第一，能阅读，不代表能入库。员工可以看文章，不代表企业可以把文章导入AI系统、内部知识库或智能客服。

第二，能引用，不代表能改写成商业材料。少量引用和注明来源，不等于可以改写成企业宣传材料、商业报告、课程内容或客户交付文件。

第三，AI生成，不代表没有侵权风险。发布前应当检查输出内容是否大量复现他人文章表达、结构、图表或核心观点。

第四，内部要定使用规则。哪些素材只能阅读，哪些可以引用，哪些不能导入知识库，哪些不能用于对外宣传或客户交付，建议提前明确。

律师介绍

陈敏毅律师

广东法丞汇俊（白云）律师事务所律师

南开大学法律硕士，从事法律工作二十年，有较丰富的审判、仲裁和诉讼代理经验，专长于民事、合同法、房地产法、公司法及相关人事劳动制度建设。

【社会职务】

● 最高人民法院诉讼服务专家志愿者

● 广州市律师协会企业法律顾问专业委员会委员

● 深圳大学法学院校友会广佛分会副会长

● 广州市新的社会阶层人士联谊会理事

● 东莞市莞城新的社会阶层人士联合会会员

● 广州市白云区劳动仲裁委劳动仲裁员

● 揭阳仲裁委员会委员

● 汕尾仲裁委员会委员

● 北海仲裁委员会委员