乐鱼体育官方网站LEYU SPORTS[永久网址:363050.com]是一家线上综合娱乐集团,全球最大线上体育娱乐服务商。乐鱼拥有乐鱼体育,LEYU乐鱼体育官方网站,乐鱼体育靠谱吗,乐鱼体育app,乐鱼体育官网,“欧洲马耳他mga”颁发的合法执照,是受国际认可的合法公司。欢迎注册!特朗普提名的商务部长Howard Lutnick今天下午出席美国国会参议院能源和商务委员会对他的提名确认听证。这两天DeepSeek在美国关注度这么高,我想这可能会是听证会上的重要话题,就全程听了下。
不出所料,好几位参议员向Lutnick提出了DeepSeek问题,Lutnick的回应十分强硬,基本上认定是DeepSeek窃取了美国的技术,而且Meta和英伟达等美国公司变相给他们提供了机会。他觉得这事凸显了美国的出口管制的一大不足:没有和关税搭配着来,成了“打地鼠”的游戏。如果他上来了一定会严格实施限制措施和执行,确保美国领先。
同一天,“知情人士”根彭博社透露,特朗普政府正在考虑对H20芯片(英伟达最新“版”中国的GPU)实施出口管制。媒体问了英伟达,英伟达没有否认这个事,说“愿意配合政府,以便政府实施自己的AI政策”。
如果看过两天前我写的“”,应该能记得我当时曾警示:“目前H20等不受控的GPU执行推理任务表现出色甚至优于H100,如果DeepSeek事件促使美国政府不仅卡中国模型训练,也想要限制推理,对中国禁运H20也不无可能。”很不幸一语成谶,拜登政府时期没做成的事,怕要在受了DeepSeek刺激的特朗普政府执政初期实现了。2024 年中国市场H20芯片出货量大概是70 万枚,每季度销量环比增长达 50%,说明国内需求还是挺大的,需要未雨绸缪。
委员会首席议员、人Maria Cantewell开场发言上来就说了DeepSeek,强调这凸显了美国出口管制的问题,希望Lutnick能够改善BIS的工作,加强对中国的出口管制,维护美国科技优势。
Lutnick说,要防止再发生DeepSeek这种事,美国公司必须停止帮助中国。Meta 的开放平台让DeepSeek利用了它们的生态。DeepSeek买了大量的英伟达芯片,并找到了规避限制的方法,才实现了发展。这一切必须结束。如果他们要和我们竞争,那就让他们竞争,但不能再用我们的工具来对抗我们。
参议员Todd Young问Lutnick,美国投资科技来之不易的成果被泄密,知识产权泄露给了敌对国家和实体,你怎么保持警惕防范这种情况?Lutnick主动说:是啊,还有什么比中国的人工智能公司DeepSeek更说明这个问题的紧迫,他们通过获取、偷窃或借鉴我们的东西,用极低成本创造成果,这太过分了,必须解决。
另一个参议员问,DeepSeek的模型据称是用一批不受出口管制限制的旧一代芯片训练出来的,成本比美国模型少得多。不管中国是怎么做到的,他们可能并没有我们想象的那么落后。你当了商务部长后怎么确保美国赢得和中国的人工智能竞赛?Lutnick说,这说明我们的出口管制,如果没有关税支持,就像打地鼠游戏一样,在这限制了,他们又会在那想办法绕过限制。必须用关税模式来支持出口管制,这样就能告诉中国,当美国说不的时候,那就必须是不。这关乎尊重。中国不尊重我们,还想办法绕过限制。我不相信DeepSeek的成果是完全正当获得的。这太荒谬了。他们偷窃、非法获取,拿走了我们的知识产权。这种情况必须停止。我会严格推行限制措施并确保其得到执行,让美国保持领先,美国必须领先。
有参议员问,你怎么看美国用户的模型托管在中国服务器上,以及模型被逆向工程的风险。这个其实关乎知识产权。你能说说怎么打算保护美国的知识产权吗?Lutnick说,得让中国明白,如果你们不尊重我们公司的知识产权,就别指望你们的公司在美国享受同样的待遇,“对等”很重要。这个参议员还问,你是搞金融出身,DeepSeek的母公司是一家对冲基金,我在调查它,你觉得前两天美国公司市值的损失是中国在做空我们吗?Lutnick说,我不知道,但很值得查一下。
有参议员问,怎么对DeepSeek这样的事追究中国的责任?我们也希望和中国建立有效的关系,但如果没有问责机制,这根本无法实现。Lutnick回答说:最好的办法就是“对等”(Reciprocity)。中国如怎么对我们,我们也怎么对他们。我们对中国太纵容了,他们在中国市场肆意剥夺我们的权利,我们却允许他们在美国畅通无阻地利用我们。这种状况必须改变。本届政府应该不断强调“对等”原则:要是中国不尊重我们的规则,我们也不用对他们客气。
OpenAI指责DeepSeek蒸馏他们的模型侵犯了其知识产权,白宫的人工智能政策顾问David Sacks也在一边呼应。“模型蒸馏”是否构成知识产权的“合理使用”,是个很有意思的问题。我今天请教了一些知识产权法的专家,但没有获得特别准确权威的结论。
“模型蒸馏”的过程就像是“老师带学生”,让一个轻量级的 AI(“学生模型”)学会大模型(“教师模型”)的本领,达到接近的能力,但计算量更小、运行更快。这个过程中,研究人员准备大量的数据(比如问题、句子、代码等),先喂给大模型,让它生成标准答案,给“学生模型”作为学习目标。“学生模型”拿到相同的问题,尝试自己回答。训练过程会对比:1)“学生模型”的回答 vs. “教师模型”的回答(越相似,学习效果越好);2)“学生模型”的置信度 vs. “教师模型”的置信度(模仿老师的信心分布)。通过反复训练,让学生逐渐“学会”老师的回答风格和思维方式。
目前全球范围内关于大模型的知识产权争端主要是围绕训练数据(文本、图像)本身的版权侵权争议,例如“训练数据爬取是否构成侵犯版权”、“AI 生成内容的版权归属”、“API 滥用是否违反服务条款”等等,法院司法实践有Getty Images诉Stability AI案等著名案例。但印象中几乎没人提出过“蒸馏模型内部知识”算不算侵权的问题,也没有任何法院就这种情况给过司法裁决。
我不是知产法的专家,如果讲错了欢迎专业的读者们留言拍砖。据我的理解,版权法更多保护“可表达的内容”(如代码、文字、图像本身),而不保护“算法、功能”或“抽象的知识”,AI模型本身通常不受传统版权法保护。如果在蒸馏过程中,“学生模型”没有获取或复制”教师模型“的模型权重、源代码、专有训练数据,而只是基于”大模型”的“输出”来训练学生模型,恐怕很难构成对版权作品的“实质性复制 (substantial copying)”。
但某些情况下,闭源的“大模型”受到API服务条款或商业秘密保护,如果“蒸馏”错在“超范围使用API”、“违反保密义务”或“违规获取对方的非公开信息”,可能会导致其他形式的侵权。比如OpenAI的使用协议里明确规定:“试图或协助任何人对我们的服务(包括我们的模型、算法或系统)进行逆向工程、反编译或发现其源代码或底层组件(但适用法律禁止该限制的情况除外)。”Llama 2的社区许可证协议(LLAMA 2 Community License Agreement)也规定:“被许可人不得使用 Llama 材料或任何输出或Llama 材料的结果来改进任何其他大型语言模型(不包括 Llama 2 或其派生作品)。”
但即便DeepSeek属于这种情况,违反的也应该是合同法,触发的是违约行为,和版权法没关系。如果在蒸馏过程中,有人从内部获取并利用了原厂商的非公开模型权重、算法细节或训练数据,属于“商业秘密盗用”或“不正当竞争”。
但抛开是不是侵犯版权的问题不说,就像David Sacks说的,OpenAI等美国公司下一步很可能会想办法限制中国公司蒸馏他们的模型。美国政府应该也会研究怎么通过法律来禁止,比如考虑对美国AI公司施加类似反洗钱领域“了解你的客户”(KYC)要求,让他们监测和报告中国公司的“模型蒸馏”行为。但这个实际实施难度很大,Llama和Mistral 的模型,都可以免费下载并在私有化部署的数据中心使用,就算有蒸馏也很难发现。
再就是像一些行业专家比喻的,大模型公司之间相互进行模型蒸馏很常见,就像汽车厂商会买来对方的发动机拆解研究一样,本来就是一种市场竞争的手段。Hugging Face 联合创始人兼 CTO Julien Chaumond 也觉得“模型蒸馏”能避免大家重复造轮子,提高效率和降低资源消耗,促进AI技术普及应用,禁止“模型蒸馏”可能会阻碍技术创新,影响AI 生态系统的健康成长。
文章仅做学术探讨和市场研究交流使用,相关判断不代表任何公司或机构立场,也不构成任何投资建议。转载请注明来源。Lutnick任命确认听证会证词、重要涉华内容实录、关于模型蒸馏知识产权问题的相关分析参见知识星球。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
意外发现了饿两顿定律,体重从137到99斤,你也能做到
看傻了!两广人民清明祭祖有多硬核,找祖坟像野外生存挑战,最后拜错坟好多年...
茶饮市场批量上新“明前龙井”!有品牌二手平台一箱溢价高达67%,线下缺货
科技行业从业人士,全球化智库高级研究员(非常驻),科技政策和全球数字治理的长期观察者。
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
@BETHASH6