deepseek-8846威尼斯

deepseek-v3自称chatgpt？真相或指向“ai污染”

金十数据12月30日讯，“deepseek-v3超越了迄今为止所有开源模型。”这是国外独立评测机构artificial analysis测试了deepseek-v3后得出的结论。更重要的是，该模型使用英伟达h800 gpu在短短两个月内就训练出了deepseek-v3，仅花费了约558万美元。然而，在使用过程中，记者发现，deepseek-v3竟然声称自己是chatgpt。一时间，“deepseek-v3是否在使用chatgpt输出内容进行训练”的质疑声四起。techcrunch猜测称，深度求索可能用了包含gpt-4通过chatgpt生成的文本的公共数据集。“如果deepseek-v3是用这些数据进行训练的，那么该模型可能已经记住了gpt-4的一些输出，现在正在逐字反刍它们。”不过，deepseek-v3也并非是第一个错误识别自己的模型，谷歌的gemini等有时也会声称是竞争模型。例如，gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于，ai公司在互联网上获取大量训练数据，但是，现如今的互联网本就充斥着各种各样用ai生产出来的数据。

注解

背景

12月26日，深度求索官方微信公众号推文称，旗下全新系列模型deepseek-v3首个版本上线并同步开源。随后因其性能及训练成本等在ai届不断被圈内大佬“刷屏”。

风险提示及免责条款：市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

金十数据