金十数据12月30日讯,“deepseek-v3超越了迄今为止所有开源模型。”这是国外独立评测机构artificial analysis测试了deepseek-v3后得出的结论。更重要的是,该模型使用英伟达h800 gpu在短短两个月内就训练出了deepseek-v3,仅花费了约558万美元。然而,在使用过程中,记者发现,deepseek-v3竟然声称自己是chatgpt。一时间,“deepseek-v3是否在使用chatgpt输出内容进行训练”的质疑声四起。techcrunch猜测称,深度求索可能用了包含gpt-4通过chatgpt生成的文本的公共数据集。“如果deepseek-v3是用这些数据进行训练的,那么该模型可能已经记住了gpt-4的一些输出,现在正在逐字反刍它们。”不过,deepseek-v3也并非是第一个错误识别自己的模型,谷歌的gemini等有时也会声称是竞争模型。例如,gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于,ai公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用ai生产出来的数据。
背景
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型deepseek-v3首个版本上线并同步开源。随后因其性能及训练成本等在ai届不断被圈内大佬“刷屏”。
风险提示及免责条款:市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。