beijing.centuple.com.cn/746532
《j9九游真人游戏第一平台》一款专业的原创阅读平台,里面有很多原创小说等着你阅读哦。是你绝对不能错过的热门手机网游,每日上万在线,验真正的燃魂国战!这里有雪花白银,美女宠物,便捷挂机,让你一键轻松玩转!j9九游真人游戏第一平台 7.6.8增加了以下玩法的延伸玩法羽化保底符功能法宝吞噬升阶功能坐骑培养升阶功能装备洗练功能j9九游真人游戏第一平台 8.9.781.提供了更多的个性化设置选项,让用户可以更好地定制自己的体验。2.新增了「暂停下载」功能,方便您控制下载任务。3.增加了教程和提示,帮助用户更好地使用应用。4.优化了照片编辑功能,增加了更多的滤镜和工具。5.添加了密码保护功能,保护您的隐私数据。6.优化了元神加成j9九游真人游戏第一平台 7.4.2:新增了「阅读模式」,提供更好的阅读体验。j9九游真人游戏第一平台 7.7.1:增加了社交分享功能,用户可以轻松地与朋友分享他们在应用中的活动。j9九游真人游戏第一平台 32.65.45 中的新功能1. 照片备份:支持自动照片备份功能,用户可以将拍摄的照片自动上传到云端,防止数据丢失,并可以随时访问和分享。。2. 阅读模式:支持阅读模式,优化屏幕亮度和颜色,减轻眼睛疲劳,适合在长时间阅读电子书和文章时使用。3. 闹钟:内置多功能闹钟,支持多种铃声和振动模式,用户可以设置多个闹钟提醒,适用于不同的时间和场合。4. 自动更新功能:支持自动更新功能,用户可以设置应用和系统的自动更新,确保始终使用最新版本,提升安全性和功能体验。5. 应用锁:内置应用锁功能,用户可以为特定的应用设置密码或指纹解锁,保护隐私和数据安全,防止他人未经授权使用。6. 百科全书:内置百科全书应用,用户可以随时查阅各类知识和信息,提升学习和信息获取的便捷性。7. 音乐播放器:内置高质量音乐播放器,支持多种音频格式和播放模式,提供出色的音质和丰富的音乐体验。8. 语音搜索:支持语音搜索功能,用户可以通过语音指令快速查找信息、启动应用和设置功能,提升手机的操作便捷性。9.增应用锁:内置应用锁功能,用户可以为特定的应用设置密码或指纹解锁,保护隐私和数据安全,防止他人未经授权使用。j9九游真人游戏第一平台 7.3.10:引入了事件提醒功能,及时提醒您重要的日程安排。j9九游真人游戏第一平台 4.5.5 中的新功能1.节能模式:支持节能模式,优化系统和应用的耗电情况,延长电池续航时间,适合在电量不足时使用。2.快速应用启动:内置快速应用启动功能,用户可以通过快捷方式和手势快速打开常用应用,提高操作效率。3.智能停车支付:支持智能停车支付功能,用户可以通过手机快速支付停车费用,方便快捷,减少寻找停车缴费点的麻烦。4.反向查找功能:支持反向查找功能,用户可以通过手机快速找到遗失的物品,如钥匙、钱包等,提升生活便利性。j9九游真人游戏第一平台 4.8.0 中的新功能开放了新的玩法增加了新的活动j9九游真人游戏第一平台 5.0.0 中的新功能1.坐骑装备开启熔炼系统2.新增宠物装备3.注魂功能优化4.心法进阶调整5.跨服2v2,5v5开启6.增加屏蔽私聊选项7.优化真实伤害属性的计算公式,造成的真实伤害更高8.修复了部分已知bugj9九游真人游戏第一平台 7.5.9 中的新功能1.新增飞升异闻录系统2.新增经验雨系统3.宠物装备属性整体优化加强4.心法特殊属性加强,伤害属性加强5.矿战奖励、申请攻打矿战费用提高6.祝福丹每日使用次数上限增加为10次7.仙婴装备等级提升至20级j9九游真人游戏第一平台 8.9.7 中的新功能1.新增宠物收藏系统,更高战力来袭.2.新增跨服神魂大乱斗.3.鲜血跨服开启时间调整.4.修复了已知的导致闪退的问题.5.优化了部分系统体验.6.修复了一些已知的漏洞和稳定性问题,提高了应用的可靠性。j9九游真人游戏第一平台 20.02.95 中的新功能1、新增仙装彩蛋重置功能;2、新增神石系统,挑战更强属性;3、新增神石跨服交易功能;4、新增装备翅膀羽化星级提升;5、优化了飞升秘闻录显示内容;6、修复了部分可能导致闪退的bug.j9九游真人游戏第一平台 7.2.5 中的新功能本次更新内容:一.录屏功能:内置录屏功能,用户可以录制屏幕上的操作过程,方便制作教程、分享游戏攻略和记录重要操作。2.智能搜索:内置智能搜索功能,支持语音、文字和图片搜索,用户可以快速找到所需的信息、应用和文件,提升使用效率。二.夜间模式:内置夜间模式,调整屏幕色温和亮度,减少蓝光辐射,保护眼睛,适合在夜间或低光环境下使用。2.书籍阅读器:内置电子书阅读器,支持多种电子书格式,提供舒适的阅读体验,适合在闲暇时光阅读和学习。3.GPS导航:内置多功能GPS导航系统,支持多种导航模式和地图应用,提供精准的定位和实时路线规划,适合驾车、步行和骑行导航。三.深度学习算法:内置深度学习算法,支持智能拍照、语音识别、个性化推荐等多种功能,提升手机的智能化水平和用户体验。j9九游真人游戏第一平台 32.65.45 中的新功能7.1.4版本更新内容介绍:1.增加了教程和提示,帮助用户更好地使用应用。、引入了游戏化元素,增加了应用的趣味性。.2.优化了推送通知,减少了打扰。3.引入了社区功能,让用户之间可以交流和分享。4.优化了照片编辑功能,增加了更多的滤镜和工具。5.添加了健康提醒功能,定时提醒您进行健康活动。j9九游真人游戏第一平台 56.54.58 中的新功能7.4.10版本更新内容介绍:1.增加了数据同步功能,用户可以在多个设备上同步他们的数据。2.优化了用户界面,使其更加直观和易于操作。3.添加了多账户支持,方便您切换不同的账户。4.引入了游戏化元素,增加了应用的趣味性。5.引入了家庭共享功能,让家庭成员共享应用内容。j9九游真人游戏第一平台 7.5.9 中的新功能32.65.45版本更新内容介绍:1.新增全新技能宝石功能;2.111级以上装备可在宝石匠处为装备开启技能宝石孔;3.全新技能宝石合成功能,合成成功即可升级宝石;4.优化了社交功能,增加了更多互动和分享方式。5.新增了社区功能,用户可以在应用内与其他用户交流和分享经验。j9九游真人游戏第一平台 20.02.95 中的新功能7.6.10版本更新内容介绍:1.新增第二元神系统,非凡属性强力更新;2.第二元神最高可提供80%属性加成;3.提升了部分机型的画质,游戏画面更加精细;4.优化了「远程控制」功能,支持更多设备的远程操作。5.增加了新的语言支持,扩大了用户群体。j9九游真人游戏第一平台 7.7.1 中的新功能7.2.8版本更新内容介绍:1.优化了电池消耗,延长了电池续航时间。2.新增了「暂停下载」功能,方便您控制下载任务。3.优化了电池消耗,延长了电池续航时间。j9九游真人游戏第一平台 7.4.1 中的新功能新版本更新介绍j9九游真人游戏第一平台跨服联赛(测试版)飞升玩家可以通过游戏中仙界资源战使者报名参与跨服联赛;天尊可选定玩家代表本服参与跨服作战.j9九游真人游戏第一平台 66.5.9 中的新功能版本号48.65.57修复部分玩家登录异常的问题!
更多简介»【《天下》“最有文化”的全新宋制外观演绎国韵之美******
随着开学季的到来,莘莘学子重返书院,正是大荒里文人雅客挥毫创作的好时机。《天下》一系列应景的外观即将上线,为少侠们的大荒之旅添上更多诗意!
全新宋制汉服【韶华向远】墨色点染,古朴雅致,完美地演绎出国风之美。女款清丽绝尘,携飘带【浮生未歇】超逸登场,男款配以竹笛【一苇以航】,翩翩气度浑然天成~还有可爱呆萌的珍兽【萌虎出山】,邀你一起“萌”游大荒!事不宜迟,下面一起揭开这些外观的神秘面纱吧~
【韶华向远】时装女款
女款的【韶华向远】,承袭宋制汉服的灵动与优雅。色调柔和,独具淳朴淡雅之美,女子一头青丝挽起,梳成简单发髻,以明珠花钿点缀,清丽脱俗。纯白对襟绣有繁花嫩叶,蜻蜓落于其间尽显生机,腰间、衣襟处皆以明珠点缀,与精巧的珍珠衫相呼应,彰显贵气。
衣袖间绣球花悄然绽放,似有暗香引来蝴蝶翩跹四周,腰间轻垂蓝紫色流苏腰坠,与轻纱飘带【浮生未歇】相衬,二者随风起舞,飘逸轻盈,少女手提花篮缓缓走来如仙女下凡,步步生香沁人心脾。
【韶华向远】时装男款
男款色调更沉稳大气,公子以银冠固定好如墨细发,柔顺的云纱披在肩侧,龙飞凤舞般的墨迹流淌其上,雅致且富有内涵,内衬上绘墨荷图,更彰显其高洁出尘,纱袖似云烟,轻掩流光金纹,温润玉珏与明珠环绕衣袖,为书香世家的公子增添贵气。
金丝绣制雀羽、花枝装点下摆,再坠以流苏,行走间随风摇曳,彰显飘逸之轻盈,国韵之典雅。公子手握珠串,取出竹笛【一苇以航】,顷刻,悠扬笛声缓缓传来,如听仙乐,让人恍若置身山河水墨画中,饱览独属东方的诗意之美。
【萌虎出山】珍兽
浓墨滴落宣纸之上,晕染而开,深浅相宜,逐渐勾勒出虎纹、虎躯。只稍一会,一只可爱虎崽便准备“出山”!
与寻常威风凛凛的白虎不同,水墨染就的幼虎可爱呆萌,毛茸茸的爪子拍打着地面,墨水四溅,似乎也想蘸墨“写”下几个字,只见它嗷嗷叫唤着,张牙舞爪,想要以此震慑他人,却不知此举更是萌化了一众少侠的心~
以上全新外观将于本周更新后上线,感兴趣的少侠可以留意天下3官网发布的更新公告,了解具体的获取途径哦~
】【怀孕的宠物狗 3d官网在哪下载 最新官方下载安装地址******
怀孕的宠物狗 3d怎么下载?想要比别人更加抢先抢快的玩到这款游戏,那么你获取游戏开测消息是关键,能够获取到第一手信息,你才能在最快的时间内容体验到,怀孕的宠物狗 3d怎么下载呢?在哪里可以免费下载?下面九游小编为你带来两招,轻松解决你的烦恼,告诉你在哪里可以下载怀孕的宠物狗 3d安卓2022最新版。
怀孕的宠物狗 3d快速预约/下载地址(需优先下载九游APP):
手机扫码下载九游APP预约 预约订阅最新动态 优先九游APP下载
点击进入九游门户,搜索怀孕的宠物狗 3d,进入之后你会看到一个下载按钮,分别是【高速下载】和【下载】,高速下载可以更加节省下载时间和流量,能够很好的解决下载耗时长的问题。如图所示:
最直接的方法就是到九游APP进行下载,九游APP提供海量的精品游戏下载,
在九游客户端搜索栏中输入怀孕的宠物狗 3d进行搜索,点击进入到游戏专区中,如图所示:如图所示,这样你就不用四处寻求游戏下载包,简简单单的两步你就可以安装了,同时还有大量的安卓手机游戏攻略。
九游APP下载【高速下载】
好了,小编为大家大家提供了这两种教程是下载怀孕的宠物狗 3d最为直接方法哦,不知道大家有没有清楚的知道呢?想要了解更多精彩内容,不妨多多关注九游怀孕的宠物狗 3d
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【《贪玩蓝月》张馨予高调出关,与众魔族展开生死对决******
大家好呀,我是《贪玩蓝月》手游的小编~
神龙一直都是我们《贪玩蓝月》最激情的战斗之一,无数玩家都城战当晚前仆后继,只为争夺竖立在中心的石柱。但最近魔族竟趁着我们贪玩三大男神闭关修炼大举入侵蓝月大陆,占领了神龙都城!
令人意想不到的是魔族忽略了最近刚刚降临蓝月大陆的传奇女神张馨予。我们的传奇女神以一己之力,率领众人,与魔族展开生死对决,重新夺回神龙都城,并将魔族再次逐出蓝月大陆!
而小编最近在快手中发现在最近的一场神龙中,一名跟战士一样刚的高战法师,在不停的复活输出-被击败-再复活输出-再被击败的过程中,竟意外地捡到了两件强化了12的盛世。
那么大家觉得他是赚了还是亏了呢?
有些人靠激情PK来获取别人的资源,而有些神豪直接通过每周活动来获取一些基础资源道具。看他快速地点击购买按钮,奖励内容则是什么都不看。小编只想跟他说一句:“土豪,我们做朋友吧!”
原以为渣妹和土豪的距离就只是相隔一个手机屏幕。直到小编手贱看了一下快手评论区
原来小编和土豪相隔的距离足足有一个银河系那么远!!!
小编每次充值都会精打细算,确保将每一个元宝都花在关键节点上,因为小编知道,这都是自己辛辛苦苦的打工钱,这个月花完了就只能等待下个月,所以为什么小编现在的战力一直那么低,就是这个原因了。
以此同时,我们的平民活动【节日狂嗨】和【节日兑换】依旧如期开启。如果有一天你当上了贪玩蓝月这款游戏的策划,不知道各位对日常活动有哪些主意呢?不妨到前往公众号【贪玩蓝月手游】,在留言区告诉小编呗~
《贪玩蓝月:王者传奇》是一款大型多人ARPG游戏,采用全2.5D图像技术,通过即时的光影成像技术,营造亦真亦幻的游戏世界。游戏美术设计上汲取了东西方的美术元素,使用玄幻而写实的美术风格,人物造型华丽而独特,富有真实立体效果和绚丽的光影。游戏参考了大量中国古代神话故事和传说,并加以独创的发挥,塑造出一个奇幻的东方神话世界。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】用户好评 Dom网友 2025-01-09 03:50 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:48 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:47 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:46 点评了
《终末阵线》x《Code Geass 叛逆的鲁路修》梦幻联动今日上线!与鲁路修一起守护机甲梦想!
TA认为完美
用户好评 Dom网友 2025-01-09 03:45 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:44 点评了
在纳斯达克100指数再平衡过后,特斯拉、Meta、博通的权重都有所下降
TA认为完美
用户好评 Dom网友 2025-01-09 03:42 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:39 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:36 点评了
联发科李彦辑:天玑8400搭载AI智能体化引擎,赋能应用开发
TA认为完美
用户好评 Dom网友 2025-01-09 03:35 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:32 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:31 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:30 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:30 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:24 点评了
【捷报】AI⁺万得投顾终端大模型算法备案成功 ,金融AI创新大奖荣耀加持!
TA认为完美
用户好评 Dom网友 2025-01-09 03:23 点评了
独家|理想汽车前智能驾驶产品总监赵哲伦离职创业,加入具身智能赛道
TA认为完美
用户好评 Dom网友 2025-01-09 03:22 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:20 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:18 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:10 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:10 点评了
《终末阵线》x《Code Geass 叛逆的鲁路修》梦幻联动今日上线!与鲁路修一起守护机甲梦想!
TA认为完美
用户好评 Dom网友 2025-01-09 03:09 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:06 点评了
阿里前端第一人AI创业,要做内容创作者的GitHub!5k人排队内测
TA认为完美
用户好评 Dom网友 2025-01-09 03:06 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 03:04 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:59 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:59 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:58 点评了
网易CC直播520发布会亮点抢先看,热爱助力官狂撒惊喜福利!
TA认为完美
用户好评 Dom网友 2025-01-09 02:57 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:57 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:57 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:56 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:52 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:52 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:52 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:51 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:49 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:48 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:46 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:45 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:44 点评了
2024年零跑汽车累计新车交付近30万辆,2025年冲击50万辆目标
TA认为完美
用户好评 Dom网友 2025-01-09 02:44 点评了
CES前瞻:中国力量崛起, AI是绝对主角,带动酒店价格飙涨超10倍
TA认为完美
用户好评 Dom网友 2025-01-09 02:42 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:42 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:37 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:34 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:32 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:30 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:27 点评了
青岛、安徽国资联合出手! 自动驾驶产业链公司深信科创融了A轮
TA认为完美
用户好评 Dom网友 2025-01-09 02:22 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:19 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:19 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:15 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:12 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:07 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:06 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:05 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:02 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 02:00 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:59 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:58 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:57 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:56 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:56 点评了
独家|理想汽车前智能驾驶产品总监赵哲伦离职创业,加入具身智能赛道
TA认为完美
用户好评 Dom网友 2025-01-09 01:55 点评了
世界排名第一斯诺克运动员成为香港居民,本人回应:因为我女朋友
TA认为完美
用户好评 Dom网友 2025-01-09 01:55 点评了
CES前瞻:中国力量崛起, AI是绝对主角,带动酒店价格飙涨超10倍
TA认为完美
用户好评 Dom网友 2025-01-09 01:55 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:55 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:51 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:51 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:50 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:50 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:50 点评了
世界排名第一斯诺克运动员成为香港居民,本人回应:因为我女朋友
TA认为完美
用户好评 Dom网友 2025-01-09 01:44 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:42 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:41 点评了
《闪耀暖暖》福利活动“轻聆风语”限时开启 “幻之海·流光”全新套装上线
TA认为完美
用户好评 Dom网友 2025-01-09 01:39 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:38 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:37 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:36 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:36 点评了
十五载后再续前缘!音乐人曾冠宇揭秘《剑心问道》原声幕后故事!
TA认为完美
用户好评 Dom网友 2025-01-09 01:34 点评了
独家|理想汽车前智能驾驶产品总监赵哲伦离职创业,加入具身智能赛道
TA认为完美
用户好评 Dom网友 2025-01-09 01:33 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:32 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:29 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:27 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:25 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:25 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:24 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:23 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:21 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:21 点评了
联发科李彦辑:天玑8400搭载AI智能体化引擎,赋能应用开发
TA认为完美
用户好评 Dom网友 2025-01-09 01:20 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:20 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:19 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:16 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:12 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:10 点评了
TA认为完美
用户好评 Dom网友 2025-01-09 01:04 点评了
TA认为完美
发表评论