重磅!"AI界拼多多"发布DeepSeek-V3开源模型,总训练成本557万美元,比肩GPT-4o
12月27日,中国大模型创业公司DeepSeek悄悄惊艳了AI技术圈,重磅发布了一个全新的超大规模模型DeepSeek-V3。这个新模型拥有6710亿个参数,但采用了MOE(混合专家)架构,能根据任务需求激活特定参数,每处理一个词元激活370亿参数,从而实现高效又准确的任务处理。DeepSeek-V3的发布令业界振奋,不仅因为它是开源模型,更因为测试结果显示,它已超越诸如Meta的Llama3.1-405B、阿里Qwen等主流开源模型,甚