DeepSeek-R1模型惊艳AI界,有何特别之处?
随着农历新年的到来,中国的AI领域传来令人振奋的消息。一家位于杭州的初创实验室“深度求索”(DeepSeek),由一群年轻工程师和充满热情的领导者组成,在成立仅一年多的时间里,成功推出了核心产品DeepSeek-R1模型。这款模型于今年1月20日正式发布,其卓越性能迅速引发行业关注,为AI领域注入了新的活力,也为蛇年的开启增添了一抹亮色。
DeepSeek-R1模型的性能表现尤为突出。据悉,其能力几乎可媲美美国AI巨头OpenAI的同类产品,但训练成本却控制在600万美元(约810万新元)以内,仅为OpenAI相关成本的极小一部分。更令人惊讶的是,该模型的开发过程中使用了性能较低的芯片,显示出团队在技术创新上的非凡实力。
就在农历除夕前一天(1月27日),DeepSeek的应用程序在中国和美国苹果应用商店的免费App下载榜单上双双登顶,力压OpenAI旗下的ChatGPT,展现出强大的市场吸引力。与此同时,美国芯片巨头英伟达的股价在同一天遭遇历史性暴跌,单日跌幅达到17%,市值缩水近6000亿美元,创下美国股市单日最大跌幅纪录。这一波动还拖累了欧美科技股的整体表现。
评论