第03:社会
上一版3   4下一版  
 
     标题导航
市博物馆举办猜灯谜制花灯民俗文化体验活动~~~
~~~
云城区举办中式户外集体婚礼~~~
云城区举办“元宵杯”东西街三人篮球争霸赛~~~
云城区妇联开展亲子巧手做元宵花灯活动~~~
市委老干部局举办2025年闹元宵活动~~~
~~~
~~~
2025年02月13日 星期四 出版 上一期  下一期 返回首页 | 版面概览 | 版面导航 | 标题导航        
3 上一篇   下一篇 4  
  放大 缩小 默认   朗读
让AI自发推理!引发热议的“DeepSeek”到底是啥?

  云浮科协科普之窗

  一、最新开源模型R1引发关注

  1月,深度求索公司DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,引发全球关注。

  据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1模型正式版,且设计成本不到600万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。

  二、DeepSeek到底是啥?

  DeepSeek是一款杭州深度求索人工智能基础技术研究有限公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。

  与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。

  北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说OpenAI是“大力出奇迹”,如今DeepSeek则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。

  三、更大不再等于更聪明

  据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。

  国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。

  高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。

  英国《金融时报》发表的一篇评论文章指出,DeepSeek挑战了人工智能产业在过去一段时间的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。

  四、开源:未来的发展方向?

  DeepSeek采用了完全开源策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。

  当然,开源也面临着保护知识产权和开源社区秩序维护等挑战。

  据介绍,开源只是一种商业模式,即便开源项目也拥有版权。开源与闭源之争,实质上是不同商业模式在特定场景和时代背景下的有效性对比。

  DeepSeek的成功被一些人视为中国技术理想主义的体现,甚至被外国人比喻为神秘的东方力量。

  但从整个AI大模型产业来看,DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。(来源:科普中国)

3 上一篇   下一篇 4  
放大 缩小 默认   朗读
   第01版:一版要闻
   第02版:时政
   第03版:社会
   第04版:国内
   第05版:地方新闻
   第06版:国际
   第07版:三江之韵
   第08版:财富周刊
丰富市民文化生活 弘扬优秀传统文化
我市举办“欢乐闹元宵 情暖福利院”志愿服务活动
8对新人喜结连理
全民全运 全运惠民
爱心妈妈护成长 传统文化共传承
欢乐同庆 乐享元宵
云浮通特荐
让AI自发推理!引发热议的“DeepSeek”到底是啥?
云浮日报社会03让AI自发推理!引发热议的“DeepSeek”到底是啥? 2025-02-13 2 2025年02月13日 星期四