Forwarded from codedump的电报频道 (老C)
#杂
#人工智能
最近DeepSeek的新闻着实有点多啊,例如《中国AI初创公司DeepSeek是如何与硅谷巨头竞争的》。
时间回到两年前,彼时Chatgpt刚刚发布,当时我的判断是人工智能三大要素算力、算法、数据里,至少在算力和算法上我们是落后很多的。如果有人说,两年以后大模型领域中国能追赶到现在这个程度,我这样对中国科技有信心的人恐怕也会觉得过于乐观了。
现在两年时间过去了,我倒是觉得,可以将大模型领域做为一个切入的视角,一窥中国如何在一个垂直领域,在早期相对落后(尤其是还有层层封锁和限制)的情况下如何追赶。什么两弹一星、C919、航空母舰,毕竟离老百姓的生活还是有些远,技术细节普通人也难掌握。但是大模型领域,一来不乏开源项目,所谓“代码之前没有秘密”,二来更偏向民用,普通人也能马上看到效果。
引用《揭秘DeepSeek:一个更极致的中国技术理想主义故事》一文中的话:
#人工智能
最近DeepSeek的新闻着实有点多啊,例如《中国AI初创公司DeepSeek是如何与硅谷巨头竞争的》。
时间回到两年前,彼时Chatgpt刚刚发布,当时我的判断是人工智能三大要素算力、算法、数据里,至少在算力和算法上我们是落后很多的。如果有人说,两年以后大模型领域中国能追赶到现在这个程度,我这样对中国科技有信心的人恐怕也会觉得过于乐观了。
现在两年时间过去了,我倒是觉得,可以将大模型领域做为一个切入的视角,一窥中国如何在一个垂直领域,在早期相对落后(尤其是还有层层封锁和限制)的情况下如何追赶。什么两弹一星、C919、航空母舰,毕竟离老百姓的生活还是有些远,技术细节普通人也难掌握。但是大模型领域,一来不乏开源项目,所谓“代码之前没有秘密”,二来更偏向民用,普通人也能马上看到效果。
引用《揭秘DeepSeek:一个更极致的中国技术理想主义故事》一文中的话:
我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。
但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
Telegram
codedump的电报频道
#杂
#人工智能
闲聊我对人工智能的看法,由于不是这个方向的从业人员,可能会有误。
人工智能技术发展的三个要素,在我看来:算法、算力、数据(场景)。
先说算法。我感觉在现在论文、开源项目满天飞的情况下,算法是最容易取得突破的。OpenAI是先行者,所以后来进入这个领域的项目,就需要以开源的形式来快速获取信任以及借助开源社区来加快技术的迭代。
再说算力。算力是可以靠钱来堆的,只不过现在人工智能领域的算力门槛太高,起步就要动辄大几十亿的硬件(主要是GPU)成本开销,但是总的来说事情能靠砸钱解决的话,问题不算大。…
#人工智能
闲聊我对人工智能的看法,由于不是这个方向的从业人员,可能会有误。
人工智能技术发展的三个要素,在我看来:算法、算力、数据(场景)。
先说算法。我感觉在现在论文、开源项目满天飞的情况下,算法是最容易取得突破的。OpenAI是先行者,所以后来进入这个领域的项目,就需要以开源的形式来快速获取信任以及借助开源社区来加快技术的迭代。
再说算力。算力是可以靠钱来堆的,只不过现在人工智能领域的算力门槛太高,起步就要动辄大几十亿的硬件(主要是GPU)成本开销,但是总的来说事情能靠砸钱解决的话,问题不算大。…
Forwarded from codedump的电报频道 (老C)
#杂
我自己的一个观察:现在讨论AI以外技术的开发者,变得少了很多。不是AI相关开发的从业者,也在焦虑得想往这个方向靠。
我自己的一个观察:现在讨论AI以外技术的开发者,变得少了很多。不是AI相关开发的从业者,也在焦虑得想往这个方向靠。