时间的切片
7.36K subscribers
512 photos
4 videos
19 files
428 links
Download Telegram
周末一个传统企业做 IT 的朋友问我 MCP 怎么玩,我和他介绍了一下墨问 MCP 和 OpenAPI 的设计和用法,很奇怪传统企业这么先锋了吗?

他说,别提了,现在到处 AI 提效,我们得天天琢磨怎么体现这玩意,AI 编程工具没用几回,天天得统计 AI 代码采用率,AI 为业务带来哪些增量,你的价值在哪……AI 带来的损耗比提效可大多了,tnnd。

他这么吐槽。

我拍了拍他的肩膀心想,好在我永远不需要在这种企业工作了……
让 AI 工具帮助你做 RSS 的事儿。想自动化总结X的信息流?只需用上Comet浏览器

在X上面关注了很多人,但很头疼的事情是,信息实在太多了,并且X的信息密度不高,虽然follow了很多人,但大部分帖子我都没有去看。直到我用到了Comet,这一切发生了改变。

https://note.mowen.cn/detail/C4Ad2vqEM2bLIz4-qDe8I
如果我是互联网大厂主导产品的高管,有两个产品我一定要做,一个是 AI 浏览器,另一个就是 AI IDE 编程工具。

在大模型彻底“下沉”到应用层的 2025 年,浏览器和编程工具这两个看似古老的入口,正在被重新发明。

浏览器握有用户全部网页、标签、搜索、购物、支付的实时行为数据。对大模型而言,这些数据就是最好的“长上下文”——能让 AI 既理解人,也能替人执行操作。要让 Agent 去网页里点按钮、填表格、下单,最直接的办法就是让它“长”在浏览器里。Dia、Comet 等,都在做这样的事情。

编程工具在 AI 时代被彻底泛化,不再是软件工程师的专属工具,有的 AI 编程工具在强化程序员的能力,比如 Copilot 和 Cursor,有的是编程 Agent,帮助普通人实现产品梦想,比如 Lovable、http://Bolt.new,还有做命令行的,比如 Claude Code、Gemini CLI 等等,产品线非常丰富。

最近阿里巴巴刚刚发布了 Agentic 编程平台 Qoder,这款产品有什么不一样呢?在我来看,最重要的就两点:对巨大代码工程的理解能力增强,代码生成的准确率提升。对,Qoder 还提供了个Quest Mode,你可以把 Qoder 当做全栈工程师用。

也可以直接调用墨问的 MCP,分析结果直接入墨问。https://note.mowen.cn/note/detail?noteUuid=Si0_aKoXen095-wHCOVGr
昨天和一个 X(推特) 上创作者交流,我说你这十几万的订阅,怎么评论这么少呢,是不是做了限制,关注你的才能评论?

他说,我的限制更严格,只有我关注的才能留言评论,这可以最大程度降低留言对作者和读者的困扰。

也就是这样:
这样几乎可以屏蔽所有噪音,因为自己的关注已经是非常严格的筛选了。但是这种做法也会挡住正常的交流,比如你的关注者们。

我最近几年的评论区基本都是对所有人开放,并且对评论不加干涉。这样,当你的内容被平台推荐的越来越多的时候,内容就会被更多陌生人遇到,负面评价就会多起来。

负面评价不都是坏事,就事论事没有任何问题,但另一部分负面评价可以判定为冒犯和垃圾信息,包括恶意揣测,以前这样的信息我也懒得管。最近推荐越来越多,我稍微研究了一下,这种在评论区大放厥词的用户,看 ta 主页,既没有粉丝,也没有内容,可能就是个不作个人形象经营的 nobody 或匿名者,基本上是来评论区找存在感的。

我现在的处理方式会严厉一点,删除 ta 的评论,然后拉黑了事。存在感,给不了一点。

这是一种小小的惩罚。

墨问目前这种情况很少,但也不是没有,到一定程度,评论权限也会做限制的,选择权交给墨主们就好。


https://note.mowen.cn/note/detail?noteUuid=x8m7AXuuOyAcqJqkEl1fP
上半年我写过一篇快手推荐大模型的文章,没想到特受欢迎,系统还推荐了,很多用户留言让我继续讲讲快手。还有用户问我,是不是快手这家公司,只做了推荐大模型和视频生成大模型,其他的一概不碰?看来还真有不少信息差。

其实在今年六月底,快手就开源了多模态大模型 Keye-VL。我们团队当时也做过测试,发现它对短视频内容的理解能力确实不同凡响。在这个时代,几乎所有成规模的互联网公司都在 AI 领域重兵集结,投入了大量资源。

先说说 Keye-VL 1.5 模型:https://note.mowen.cn/note/detail?noteUuid=EddJOgW0vkbUBJB5Wnsm0

这两天我们 CTO 发现,快手悄悄发布了 Keye-VL 的 1.5 版本。目前模型权重已经开源。注意,参数只有 8B,适合中小企业低成本部署使用。

和市面上常见多模态大模型不同,Kwai Keye 不是一味追求通用性,而是更侧重短视频场景。根据权威的基准测试集 Video-MME 的数据, Keye-VL-1.5-8B 在短视频的数据集中,超过了 GPT-4o 以及同等规模参数的其他模型,表现还是相当不错。
做个测评,下面是一段快手上的短视频,输入给 Keye-VL-1.5 后,提问:大狗咬小狗的耳朵是为什么?
人们如何使用 ChatGPT?

OpenAI 发文:ChatGPT 的用户群体已经超越了早期的爱好者,变得更加广泛,特别是性别差距已显著缩小。大多数对话都聚焦于解决日常问题,例如查询信息和寻求实用建议。同时,它的使用方式也在不断演进,无论是在个人生活还是职业领域,都在持续创造经济价值。这种日益广泛的应用,也印证了我们的信念:获取人工智能 (AI) 服务应被视为一项基本权利,它是一种能帮助人们释放潜力、塑造未来的强大技术 https://note.mowen.cn/detail/2nzXlUOX088EKIIDLOUF-
https://note.mowen.cn/note/detail?noteUuid=ch5sA6nArCbD8mSF3ip7M

看到一些内测用户曝光,Gemini 3.0 可以在 Google AI Studio 里内测了,功能极为强大。咱打开 Studio 发现还是 2.5 Pro,显然没有内测资格。不过看了 X 上一些用户展示的内容,确实惊艳。如果这些能力在发布后不会被削弱,那么 Gemini 3.0 在编程和编码能力上将有巨大飞跃,这种升级会远远超过 GPT5,还有“智能体(Agent)”功能,更主动地理解和执行复杂任务。
两天前,Andrej Karpathy 上了 Dwarkesh 的播客。油管上有视频版,周末我看了两遍,信息密度极高。他的核心结论可以用一句话概括:Agent 的发展还需要十年。
原文:https://www.dwarkesh.com/p/andrej-karpathy
我整理了一份尽可能保留 Andrej Karpathy 的原话原意的访谈记录,大约 6000 字

https://note.mowen.cn/note/detail?noteUuid=BiWrEFI30YaBm7QthPORy