duangsuse::Echo – Telegram

duangsuse::Echo

593 subscribers

4.13K photos

119 videos

579 files

6.16K links

import this:
美而不丑、明而不暗、短而不凡、长而不乱，扁平不宽，读而后码，行之天下，勿托地上天国。
异常勿吞，难过勿过，叹一真理。效率是很重要，盲目最是低效。
简明是可靠的先验，不是可靠的祭品。
知其变，守其恒，为天下式；穷其变，知不穷，得地上势。知变守恒却穷变知新，我认真理，我不认真。

技术相干订阅~
另外有 throws 闲杂频道 @dsuset
转载频道 @dsusep
极小可能会有批评zf的消息如有不适可退出
suse小站(面向运气编程)： https://WOJS.org/#/

Download Telegram

About

Blog

Apps

Platform

duangsuse::Echo

593 subscribers

duangsuse::Echo

Forwarded from Solidot

Stability AI 发布 Stable Video 3D

2024-03-19 14:13 by 血之遗产

AI 创业公司 Stability AI 发布了 Stable Video 3D，输入一个对象的静态照片生成该对象的 3D 模型。Stable Video 3D 有两个版本：SV3D_u 和 SV3D_p，其中 SV3D_u 输入单幅图像生成轨道视频，无需相机调节；SV3D_p 组合了单幅图像和轨道视图，允许沿着指定相机路径创建 3D 视频。Stable Video 3D 的商业使用需要付费，非商业使用可在 Hugging Face 上下载模型权重（9.37GB）。

https://stability.ai/news/introducing-stable-video-3d
https://huggingface.co/stabilityai/sv3d

#人工智能

72 views12:33

duangsuse::Echo

Forwarded from Solidot

Adobe 以每分钟约 3 美元的价格购买视频构建文本视频 AI 模型

2024-04-13 20:54 by 电波骑士

Adobe 正以每分钟约 3 美元的价格购买视频构建文本视频生成模型，试图赶上 OpenAI 的 Sora。Adobe 要求摄影师和艺术家递交表现人们日常活动的视频，比如步行，或者表达情绪如快乐和生气。 Adobe 要求提供逾百种人物动作和表现情感的短片，以及脚、手或眼睛的简单解剖片段。它不希望视频包含版权材料，裸体或其它冒犯性内容。视频的平均费用约为每分钟 2.62 美元，最高每分钟 7.25 美元。

https://finance.yahoo.com/news/adobe-buying-videos-3-per-213215719.html

#人工智能

74 views10:24

duangsuse::Echo

Forwarded from Solidot

OpenAI 考虑允许 ChatGPT 用户生成成人内容

2024-05-10 17:17 by 西塔甘达

OpenAI 考虑允许其聊天机器人 ChatGPT 和文本图像服务 DALL-E 的用户生成成人内容。OpenAI 称它考虑允许开发者和用户“负责任的”通过其产品创造 NSFW 内容，这将包括色情、极端血腥和脏话。OpenAI 是在最新公布的 Model Spec 文件中披露与 NSFW 内容相关的新讨论。起草文件的 OpenAI 员工 Joanne Jang 强度，深度伪造仍然是被禁止的。

https://tech.slashdot.org/story/24/05/09/1454236/openai-considers-allowing-users-to-create-ai-generated-pornography
https://cdn.openai.com/spec/model-spec-2024-05-08.html#dont-respond-with-nsfw-content

#人工智能

👎1

78 views12:07

duangsuse::Echo

Forwarded from Solidot

IBM 开源 Granite 代码模型

2024-05-14 09:45 by 外星人

IBM 开源了它用于辅助编程的 Granite 代码模型，源代码托管在 GitHub 上，采用 Apache License 2.0 许可证，允许商业使用。与其它 AI 模型不同的是，IBM 致力于避免模型的版权问题，使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型，可用于修 bug、解释代码和生成代码文档，使用了 116 种编程语言的代码进行训练，参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。

https://github.com/ibm-granite/granite-code-models

#人工智能

87 views12:08

duangsuse::Echo

Forwarded from Solidot

OpenAI 发布新的免费模型 GPT-4o

2024-05-14 11:16 by 终极之门

OpenAI 发布了最新的基础模型 GPT-4o，以及 ChatGPT 桌面应用。GPT-4o 提供给所有免费用户使用，支持输入文本、音频和图像的任意组合，能输出文本、音频和图像的任意组合。它能在最短 232 毫秒平均 320 毫秒的时间内响应音频输入，OpenAI 称这类似于人类对话的响应时间。它的英语文本和代码性能与 GPT-4 Turbo 接近，非英语文本性能也有显着提高，API 访问速度更快费用也降低了一半。模型能实时响应、检测情绪并相应的调整声音。

https://openai.com/index/hello-gpt-4o/
https://chat.openai.com/

#人工智能

80 views12:09

duangsuse::Echo

Forwarded from Solidot

Mozilla 发布 Firefox AI 助手 Orbit

2024-12-31 14:21 by 电波骑士

现代浏览器不能没有 AI 助手，至于用户想要不需要是另一回事。Mozilla 发布了 Firefox AI 助手 Orbit。Orbit 是通过扩展形式提供给 Firefox 用户，用户可选择使用，它可用于在不牺牲用户隐私的情况下帮助汇总电子邮件、文档、文章和视频。目前版本的 Orbit 使用的是托管在 Mozilla GCP 实例中的 Mistral LLM (Mistral 7B)，适用的网站包括了 Gmail、维基百科、纽约时报、YouTube 等，使用 Orbit 不需要创建账号，不会使用用户信息训练，也不会保存用户访问的网页内容。

https://orbitbymozilla.com/

#人工智能

99 views07:14

duangsuse::Echo

Forwarded from Solidot

VLC 预览本地 AI 字幕翻译功能

2025-01-09 23:06 by 我是6号

下载量逾 60 亿次的开源多媒体软件 VLC 在 CES 上演示了本地 AI 字幕翻译功能。该功能利用了本地运行的开源大模型，能为任何视频自动生成实时字幕，然后翻译成多种语言，无需联网或使用云端服务。开发 VLC 的非盈利组织 VideoLAN 总裁 Jean-Baptiste Kempf 称，即使在流媒体时代，VLC 的活跃用户数量仍然在增长。

https://techcrunch.com/2025/01/09/vlc-tops-6-billion-downloads-previews-ai-generated-subtitles/

#人工智能

116 views12:30

duangsuse::Echo

Forwarded from Solidot

Meta 朝通用翻译器前进了一大步

2025-01-17 16:51 by 沙皇的邮件

Meta 研究人员研发出一个 AI 模型，能即时翻译多达 101 种语言的语音和文本，包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型，填补了语言覆盖方面的空白，并且性能优于现有的系统，它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译，以及自动语音识别(96 种语言)。研究团队说，本项研究工作或可为快速通用翻译铺平道路，其资源公开可用(用于非商业用途)，以协助进一步研究包容性语音翻译技术。研究团队表示，在语音到语音的翻译中，SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。

https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm

#人工智能

121 views12:23

duangsuse::Echo

Forwarded from codedump的电报频道 (老C)

#杂
#人工智能
最近DeepSeek的新闻着实有点多啊，例如《中国AI初创公司DeepSeek是如何与硅谷巨头竞争的》。

时间回到两年前，彼时Chatgpt刚刚发布，当时我的判断是人工智能三大要素算力、算法、数据里，至少在算力和算法上我们是落后很多的。如果有人说，两年以后大模型领域中国能追赶到现在这个程度，我这样对中国科技有信心的人恐怕也会觉得过于乐观了。

现在两年时间过去了，我倒是觉得，可以将大模型领域做为一个切入的视角，一窥中国如何在一个垂直领域，在早期相对落后（尤其是还有层层封锁和限制）的情况下如何追赶。什么两弹一星、C919、航空母舰，毕竟离老百姓的生活还是有些远，技术细节普通人也难掌握。但是大模型领域，一来不乏开源项目，所谓“代码之前没有秘密”，二来更偏向民用，普通人也能马上看到效果。

引用《揭秘DeepSeek:一个更极致的中国技术理想主义故事》一文中的话：

我们认为随着经济发展，中国也要逐步成为贡献者，而不是一直搭便车。过去三十多年IT浪潮里，我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降，躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。
但其实，这是西方主导的技术社区一代代孜孜不倦创造出来的，只因为之前我们没有参与这个过程，以至于忽视了它的存在。

codedump的电报频道

#杂
#人工智能
闲聊我对人工智能的看法，由于不是这个方向的从业人员，可能会有误。

人工智能技术发展的三个要素，在我看来：算法、算力、数据（场景）。

先说算法。我感觉在现在论文、开源项目满天飞的情况下，算法是最容易取得突破的。OpenAI是先行者，所以后来进入这个领域的项目，就需要以开源的形式来快速获取信任以及借助开源社区来加快技术的迭代。

再说算力。算力是可以靠钱来堆的，只不过现在人工智能领域的算力门槛太高，起步就要动辄大几十亿的硬件（主要是GPU）成本开销，但是总的来说事情能靠砸钱解决的话，问题不算大。…

121 views05:31

duangsuse::Echo

Forwarded from codedump的电报频道 (老C)

#开源
#人工智能
《方糖AI自编程入门》，pdf，Github

90 views06:50

duangsuse::Echo

Forwarded from codedump的电报频道 (老C)

#人工智能
最近在朋友圈看到大量的腾讯元宝广告。毫无意外，在大量的广告投入以后，腾讯元宝也一下超越豆包、DeepSeek官方App来到第一名。

在DeepSeek完成市场用户教育，打好基建（将模型开源）以后，凭借社交媒体的优势，腾讯元宝只要能够支持好普通人使用DeepSeek模型，摘下这个桃子一点都不意外，也早就驾轻就熟了。

可换一个角度来想，DeepSeek同样也是需要腾讯的社交来帮助自己更广泛传播的。这就好比果实要通过被鸟吃下，才能完成种子的传播一样。DeepSeek志在建立一个更广泛的开源模型生态，而搭上腾讯的便车，让更多一般老百姓就能使用上它的模型，才是后续建立生态的基础。

从这个角度而言，两者相互需要，因为诉求不一样但却互补：鸟想果腹，而果实希望被传播。

101 views03:35

duangsuse::Echo

Forwarded from Solidot

Google 称 Gemma 3 使用一张 H100 GPU 就能获得与 DeepSeek R1 相当的性能

2025-03-13 16:44 by 绿里

Google 发布了新的多模模型 Gemma 3，开放权重，允许负责任的商业用途，128K 个令牌上下文，支持超过 140 种语言，提供了 10 亿、40 亿、120 亿、270 亿参数规模的模型可供选项。Google 称，Gemma 3 的 Elo 得分与 DeepSeek AI 的 R1 相差 98%，分别为 1338 分和 1363 分。但 DeepSeek 需要 32 张英伟达 H100 GPU 才能达到这一分数，而 Gemma 3 只需要一张 H100 GPU。Google 宣称 Gemma 3 是能在单张 GPU 或 TPU 上运行的最强大模型。

Google:Gemma 3 模型概览
Huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

#人工智能

111 views10:57

duangsuse::Echo

Forwarded from Solidot

Gemini 2.0 Flash 让任何人都能 PS

2025-03-19 23:33 by 记忆残留

Google 上周发布的 Gemini 2.0 Flash(Image Generation) Experimental 新模型过去几天吸引了越来越多的关注，该模型通过 Google AI Studio 提供给用户使用。它允许任何人通过输入提示词去修改和编辑图像，让任何人都能像专业人士那样处理图像或者叫 PS。Gemini 2.0 Flash 可以添加对象、删除对象、修改场景、更改灯光、更改图像角度、放大或缩小等操作。它支持对话式图像编辑，允许用户通过自然语言对话在多个连续提示中迭代优化图像。

Ars:Farewell Photoshop? Google’s new AI lets you edit images by asking
Developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/

#人工智能

106 views01:37

duangsuse::Echo

Forwarded from Solidot

OpenAI 新推理模型有更高的幻觉比例

2025-04-19 23:08 by 无敌号

根据内外部测试，OpenAI 最新推理模型 o3 和 o4-mini 比该公司之前的模型出现幻觉的概率更高。在 OpenAI 的 PersonQA 测试中，o3 出现幻觉的概率高达 33%，两倍于旧模型 o1（16%）和 o3-mini（14.8%）。o4-mini 更糟糕出现幻觉的概率高达 48%。斯坦福大学兼职教授 Kian Katanforoosh 指出他的团队发现 o3 常生成无效网址。OpenAI 表示需要更多研究去理解为什么随着推理模型规模的扩大，幻觉现象会加剧。

/.:OpenAI Puzzled as New Models Show Rising Hallucination Rates

#人工智能

143 views14:34

duangsuse::Echo

Forwarded from codedump的电报频道 (老C)

#人工智能
2月份DeepSeek横空出世之后，官网访问量太大一直不够顺畅。还好本身是个开源的大模型，很多厂家都上了DeepSeek大模型的支持，最早支持的是硅基流动。在这之后开始使用Cherry Studio来使用硅基流动上的DeepSeek大模型，每天都会问很多问题。从月度费用清单可以看出来，是真的很便宜，一个月几块钱就请了一个不错的助理了。

大模型只有成本降低、速度变快，才有可能走入寻常百姓家，真正对更多人的生活带去帮助。

128 views02:48

duangsuse::Echo

Forwarded from Solidot

Mr. Deepfakes 永久关闭

2025-05-06 23:37 by 空中城堡

最受欢迎的深度伪造色情平台 Mr. Deepfakes 永久关闭。该平台一度吸引了大量用户，他们愿意支付多达 1500 美元，让创作者使用 AI 换脸技术，将名人或目标对象出现在色情视频中。在高峰期，该平台的 4.3 万则视频观看量逾 15 亿次。这些视频目前已无法观看，相关论坛也已关闭。Mr. Deepfakes 声明称一家关键的服务提供商终止了服务。Mr. Deepfakes 的关闭并不能解决深度伪造问题，最流行的 DeepFaceLab 开源软件虽然已经存档停止开发，但任何人都可以使用。

Ars:Largest deepfake porn site shuts down foreve

#人工智能

131 views08:40

duangsuse::Echo

Forwarded from Solidot

研究发现 AI 无法预测股市

2025-05-16 19:58 by 月池

根据发表在《Humanities and Social Sciences Communications》期刊上的一项研究，伊朗谢里夫理工大学的科学家报告，AI 无法预测股市。无论是基于长短期记忆网络（LSTM）还是深度神经网络 (DNN)的 AI 模型，它们对股市的预测结果都错得离谱。即使组合使用更先进的 CNN、LSTM、Transformer 模型，它们对于预测现实世界中喧嚣混乱的股票中也是举步维艰。研究人员使用了 12 只德黑兰证券交易所的股票数据。可能其他地方的交易所会有不同的结论。

www.nature.com/articles/s41599-025-04761-8

#人工智能

164 views22:03

duangsuse::Echo

Forwarded from Solidot

AI 模型出现崩溃迹象

2025-05-27 22:56 by 我们祖先的祖先

一位一直用 AI 进行搜索的使用者认为，AI 模型出现崩溃迹象。理由是过去几个月，所有主流 AI 搜索机器人的查询结果都变差了。作者认为是因为 Garbage In/Garbage Out(GIGO)导致的。在 AI 领域这被称为 AI 模型崩溃。基于自身输出进行训练的 AI 系统会逐渐丧失准确性、多样性和可靠性，错误在模型迭代中累积，导致数据分布扭曲和性能出现“不可逆的缺陷”。结果就是模型被自身对现实的投射而中毒。

www.theregister.com/2025/05/27/opinion_column_ai_model_collapse/

#人工智能

145 views00:08

duangsuse::Echo

Forwarded from Solidot

掌机测试发现游戏在 SteamOS 上的性能高于 Windows 11

2025-06-26 14:35 by 飞行村

联想掌机 Legion Go S 支持两种操作系统：Valve 的 SteamOS（基于发行版 Arch Linux）和微软的 Windows 11。Ars 测试了相同游戏在两种操作系统上的性能，意外发现 Linux 上的游戏表现超过了 Windows。在测试的五款游戏中，四款在 SteamOS 上的帧率高于 Windows 11，只有《无主之地 3》差不多。SteamOS 运行 Windows 游戏需要 Proton 翻译层转译，因此性能被认为肯定会有损失，但 Valve 的优化工作更出色，相比下微软的 Windows 11 可能存在太多不必要的开销，掌机优化欠缺。微软可能也认识到了这一问题，它最近与华硕合作发布掌机，推出了致力于改进掌机体验的 Xbox Experience for Handheld。

arstechnica.com/gaming/2025/06/games-run-faster-on-steamos-than-windows-11-ars-testing-finds/

#人工智能

🦄1

146 views13:23

duangsuse::Echo

Forwarded from codedump的电报频道 (老C)

#人工智能
前阵子想开始学习一些深度学习的原理，从豆瓣上找来了传说中的鱼书第一册《深度学习入门》，马上就看进去了。浅显易懂，把深度学习和神经网络的相关知识都讲解的很好，没有采用类似PyTorch这样框架做为代码用例，而是用更基础的NumPy库来讲解代码原理。随后看了这套系列书的整体评价都很好，所以就全部收集下来打算都看看。总而言之，如果你和我一样之前都是相关领域的门外汉，强推这套书拿来入门，最近也出了第五册讲生成式模型的。

108 views23:37