duangsuse::Echo
593 subscribers
4.13K photos
119 videos
579 files
6.16K links
import this:
美而不丑、明而不暗、短而不凡、长而不乱,扁平不宽,读而后码,行之天下,勿托地上天国。
异常勿吞,难过勿过,叹一真理。效率是很重要,盲目最是低效。
简明是可靠的先验,不是可靠的祭品。
知其变,守其恒,为天下式;穷其变,知不穷,得地上势。知变守恒却穷变知新,我认真理,我不认真。

技术相干订阅~
另外有 throws 闲杂频道 @dsuset
转载频道 @dsusep
极小可能会有批评zf的消息 如有不适可退出
suse小站(面向运气编程): https://WOJS.org/#/
Download Telegram
Forwarded from Solidot
Stability AI 发布 Stable Video 3D

2024-03-19 14:13 by 血之遗产

AI 创业公司 Stability AI 发布了 Stable Video 3D,输入一个对象的静态照片生成该对象的 3D 模型。Stable Video 3D 有两个版本:SV3D_u 和 SV3D_p,其中 SV3D_u 输入单幅图像生成轨道视频,无需相机调节;SV3D_p 组合了单幅图像和轨道视图,允许沿着指定相机路径创建 3D 视频。Stable Video 3D 的商业使用需要付费,非商业使用可在 Hugging Face 上下载模型权重(9.37GB)。

https://stability.ai/news/introducing-stable-video-3d
https://huggingface.co/stabilityai/sv3d

#人工智能
Forwarded from Solidot
Adobe 以每分钟约 3 美元的价格购买视频构建文本视频 AI 模型

2024-04-13 20:54 by 电波骑士

Adobe 正以每分钟约 3 美元的价格购买视频构建文本视频生成模型,试图赶上 OpenAI 的 Sora。Adobe 要求摄影师和艺术家递交表现人们日常活动的视频,比如步行,或者表达情绪如快乐和生气。 Adobe 要求提供逾百种人物动作和表现情感的短片,以及脚、手或眼睛的简单解剖片段。它不希望视频包含版权材料,裸体或其它冒犯性内容。视频的平均费用约为每分钟 2.62 美元,最高每分钟 7.25 美元。

https://finance.yahoo.com/news/adobe-buying-videos-3-per-213215719.html

#人工智能
Forwarded from Solidot
OpenAI 考虑允许 ChatGPT 用户生成成人内容

2024-05-10 17:17 by 西塔甘达

OpenAI 考虑允许其聊天机器人 ChatGPT 和文本图像服务 DALL-E 的用户生成成人内容。OpenAI 称它考虑允许开发者和用户“负责任的”通过其产品创造 NSFW 内容,这将包括色情、极端血腥和脏话。OpenAI 是在最新公布的 Model Spec 文件中披露与 NSFW 内容相关的新讨论。起草文件的 OpenAI 员工 Joanne Jang 强度,深度伪造仍然是被禁止的。

https://tech.slashdot.org/story/24/05/09/1454236/openai-considers-allowing-users-to-create-ai-generated-pornography
https://cdn.openai.com/spec/model-spec-2024-05-08.html#dont-respond-with-nsfw-content

#人工智能
👎1
Forwarded from Solidot
IBM 开源 Granite 代码模型

2024-05-14 09:45 by 外星人

IBM 开源了它用于辅助编程的 Granite 代码模型,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证,允许商业使用。与其它 AI 模型不同的是,IBM 致力于避免模型的版权问题,使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型,可用于修 bug、解释代码和生成代码文档,使用了 116 种编程语言的代码进行训练,参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。

https://github.com/ibm-granite/granite-code-models


#人工智能
Forwarded from Solidot
OpenAI 发布新的免费模型 GPT-4o

2024-05-14 11:16 by 终极之门

OpenAI 发布了最新的基础模型 GPT-4o,以及 ChatGPT 桌面应用。GPT-4o 提供给所有免费用户使用,支持输入文本、音频和图像的任意组合,能输出文本、音频和图像的任意组合。它能在最短 232 毫秒平均 320 毫秒的时间内响应音频输入,OpenAI 称这类似于人类对话的响应时间。它的英语文本和代码性能与 GPT-4 Turbo 接近,非英语文本性能也有显着提高,API 访问速度更快费用也降低了一半。模型能实时响应、检测情绪并相应的调整声音。

https://openai.com/index/hello-gpt-4o/
https://chat.openai.com/

#人工智能
Forwarded from Solidot
Mozilla 发布 Firefox AI 助手 Orbit

2024-12-31 14:21 by 电波骑士

现代浏览器不能没有 AI 助手,至于用户想要不需要是另一回事。Mozilla 发布了 Firefox AI 助手 Orbit。Orbit 是通过扩展形式提供给 Firefox 用户,用户可选择使用,它可用于在不牺牲用户隐私的情况下帮助汇总电子邮件、文档、文章和视频。目前版本的 Orbit 使用的是托管在 Mozilla GCP 实例中的 Mistral LLM (Mistral 7B),适用的网站包括了 Gmail、维基百科、纽约时报、YouTube 等,使用 Orbit 不需要创建账号,不会使用用户信息训练,也不会保存用户访问的网页内容。

https://orbitbymozilla.com/

#人工智能
Forwarded from Solidot
VLC 预览本地 AI 字幕翻译功能

2025-01-09 23:06 by 我是6号

下载量逾 60 亿次的开源多媒体软件 VLC 在 CES 上演示了本地 AI 字幕翻译功能。该功能利用了本地运行的开源大模型,能为任何视频自动生成实时字幕,然后翻译成多种语言,无需联网或使用云端服务。开发 VLC 的非盈利组织 VideoLAN 总裁 Jean-Baptiste Kempf 称,即使在流媒体时代,VLC 的活跃用户数量仍然在增长。

https://techcrunch.com/2025/01/09/vlc-tops-6-billion-downloads-previews-ai-generated-subtitles/

#人工智能
Forwarded from Solidot
Meta 朝通用翻译器前进了一大步

2025-01-17 16:51 by 沙皇的邮件

Meta 研究人员研发出一个 AI 模型,能即时翻译多达 101 种语言的语音和文本,包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型,填补了语言覆盖方面的空白,并且性能优于现有的系统,它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译,以及自动语音识别(96 种语言)。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。研究团队表示,在语音到语音的翻译中,SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。

https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm

#人工智能
Forwarded from codedump的电报频道 (老C)
#杂
#人工智能
最近DeepSeek的新闻着实有点多啊,例如《中国AI初创公司DeepSeek是如何与硅谷巨头竞争的》。

时间回到两年前,彼时Chatgpt刚刚发布,当时我的判断是人工智能三大要素算力、算法、数据里,至少在算力和算法上我们是落后很多的。如果有人说,两年以后大模型领域中国能追赶到现在这个程度,我这样对中国科技有信心的人恐怕也会觉得过于乐观了。

现在两年时间过去了,我倒是觉得,可以将大模型领域做为一个切入的视角,一窥中国如何在一个垂直领域,在早期相对落后(尤其是还有层层封锁和限制)的情况下如何追赶。什么两弹一星、C919、航空母舰,毕竟离老百姓的生活还是有些远,技术细节普通人也难掌握。但是大模型领域,一来不乏开源项目,所谓“代码之前没有秘密”,二来更偏向民用,普通人也能马上看到效果。

引用《揭秘DeepSeek:一个更极致的中国技术理想主义故事》一文中的话:
我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。
但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
Forwarded from codedump的电报频道 (老C)
#人工智能
最近在朋友圈看到大量的腾讯元宝广告。毫无意外,在大量的广告投入以后,腾讯元宝也一下超越豆包、DeepSeek官方App来到第一名。

在DeepSeek完成市场用户教育,打好基建(将模型开源)以后,凭借社交媒体的优势,腾讯元宝只要能够支持好普通人使用DeepSeek模型,摘下这个桃子一点都不意外,也早就驾轻就熟了。

可换一个角度来想,DeepSeek同样也是需要腾讯的社交来帮助自己更广泛传播的。这就好比果实要通过被鸟吃下,才能完成种子的传播一样。DeepSeek志在建立一个更广泛的开源模型生态,而搭上腾讯的便车,让更多一般老百姓就能使用上它的模型,才是后续建立生态的基础。

从这个角度而言,两者相互需要,因为诉求不一样但却互补:鸟想果腹,而果实希望被传播。
Forwarded from Solidot
Google 称 Gemma 3 使用一张 H100 GPU 就能获得与 DeepSeek R1 相当的性能

2025-03-13 16:44 by 绿里

Google 发布了新的多模模型 Gemma 3,开放权重,允许负责任的商业用途,128K 个令牌上下文,支持超过 140 种语言,提供了 10 亿、40 亿、120 亿、270 亿参数规模的模型可供选项。Google 称,Gemma 3 的 Elo 得分与 DeepSeek AI 的 R1 相差 98%,分别为 1338 分和 1363 分。但 DeepSeek 需要 32 张英伟达 H100 GPU 才能达到这一分数,而 Gemma 3 只需要一张 H100 GPU。Google 宣称 Gemma 3 是能在单张 GPU 或 TPU 上运行的最强大模型。

Google:Gemma 3 模型概览
Huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

#人工智能
Forwarded from Solidot
Gemini 2.0 Flash 让任何人都能 PS

2025-03-19 23:33 by 记忆残留

Google 上周发布的 Gemini 2.0 Flash(Image Generation) Experimental 新模型过去几天吸引了越来越多的关注,该模型通过 Google AI Studio 提供给用户使用。它允许任何人通过输入提示词去修改和编辑图像,让任何人都能像专业人士那样处理图像或者叫 PS。Gemini 2.0 Flash 可以添加对象、删除对象、修改场景、更改灯光、更改图像角度、放大或缩小等操作。它支持对话式图像编辑,允许用户通过自然语言对话在多个连续提示中迭代优化图像。

Ars:Farewell Photoshop? Google’s new AI lets you edit images by asking
Developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/

#人工智能
Forwarded from Solidot
OpenAI 新推理模型有更高的幻觉比例

2025-04-19 23:08 by 无敌号

根据内外部测试,OpenAI 最新推理模型 o3 和 o4-mini 比该公司之前的模型出现幻觉的概率更高。在 OpenAI 的 PersonQA 测试中,o3 出现幻觉的概率高达 33%,两倍于旧模型 o1(16%)和 o3-mini(14.8%)。o4-mini 更糟糕出现幻觉的概率高达 48%。斯坦福大学兼职教授 Kian Katanforoosh 指出他的团队发现 o3 常生成无效网址。OpenAI 表示需要更多研究去理解为什么随着推理模型规模的扩大,幻觉现象会加剧。

/.:OpenAI Puzzled as New Models Show Rising Hallucination Rates

#人工智能
Forwarded from codedump的电报频道 (老C)
#人工智能
2月份DeepSeek横空出世之后,官网访问量太大一直不够顺畅。还好本身是个开源的大模型,很多厂家都上了DeepSeek大模型的支持,最早支持的是硅基流动。在这之后开始使用Cherry Studio来使用硅基流动上的DeepSeek大模型,每天都会问很多问题。从月度费用清单可以看出来,是真的很便宜,一个月几块钱就请了一个不错的助理了。

大模型只有成本降低、速度变快,才有可能走入寻常百姓家,真正对更多人的生活带去帮助。
Forwarded from Solidot
Mr. Deepfakes 永久关闭

2025-05-06 23:37 by 空中城堡

最受欢迎的深度伪造色情平台 Mr. Deepfakes 永久关闭。该平台一度吸引了大量用户,他们愿意支付多达 1500 美元,让创作者使用 AI 换脸技术,将名人或目标对象出现在色情视频中。在高峰期,该平台的 4.3 万则视频观看量逾 15 亿次。这些视频目前已无法观看,相关论坛也已关闭。Mr. Deepfakes 声明称一家关键的服务提供商终止了服务。Mr. Deepfakes 的关闭并不能解决深度伪造问题,最流行的 DeepFaceLab 开源软件虽然已经存档停止开发,但任何人都可以使用。

Ars:Largest deepfake porn site shuts down foreve

#人工智能
Forwarded from Solidot
研究发现 AI 无法预测股市

2025-05-16 19:58 by 月池

根据发表在《Humanities and Social Sciences Communications》期刊上的一项研究,伊朗谢里夫理工大学的科学家报告,AI 无法预测股市。无论是基于长短期记忆网络(LSTM)还是深度神经网络 (DNN)的 AI 模型,它们对股市的预测结果都错得离谱。即使组合使用更先进的 CNN、LSTM、Transformer 模型,它们对于预测现实世界中喧嚣混乱的股票中也是举步维艰。研究人员使用了 12 只德黑兰证券交易所的股票数据。可能其他地方的交易所会有不同的结论。

www.nature.com/articles/s41599-025-04761-8

#人工智能
Forwarded from Solidot
AI 模型出现崩溃迹象

2025-05-27 22:56 by 我们祖先的祖先

一位一直用 AI 进行搜索的使用者认为,AI 模型出现崩溃迹象。理由是过去几个月,所有主流 AI 搜索机器人的查询结果都变差了。作者认为是因为 Garbage In/Garbage Out(GIGO)导致的。在 AI 领域这被称为 AI 模型崩溃。基于自身输出进行训练的 AI 系统会逐渐丧失准确性、多样性和可靠性,错误在模型迭代中累积,导致数据分布扭曲和性能出现“不可逆的缺陷”。结果就是模型被自身对现实的投射而中毒。

www.theregister.com/2025/05/27/opinion_column_ai_model_collapse/

#人工智能
Forwarded from Solidot
掌机测试发现游戏在 SteamOS 上的性能高于 Windows 11

2025-06-26 14:35 by 飞行村

联想掌机 Legion Go S 支持两种操作系统:Valve 的 SteamOS(基于发行版 Arch Linux) 和微软的 Windows 11。Ars 测试了相同游戏在两种操作系统上的性能,意外发现 Linux 上的游戏表现超过了 Windows。在测试的五款游戏中,四款在 SteamOS 上的帧率高于 Windows 11,只有《无主之地 3》差不多。SteamOS 运行 Windows 游戏需要 Proton 翻译层转译,因此性能被认为肯定会有损失,但 Valve 的优化工作更出色,相比下微软的 Windows 11 可能存在太多不必要的开销,掌机优化欠缺。微软可能也认识到了这一问题,它最近与华硕合作发布掌机,推出了致力于改进掌机体验的 Xbox Experience for Handheld。

arstechnica.com/gaming/2025/06/games-run-faster-on-steamos-than-windows-11-ars-testing-finds/

#人工智能
🦄1
Forwarded from codedump的电报频道 (老C)
#人工智能
前阵子想开始学习一些深度学习的原理,从豆瓣上找来了传说中的鱼书第一册《深度学习入门》,马上就看进去了。浅显易懂,把深度学习和神经网络的相关知识都讲解的很好,没有采用类似PyTorch这样框架做为代码用例,而是用更基础的NumPy库来讲解代码原理。随后看了这套系列书的整体评价都很好,所以就全部收集下来打算都看看。总而言之,如果你和我一样之前都是相关领域的门外汉,强推这套书拿来入门,最近也出了第五册讲生成式模型的。