Psy Eyes

🤖 ЧАТЫ 🤖

Alibaba: разработчики Qwen выпустили модель QwQ с пошаговым мышлением. Так как это превью версия, то много внезапных переключений между языками, и генерации простынок текста без итогового ответа. Посмотрим что будет на релизе. Ollama run qwq

Lmsys: запустили на арене языковых моделей (LLM) RepoChat, которому можно скормить ссылку на гитхаб репо и наблюдать какая ллм лучше исправит ошибку в issues.

Replit: теперь AI-разработчику можно кормить скриншоты или ссылки с промтом, а дальше он сам.

Open-WebUI: в обновлениях v 0.4.4 — 0.4.6: расширенные возможности аутентификации пользователей, улучшения в RAG, и не только.

Gradio: в версии v 5.6 появилось локально хранение данных в браузере пользователя. Даже если страница перезагрузится, ничего не пропадёт. Плюс недавно появились другие ништяки вроде WebRTC для стриминга.

TransformersJS: в версии v 3.1 через WebGPU заработало больше моделей: Deepseek Janus, Qwen2-VL, и не только.

AI2: выпустили в опенсорс ллм Tulu-3 в размерах 8B и 70B, вместе с датасетом, кодом, и рецептами. Ollama

SmolVLM: маленькая визуальная языковая модель (VLM) для работы на телефоне. Говорят быстрее в 7-16 раз, чем QwenVL 2B.

LM Studio: начиная с версии V 0.3.5 можно запускать LM Studio как сервис. Пригодится при использовании приложения в режиме сервера для локальных языковых моделей (LLM).

Также разрабы представили venvstacks, для упаковки AI-приложений на Python и их зависимостей в портативный формат, без необходимости включать здоровенные копии фреймворков на питоне в каждое приложение.

Anthropic: добавили стили генерации ответов и возможность загрузить свои доки, чтобы AI понял твой стиль. Плюс опубликовали протокол MCP облегчающий коммуникацию AI-ассистенотв с другими приложениями, репами, и базами данных.

OpenAI: модель 4o теперь пишет креативнее и лучше работает с загруженными доками.

DeepSeek: выкатили превью версию R1-Lite, своей ллм с пошаговым рассуждением, конкурент GPT-о1.

Paper Reviewer: выжиматор бумаг с Arxiv, который делает из них блогпосты с картинками и аудио в формате подкаста. Под капотом Gemini 1.5.

Nexa Omni Vision: маленькая, но способная VLM для чата по визуалу на мобильных устройствах.

Athene V2: это AI-агент для выполнения заданий пользователя с вызовом функций.

Runner H: AI-агент для автоматизации задач на компьютере пользователя, адаптирующийся к изменениям в UI.

Marco-o1: ещё одна ллм с пошаговым мышлением, но сфокусированная на темах, где нет чётких ответов.

ShowUI: AI-агент для локального выполнения задач с использованием GUI. Задействуется Qwen2VL.

Ламе 3.2 11B тоже пришили пошаговое мышление.

Phi-3.5 Vision: тоже VLM для чата по визуалу с фокусом на арте.

Agora: протокол для удешевления коммуникации между AI-агентами.

Apple: выпустили набор визуальных энкодеров AIMv2.

В 40-ой серии видюх от Nvidia не работает Nvlink, но Geohot поковырял драйвер и заставил две 4090 работать через P2P PCIe, минуя CPU-RAM.

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude

Please open Telegram to view this post

VIEW IN TELEGRAM

1.3K views13:20