REAL DIGITAL
5.98K subscribers
2.4K photos
240 videos
11 files
2.79K links
📡 Новости IT, DX, AI, FinTech и технологий в Казахстане
📱 Для связи @digital_in_real
Download Telegram
📢 Глоссарий AI 2.0 | Выпуск #1.3: Новые парадигмы

Завершаем разбор первого блока — «Фундамент и Архитектура». Сегодня говорим о том, как ИИ пытается выйти за рамки простого текста и обрести некое подобие «здравого смысла».

Разбираем три концепции, которые определяют развитие ИИ прямо сейчас:
🔹 1. World Models (Модели мира)
Это подход, за который активно выступает Ян Лекун (Meta). Главная претензия к современным LLM — они не понимают, как устроен мир, и живут только в пространстве слов. Модель мира — это попытка научить ИИ понимать физику и логику реальности. Такая система не просто подбирает слова, а строит внутреннюю симуляцию: она понимает причины, следствия и постоянство объектов (например, что предмет не исчезает, если его накрыть). Это путь к ИИ со «здравым смыслом».
🔹 2.
MoE (Mixture of Experts / Смесь экспертов)
Архитектурный «лайфхак» для повышения эффективности. Вместо того чтобы строить одну монолитную нейросеть, её разбивают на десятки специализированных под-моделей («экспертов»).
Как это работает: Когда вы даете задачу, специальный алгоритм (Router) активирует только нужных экспертов (например, по математике и Python). Остальная модель «спит». Это позволяет делать ИИ невероятно мощным, но при этом быстрым и экономичным в работе. На этой архитектуре, например, построены GPT-4 и Mixtral.
🔹 3. Multimodality (Мультимодальность)
Способность модели работать с разными типами данных одновременно. Для мультимодальной нейросети текст, изображения, звук и видео — это не разные файлы, а единое смысловое поле. Она может «увидеть» график на картинке, проанализировать его и выдать прогноз текстом или голосом. Это превращает ИИ из «собеседника» в полноценного ассистента, способного воспринимать мир так же, как человек.

💡 Итог первого блока: - LLM
— это огромная база статистических знаний;
MoE — способ сделать эти знания доступными и быстрыми;
• Мультимодальность
— это «органы чувств» ИИ;
• World Models
— это цель, к которой мы идем, чтобы ИИ перестал ошибаться в простых логических вещах.

Мы закончили с «архитектурой». В следующем блоке переходим к практике: Промптинг и Управление. Узнаем, почему «Промпт-инжиниринг» — это не про вежливость, а про программирование на естественном языке.

REAL DIGITAL

#AI #Glossary #RealDigital #WorldModels #MoE #Multimodality #LeCun #GenAI
🤔6