Системный Блокъ
10.8K subscribers
259 photos
2 videos
1 file
933 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
<Цифровое> солнце русской поэзии

Сегодня день рождения Александра Сергеевича Пушкина. Если вы уже перечитали любимые стихи его авторства, а теперь хотите разом освоить все наследие писателя, то рекомендуем вам наш обзор семантического издания Пушкин <цифровой>.

Кратко: что это за проект?

Пушкин ⟨цифровой⟩ — уже третье семантическое издание текстов и персоналий «большой литературы» в русскоязычном веб-пространстве (есть ещё «Слово Толстого» от команды Tolstoy Digital и Chekhov Digital, о котором «Системный Блокъ» писал здесь и здесь). Над созданием проекта о Пушкине параллельно работают Институт русской литературы (Пушкинский Дом) и Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, а DH-центр ИТМО разрабатывает интерфейсы для навигации, чтения и изучения материалов.

На сайте проекта можно найти основные тексты произведений Пушкина, его рукописи и материалы академического пушкиноведения с середины XIX века и до наших дней. В отдельном разделе представлены тексты-путеводители, которые помогут современному читателю лучше понять контекст произведений. Там, например, можно выяснить, что в стихотворении «Я помню чудное мгновенье…» Пушкин позаимствовал у Жуковского, Баратынского и Батюшкова, а также какой была в жизни вдохновившая это стихотворение Анна Керн. 

Путеводители раскрывают культурный контекст, биографию людей пушкинского круга и поэтику текстов. Они параллельны и связаны одновременно. Каждый можно прочесть отдельно как лонгрид (на странице даже указано время чтения), а можно изучать все три слоя одновременно, листая само произведение и переходя по ссылкам.

Узнать, какие возможности открывает работа с порталом, как она устроена и какие дальнейшие планы есть у создателей проекта, можно из полной версии статьи.

Время чтения: 10,5 минут

🌞 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
21👍16🔥135🦄3👎1
Grok в Telegram, обновление DeepSeek R1 и суперкомпьютер OpenAI в ОАЭ

Рассказываем, что произошло в мире ИИ за последнее время

Обновленный DeepSeek R1

Нашумевшая китайская языковая модель DeepSeek R1 получила обновление.

В тестах по математике и программированию улучшенная версия стала сравнима с лучшими коммерческими моделями — OpenAI o3 и Google Gemini 2.5 Pro. Модель стала реже галлюцинировать (выдавать фактологически неверные ответы), а также научилась использовать внешние инструменты (function calling): искать информацию в интернете, делать запросы к базам данных, выполнять код в среде разработки и т. д.

Модель, как и прежде, остается в открытом доступе и может использоваться в коммерческих целях.

OpenAI строит суперкомпьютер в ОАЭ


В рамках инициативы OpenAI For Countries компания анонсировала партнерство с ОАЭ. Согласно соглашению, OpenAI построит в стране вычислительный кластер, который заработает к 2026 году, а ОАЭ, в свою очередь, проинвестирует в американский проект Stargate — сеть суперкомпьютеров для обучения моделей ИИ.

Построенный кластер позволит интегрировать модели OpenAI на национальном уровне в государственные структуры, учебные заведения и систему здравоохранения с соблюдением требований к безопасности данных.

Проект Stargate был анонсирован вскоре после инаугурации Дональда Трампа и предполагает инвестиции в размере 500 млрд долларов на строительство серии дата-центров в США для развития и исследования искусственного интеллекта в течение четырех лет.

Инициатива OpenAI For Countries была представлена в мае в рамках проекта Stargate. Она предлагает помощь заинтересованным правительствам в создании «суверенной ИИ-инфраструктуры» в координации с правительством США.

Grok интегрируют в Telegram

Павел Дуров анонсировал глубокую интеграцию языковой модели Grok от лаборатории Илона Маска xAI в мессенджер Telegram.

ИИ-функции, которые появятся этим летом:

• удобный доступ к Grok — чат с моделью можно будет закрепить вверху списка всех чатов, а вопросы задавать через строку поиска,
• организация переписки — Grok будет категоризировать историю чатов по тематикам и создавать выжимки новых сообщений,
• помощь в создании контента — генерация развернутых сообщений на основе коротких черновиков, создание стикеров и аватарок,
• анализ информации — суммаризация данных из файлов и по ссылкам, проверка информации в каналах,
• модерация и автоответы — Grok сможет модерировать групповые чаты и отвечать на сообщения в бизнес-аккаунтах (например, сообщать рабочие часы или отвечать на частые вопросы).

Также Telegram получит 300 млн долларов инвестиций от xAI и 50% дохода с подписок на Grok, проданных через мессенджер.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍11🤯105
Коллокации, эпиграфика и древняя ДНК: подборка новых тестов «Системного Блока»

Если в эту пятницу вам хочется и развлечься, и узнать что-то новое, наши новые тесты – отличное решение. Разберетесь, что такое огамическое письмо, что роднит «крокодиловых слез» и «зеленый свет» и какое открытие последних лет стало прорывом в палеогенетике.

Что такое коллокации и как они помогают гуманитариям?

Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как и зачем изучают этот феномен, а теперь предлагаем вам проверить свои знания. Готовы? Тогда проходите тест по ссылке!

Что вы знаете о цифровой эпиграфике?

Эпиграфика — это наука о надписях на камнях, керамике, металлах и других твердых материалах. С появлением цифровых технологий, таких как 3D-моделирование и фотограмметрия, процесс документирования памятников стал точнее и полнее. Мы рассказывали об эпиграфических корпусах и о расшифровке надписей — теперь предлагаем вам пройти тест.

Что и зачем изучает палеогенетика?

В последние десятилетия палеогенетика и биоинформатика стали мощным двигателем развития археологии. Ученые, работающие в этих направлениях, воссоздают историю наших предков через анализ их ДНК, чтобы узнать больше о миграциях и эволюции человека. Пройдите наш тест, чтобы вспомнить (или узнать!), как наука помогает расшифровывать загадки прошлого.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍9🔥96
Хармс, Брюсов и «Гамлет»: цифровые методы в поиске интертекстуальных связей

Сегодня для поиска сходств между текстами можно не читать тысячи книг, а правильно обучить языковую модель, чтобы она сделала за вас хотя бы часть работы. В новой статье рассказываем о нескольких проектах, которые помогают изучать интертекстуальные связи, а еще о том, может ли их обнаружить обычная нейросеть.

Tesserae

C 2008 года на базе университета в Баффало осуществляется проект Tesserae, изначально созданный для поиска интертекстуальных связей между классическими древнегреческими, латинскими текстами (подробнее о нем мы рассказывали здесь). У проекта есть действующий онлайн-интерфейс и репозиторий.

InterIDEAS

«Философский» датасет InterIDEAS включает 45 тысяч страниц философских текстов, написанных с 1750 по 1950 год. В нём с помощью LLM и экспертов размечены обращения к книгам, идеологиям, религиям, историческим событиям, а также словам и поступкам других людей. Увы, свободного доступа к датасету пока нет.

WordWeb-IDEM

После проекта HyperHamlet, где были собраны всевозможные цитатные переклички с «Гамлетом» — от Сенеки до постов в социальных сетях, команда из Базельского университета взялась и за другие пьесы эпохи Возрождения. Сейчас в WordWeb-IDEM уже собрано более 1000 пьес и доступно несколько видов поиска по представленным текстам.

LLM

Сегодня LLM уже могут выполнять некоторые задачи по поиску параллелей в художественных текстах. Они позволяют перейти от поиска по ключевым словам к поиску «по смыслам», т. е. по содержательным пересечениям. Благодаря этому можно найти неочевидные пересечения в литературе. Например, вот такую пару цитат из текстов Брюсова и Хармса: «Старик, увидав девочку, остановился. Катя решилась спросить его. — Скажите, пожалуйста, как пройти в Вифлеем?» («Дитя и безумец», Брюсов); «Молодой человек почистил перчатками свои брюки и деликатным голосом спросил: — Скажите, дедушка, как тут пройти на небо?» («Молодой человек, удививший сторожа», Хармс). 

Правда, пока работа по поиску отсылок и перекличек в литературе с помощью LLM — скорее перспективное направление, чем готовый реализованный проект. Подробнее о таком использовании языковых моделей, а также о других проектах, которые облегчают исследователям работу с интертекстом, узнаете из полной версии статьи.

Время чтения: 16 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
238🥰7👍6🔥2🌚1
Цифровое чтение: как экраны меняют восприятие текстов

Сегодня цифровые устройства стали привычной частью учебы, а электронные ресурсы — от учебников до онлайн-платформ — все чаще используются в образовании. Пока авторы научно-популярных книг рисуют мрачные картины того, как мы потеряем способность к глубокому чтению, разбираемся, как переход к другим вариантам взаимодействия с информацией, влияет и повлияет на наше восприятие текстов разной длины.

Короткие тексты

Молодое поколение часто читает цифровые тексты до 500 слов быстрее, чем бумажные. Это происходит за счет быстрого скроллинга. Более того, результаты исследований показывают, что само восприятие текстов такой длины не меняется, будь они на экране или на бумаге.

Длинные тексты

С более объемными текстами всё немного иначе. Например, школьники 7–9 классов используют нелинейные стратегии: пролистывают текст, оценивая релевантность по заголовкам, ищут ключевые слова через Ctrl+F и делают цифровые заметки. Это ускоряет поиск нужной информации, но ведет к фрагментарному восприятию. Так что мы едва ли можем говорить о глубоком чтении. На то же указывают и данные айтрекинга (метода отслеживания движений глаз).

А вот как влияют на чтение цифровых текстов не их длина, а их язык и культурные особенности в странах, в которых проводятся такие исследования, мы пока понимаем хуже. Ученым еще предстоит заполнить эту лакуну, а преподавателям — объяснить особенности взаимодействия с цифровыми текстами и предложить решения для проблем, которые наверняка возникнут у читателей нового поколения.

Подробнее об этих решениях и об исследованиях, которые концентрировались на русских школьниках и текстах, узнаете из полной версии статьи.

Время чтения: 12 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍13🔥10👎1
Скрепить и сохранить: как из папок и бухгалтерских книг вырос цифровой порядок

Как файл связан с подшиванием к делу? Какие методы хранения бумаг можно найти и у фламандских художников, и в модных кофейнях? Наконец, кто придумал хранить документы в папках? Отвечаем на эти вопросы, разбираясь с историей хранения.

Кратко: как развивалась история бухгалтерии?


Бумага появилась в Европе еще в XI веке, но ее массовое производство началось только через триста лет. К этому моменту деловая жизнь Европы уже была достаточно развита, торговые и финансовые операции нужно было тщательно документировать, и проще было пользоваться дешевой бумагой, чем дорогим пергаментом. Так для записей стали использовать пустые книги. Память об этом сохранилась в разных языках: от разных «книг» образованы и слово бухгалтерия, и английское bookkeeping.

Затем для упорядочивания документов использовались несколько способов. Например, накалывание листа на острие (что до сих пор делают с чеками во многих заедениях). В XVI веке этим методом уже точно пользовались, что подтверждает, например, картина Яна Сандерса ван Хемессена 1536 года. Другим популярным методом было сшивание ниткой, когда документы буквально подшивают к делу. А благодаря этому методу до нас постепенно добралось слово файл, восходяще к латинской нити filum.

Ну а папка-регистратор с арочным механизмом, которую до сих пор используют в офисах, приобрела свою окончательную форму к XX веку. Этим мы обязаны американцу Джеймсу Шеннону, который придумал первый регистратор, и двум немцам — Фридриху Зённеккену и Луису Лейцу. Независимо друг от друга они превратили планшет Шеннона в более знакомую нам папку.

Подробнее о разных страницах истории хранения – физической и цифровой – узнаете из полной версии статьи.

Время чтения: 10 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
32👍9🥰4🤔32
Midjourney научилась генерировать видео, Meta* инвестирует в Scale AI, Mistral сделала рассуждающую LLM

Рассказываем, что нового в мире ИИ произошло за последнее время.

Генерация видео в Midjourney

Midjourney, один из первых успешных сервисов по генерации изображений, объявил о запуске функции создания видео.

В отличие от моделей OpenAI Sora и Google Veo 3, которые фокусируются на создании видео по текстовым описаниям, решение от Midjourney специализируется на анимации уже существующих изображений. 

Пользователь может сгенерировать изображение на сайте компании, а затем анимировать его одним из двух способов: воспользоваться функцией автоматического анимирования или текстом описать желаемое движение объектов и камеры. Те же действия можно выполнить и с загруженными пользователем изображениями.

Для анимации доступны два режима: high motion и low motion. Первый режим подходит для сцен, где камера практически неподвижна, а объекты малоподвижны. Второй режим оптимален для создания динамичных видео. После генерации пользователь может продлить видео на четыре секунды, причем эту операцию можно применить к одному ролику максимум четыре раза.

Стоимость генерации 5-секундного видео на данный момент в восемь раз превышает цену за создание одного изображения. Впрочем, компания планирует корректировать расценки в будущем в зависимости от спроса.

По заявлению Midjourney, новая модель является важным шагом к реализации глобальной цели — разработке искусственного интеллекта, способного в реальном времени формировать интерактивный 3D-мир, где пользователи смогут свободно перемещаться и взаимодействовать с объектами и персонажами.

Meta инвестирует в Scale AI

Корпорация Meta проинвестировала 14 млрд долларов в Scale AI — стартап, специализирующийся на разметке данных для обучения моделей искусственного интеллекта.

В результате этой сделки Meta приобрела 49% акций Scale AI, тем самым оценив стартап в 29 млрд долларов. Кроме того, основатель Scale AI, 28-летний Александр Ван, присоединится к команде Meta по разработке ИИ.

Услугами Scale AI пользуется множество крупных компаний, включая основных конкурентов Meta в ИИ-гонке — OpenAI и Google. По сообщениям СМИ, после объявления об инвестициях конкуренты Meta начали постепенно сворачивать сотрудничество со Scale AI.

Mistral выпустила первую рассуждающую модель

Французская компания Mistral представила Magistral — свою первую рассуждающую (reasoning) языковую модель (LLM). Рассуждающие модели генерируют развернутую цепочку логических рассуждений перед формированием финального ответа, что значительно повышает его качество и обоснованность. Примеры таких моделей — GPT o1 и o3 от OpenAI, Claude Sonnet в режиме extended thinking, Gemini 2.0 Flash Thinking и Gemini 2.5 от Google и R1 от DeepSeek.

По сравнению с предыдущим флагманом французской компании, Mistral Medium, новая модель сильно улучшила результаты в основных тестах. Однако в сравнении с конкурирующей DeepSeek-R1 она показывает сопоставимые или несколько более низкие результаты.

Magistral выпущена в двух версиях — Medium и Small. Более мощная версия Medium доступна только через API, тогда как Small, уступающая по качеству, распространяется в открытом доступе.

Mistral долгое время оставалась одной из немногих крупных ИИ-компаний, не выпускавших рассуждающие модели. После выхода Magistral среди лидеров отрасли только Meta не предлагает подобного функционала — ее модель Llama 4 по-прежнему не поддерживает режим рассуждений.

*Российские власти считают Meta террористической организацией

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍117🤬1
ИИ видит черепок, археолог – историю: почему нейросети и ученые ссорятся о сходстве

Чем руководствуется человек, сопоставляя два объекта? А как их видит компьютер и может ли сравнить настолько же эффективно? А если речь идет не об обычных предметах, а о находках археологов? С тем, как устроены представления человека и компьютера о сходстве предметов, в новом тексте разбирается наш блогер Олег Лашманов.

Как мы обнаруживаем сходства

Эволюция устроила нас так, что мы воспринимаем вещь не только визуально. Мы связываем её с целым набором ощущений: тяжестью, фактурой, мягкостью, запахом, звуками окружающей среды. Всё это — часть образа, и всё это влияет на то, насколько один предмет кажется нам «похожим» на другой. 

Археологи идут еще дальше: у них есть не только физические признаки находки — форма, материал и текстура, — но и опосредованные признаки: контекст и интерпретация. И поскольку аттрибуция артефактов — неочевидная и каждый раз уникальная задача, в ней могла бы пригодиться помощь цифровых технологий. Правда, проблема в том, что компьютер, в отличие от человека, располагает лишь изображением объекта (или несколькими) и, возможно, текстовым описанием. На этом всё. 

Как обучить нейросеть, чтобы она помогла археологу

Первый подход — использовать предобученные сверточные нейросети, например ResNet. Эти сети хорошо улавливают геометрические особенности: углы, точки, общие очертания. Однако, как видно из требований археологии, этого часто недостаточно — форма предмета далеко не всегда определяет его культурную принадлежность.

Второй подход — использовать мультимодальные модели, такие как CLIP, которые обучаются на парах «изображение — текст». Такой метод позволяет выучить семантическое представление об объекте, что гораздо ближе к задачам археолога. Тем не менее, даже этот подход не способен заменить человека, который может взять предмет в руки, оценить его вес, фактуру, запах — или, как шутят археологи, даже попробовать на вкус.

Пути решения

Сейчас к изображениям фрагментов добавляют метаданные — такие, как место находки или материал — и дообучают модели на текстовых описаниях вроде «колесничный комплекс», уточняя и дополняя формулировки. Но даже этого недостаточно.

Такие меры не передают глубокие семантические связи, которые выстраивает археолог: технологии производства, миграции ремесленников, ритуальные функции. Без этих связей ИИ остаётся «слепым картографом», рисующим карты без понимания легенды.
Так что пока никакой магии — только археологи способны справляться с задачей атрибуции артефактов. Но мы стараемся создать инструменты, которые облегчат этот процесс.

Если вам интересно поучаствовать в решении настоящих археологических задач — присоединяйтесь к проекту на SIMILIS.IO. А если хочется узнать больше о цифровых помощниках в археологии, переходите к полной версии текста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👏9🆒94🍾3
Все книги мира на одной полке: как визуализировать книжную вселенную с помощью ISBN

ISBN (Международный стандартный книжный номер) — это уникальный 13-значный код, который присваивается практически каждой опубликованной книге. Причем эти цифры неслучайные: по ним можно определить, на каком языке написана книга и какое издательство ее опубликовало, а также получить более подробную метаинформацию по каждому конкретному изданию. Рассказываем, как с помощью этого номера визуализировать (почти) бесконечную книжную полку.

Кратко: как это возможно?

Идею о такой книжной полке реализовал проект Visualizing all books of the world in ISBN-Space. Чтобы «расставить‎» книги в виртуальном пространстве, номер ISBN превратили в координаты на плоскости, тем самым сгруппировав тексты по информации о разных метаданных.

В итоге на такой визуализации можно найти конкретную книгу и увидеть ее корешок с названием, автором и штрих-кодом ISBN. А если уменьшить масштаб, получится увидеть, как книги автоматически группируются сначала по издательству, а потом по стране и языку.

Этот проект позволяет увидеть глобальное книгоиздание под новым углом: проследить языковые и издательские потоки, исследовать временные срезы и находить неожиданные связи между книгами. Такая визуализация делает огромные массивы библиографических данных доступными для визуального анализа только специалистам, но и широкой аудитории.

Узнать, что означает каждая цифра номера ISBN и как из этого набора чисел сделали координаты, а ещё посмотреть, как на сайте с визуализациями выглядит книга нашего постоянного автора Бориса Орехова, можно благодаря полной версии материала.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥31👍9🔥93👏1
Университеты и искусственный интеллект: от утопии до парадокса

Искусственный интеллект уже меняет нашу жизнь и наше обучение. Автоматизируются рутинные задачи, учебные планы строятся с ИИ-персонализацией, отдельные нейросети разрабатываются специально для университетов. В новом материале рассуждаем сразу о пяти сценариях развития событий, связанных с ИИ, в университетской среде.


1️⃣ Идеалистический: «Платоновский наставник»

В персективе студенты смогут получать уникальную образовательную траекторию, в которой темп, формат подачи материала и глубина погружения в тему динамически выстраиваются с помощью ИИ. В Гонконге, например, уже появились ИИ-лекторы, которые отвечают на вопросы студентов.

При таком сценарии обучение становится не только более индивидуализированным, но и более честным: студенты начинают воспринимать ИИ не как способ высокотехнологичного читинга, а как партнера в понимании материала. А преподаватели сосредотачиваются на развитии креативного мышления, этики, межличностного взаимодействия — того, что невозможно автоматизировать.

2️⃣ Антиутопичный: «Образовательная симуляция»

В недавнем исследовании профессий, потенциально уязвимых перед ИИ, список возглавили преподаватели, в особенности (но не исключительно) гуманитарных дисциплин, а ещё ChatGPT успешно прошел сложный медицинский экзамен, продемонстрировав понимание профессиональных терминов, клинического мышления и логических выводов.

Оба этих факта вынуждают думать о перспективе образовательного неравенства: пока элитные университеты смогут позволить себе сохранить живое человеческое общение, массовые вузы рискуют пойти по пути полной автоматизации, превращая образование в потоковое потребление информации.

3️⃣ Расширение когнитивных возможностей: «Сверхученый»

Исследование 2023 года, опубликованное в PLOS Digital Health, демонстрирует, что уже сейчас ИИ способен давать профессиональные научные комментарии даже без специальных промптов или надстроек — это потенциально может открывать путь к новым форматам взаимодействия с академическим знанием.

Такой подход сможет трансформировать и университетскую деятельность вообще. Проектно-исследовательская работа ускорится: путь от зарождения идеи до первичных данных или прототипов может занимать всего несколько часов. Это поменяет структуру преподаваемых курсов, методы преподавания и даже карьерные треки.

4️⃣ Парадоксальный: «Обратный маятник»

Есть вероятность, что после волны энтузиазма и массового внедрения ИИ-инструментов в образовательный процесс в университетах начнется обратное движение — рост интереса к «до-цифровым», медленным форматам обучения.

При таком сценарии произойдет откат к бумажным носителям, устным формам экзаменов и ручному письму — как символам вдумчивого и «человеческого» подхода к знаниям. Появятся программы slow learning (по аналогии с slow life — осознанным проживанием), где использование ИИ полностью запрещено. Престиж приобретет обучение с живым преподавателем, без алгоритмов и дистанционного обучения.

5️⃣ Гибридный: «ИИ как зеркало академической культуры»

Это сценарий, в котором ИИ усилит уже существующие тренды человеческого поведения, культуры и привычек в университетах — как позитивные, так и негативные. В учреждениях, где ценятся диалог, открытость и развитие критического мышления, ИИ станет мощным инструментом для углубления образовательного процесса. Он поможет задавать сложные вопросы, создавать альтернативные точки зрения и расширять пространство для интеллектуального роста.

Узнать больше об этих сценариях и исследованиях, которые позволяют предполагать такие варианты развития событий, сможете из полной версии статьи.

Время чтения: 11,5 минут

🤖 «Системный Блокъ» @sysblo
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1615👍8
Дата-журналистика: точка входа

«Системный Блокъ» выпустил новый спецпроект: в нём мы простым языком рассказываем, как журналисты работают с данными, разбираем кейсы и советуем полезные инструменты. Благодаря странице «Дата-журналистика: точка входа» вы узнаете, где искать данные для своих исследований, почему важно правильно их очистить, зачем нужна гипотеза и куда пойти учиться, если вы решили стать дата-журналистом.

Кратко: о чем проект?

Дата-журналистика — это направление журналистики, в котором для создания статей и материалов используются количественные данные. В «Системном Блоке» этому посвящена целая рубрика «Инфографика», из которой можно узнать о том, как бездомность сокращает жизнь, как политические события влияют на книжный рынок и сколько в российских школах учителей-мужчин.

Работу над дата-журналистскими проектами можно разделить на следующие этапы: выбор темы, постановка вопроса и выработка гипотез, поиск и подготовка данных, проверка выдвинутых гипотез, визуализация, подготовка текста. Каждый из них требует работы с разными инструментами от Voyant Tools, которые помогут с анализом текста, до Datawrapper, облегчающего задачу по созданию графиков и карт. 

Подробнее обо всех этих этапах и их особенностях, а также об образовательных программах, благодаря которым можно стать дата-журналистом, и каналах, на которые можно подписаться, чтобы узнать больше об этом направлении в журналистике, мы рассказали на странице спецпроекта.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👏178🔥5👍3
Meta* переманивает сотрудников OpenAI, Anthropic победила правообладателей книг, Apple отдает Siri на аутсорс

Рассказываем, что произошло в мире ИИ за последнее время.

Meta создала команду из сотрудников OpenAI

Корпорация Meta переманила по меньшей мере семь ведущих исследователей из OpenAI. По неподтвержденным данным, Марк Цукерберг, основатель и генеральный директор Meta, лично связывался с некоторыми кандидатами и предлагал бонус при подписании контракта размером в 100 млн долларов и суммарную компенсацию в 300 млн долларов в течение четырех лет. Сама Meta отрицает эти заявления.

Новые сотрудники вместе с рядом других бывших сотрудников Google DeepMind и Anthropic вошли в состав новой лаборатории Meta, цель которой — создать сверхинтеллект, то есть ИИ, значительно превосходящий лучших экспертов в решении любых задач. Возглавят ИИ-направление в корпорации Александр Ван, бывший генеральный директор Scale AI, о котором мы писали ранее, а также бывший генеральный директор GitHub — одного из главных хранилищ программного кода в мире.

Глава OpenAI Сэм Альтман и глава отдела исследований раскритиковали стратегию Meta во внутреннем письме сотрудникам. В частности, по мнению Альтмана, такое поведение приводит к серьезным культурным проблемам в индустрии. В письме также отмечалось, что компания слишком сфокусировалась на частых продуктовых релизах и отвлеклась от глобальной миссии — разработки общего искусственного интеллекта. «Миссионеры победят наемников», — так заканчивает письмо Сэм Альтман.

Anthropic победила в суде с правообладателями книг

В деле Anthropic против правообладателей американский судья признал, что использование книг, защищенных авторским правом, для обучения языковых моделей Anthropic подпадает под критерии fair use — доктрины, позволяющей использовать материалы, защищенные авторскими правами, без разрешения правообладателя в определенных случаях, например, для исследований, образования, критики и комментирования.

Судья сравнил использование книг моделью Anthropic с «читателем, мечтающим стать писателем», который обращается к чужим работам не затем, чтобы «скопировать их и воспроизвести или вытеснить», а чтобы «резко свернуть и создать нечто иное».

Однако это решение не снимает с Anthropic ответственности за копирование и хранение пиратских копий 7 млн книг, несмотря на то, что компания позднее заплатила за миллионы из них. Размер компенсации будет определен на следующих слушаниях. С полным текстом решения суда можно ознакомиться здесь.

Для обучения больших языковых моделей компании скачивают в автоматическом режиме огромные массивы текстов из интернета, что приводит к неизбежному попаданию авторского контента в обучающие корпусы. Использование подобных данных для создания ИИ-моделей до сих пор не регулируется существующим законодательством. Это первый прецедент, когда американский суд определил такое использование как fair use.

Apple хочет привлечь к разработке новой Siri OpenAI и Anthropic

По данным Bloomberg, корпорация Apple приняла решение привлечь компании OpenAI и Anthropic к разработке новой версии голосового ассистента Siri.

Apple планирует протестировать версии ассистента, созданные ведущими компаниями в сфере искусственного интеллекта. Самое успешное решение впоследствии будет развернуто на серверах Apple. Хотя компания не собирается прекращать собственные разработки в области ИИ, многие сотрудники были демотивированы принятым решением. Из-за этого руководству пришлось искать способы удержания персонала и пересматривать контракты.Apple отстает от конкурентов во внедрении ИИ в свои продукты. В частности, многие функции, анонсированные еще в прошлом году, так и не были реализованы. Подробнее о проблемах Apple с ИИ мы писали ранее.

*Российские власти считают Meta экстремистской организацией

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥12👍5
Небоскребы из бумаги: эволюция хранения документов

В 19 веке бухгалтеры хранили документы в шкафах, похожих на небоскребы из бумаги. А сегодня наши файлы на компьютере или смартфоне до сих пор хранятся в «папках». Антон Басов, исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ @cshsedpo, продолжает рассказывать о том, как офисные шкафы изменили работу с документами навсегда.

Кратко: о чем статья?

Необходимость вести бухгалтерские книги создавала трудности для клерков XIX века. Например, данные о финансовых операциях компании необходимо было вносить в несколько разных книг, а некоторые страницы пустовали из-за необходимости записывать операции отдельно для каждого счета и клиента. В 1888 году Уильям Ватер из Baker & Vawter предложил записывать финансовые операции компании на отдельных листах, закрепленных в папке. Такой способ сильно упрощал ведение бухгалтерии и после 1920 года папки и картотеки стали стандартной частью работы клерка.

Постепенно менялся и способ хранения других документов. На протяжении долгого времени несшитые листы бумаги хранились горизонтально. Однако гигантские стопки бумаг легко рассыпались, а короба для хранения слишком быстро наполнялись. На помощь пришла известная с конца 19 века картотека. В 1892 году в компанию Library Bureau, специализирующуюся на изготовлении оборудования для картотек, обратился секретарь из Буффало. По его заказу был создан обычный шкаф для картотеки с выдвижными ящиками, но приспособленный для вертикального хранения документов, помещенных в папки. Такая система упорядочивала огромное количество бумаг, позволяя легко найти любую из них, извлечь и вернуть обратно, не нарушая порядка всех остальных.

Вертикальный шкаф с документами был характерен для Америки, а Европа создала свой способ: папки-регистраторы, придуманные в Германии в конце XIX века. Папки могут стоять на полках вместе с книгами, но хранят только проколотые документы, имеющие определенное место среди остальных, но способные его покидать. Российская система хранения документов развивалась под влиянием Европы: к концу 1920-х годов предпочтение отдавалось подшитым в папку документам.

Более подробно об эволюции хранения документов, разных системах классификации картотек и «дробной определенности» читайте в полной версии статьи.

Время чтения: 20 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
21👍11🥰5🤝1
Тест: Угадай слово по его «соседям»

Слова, как и люди, не живут в вакууме. У каждого есть «компания» — другие слова, ассоциаты, которые часто встречаются в похожих контекстах. 

Но эта компания может меняться со временем, так что по изменениям в семантическом окружении слова можно проследить и за изменением его собственного значения.

В новом тесте предлагаем вам догадаться, какое слово прошло ассоциативный путь от «локона» до «специализации», что объединяет «буфетчика» и «антиген» и кто семантически ближе к «апогею» — Спартак или Архимед.

Пройти тест

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
33🔥13👍7
Алфавит «‎Системного Блока»: с чем справляются и не справляются нейросети

Вы наверняка уже видели картинки с алфавитными таблицами, сгенерированными нейросетями: на букву З они рисуют нечто среднее между рыбой и петухом, а для алфавита «‎Смешариков» создают персонажа по имени Акакий. Мы решили выяснить, что нейросеть предложит, если попросить её создать алфавит для «‎Системного Блока» и… результат вы видите на картинке.

К счастью, хоть с этим запросом ChatGPT и DeepSeek пока справляются плохо, они точно смогут помочь со многими другими задачами. От генерации плана урока, который может пригодиться учителю, до удаления лишних символов из субтитров, что облегчает жизнь переводчикам.

Если вы пока не знаете, как и какие нейросети могут облегчить работу вам, мы сделали спецпроект с ИИ-лайфхаками для разных профессий! Переходите по ссылке, чтобы узнать о них больше.

А пока поделитесь в комментариях своими любимыми алфавитами в исполнении нейросетей!

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
35🔥19😁13👍51🙈1
Маршрут перестроен: как распалась Римская империя и при чем тут логистика и сетевой анализ

Почему Карфаген следовало разрушить? Ищем неочевидный ответ на этот вопрос с помощью сетевого анализа и цифровой модели ORBIS от Стэнфордского университета. Этот проект позволяет взглянуть на Римскую империю не как на политическую карту, а как на гигантскую транспортную сеть: с портами, дорогами и речными маршрутами. Рассказываем, что можно узнать благодаря такому взгляду на историю.

Что за проект?

Сетевой анализ, как можно догадаться из названия, позволяет представить данные в виде сети, состоящей из вершин и связывающих их ребер. Получившаяся система  может рассказать больше и о знакомствах Владимира Маяковского, и о диалогах в «‎Войне и мире», и о древних городах. А ученые из Стэнфорда решили использовать этот инструмент для изучения Римской Империи, создав проект ORBIS.

Благодаря ГИСам (геоинформационным системам, о которых мы писали тут) исследователям удалось перенести на карту более 600 объектов (в основном городов и портов), более 85 тысяч км дорог, пустынных троп и горных перевалов и еще почти 30 тысяч км судоходных рек. Это позволило строить маршруты между любыми двумя точками с учетом особенностей времен года. А ещё можно было выбрать самый быстрый, самый дешевый и самый короткий пути (спойлер: совпадали они далеко не всегда).

Что мы узнали о Карфагене?


Благодаря ORBIS исследователям удалось выяснить, что Карфаген следовало разрушить в том числе и потому, что он был слишком «близок» к Риму: хоть они и были разделены морем, путь между этими городами был коротким, дешевым и надежным, особенно в летние месяцы.

Что мы узнали о… Риме?

Рим оказался далеко не самым «‎центральным» городом сети: он проигрывал, например, Константинополю, а также некоторым узлам на стыке провинций, включая Милан и Аквилею. Это связано с многочисленными кризисами, которые заставили римских императоров начиная с III века н. э. искать другие места, где могла бы расположиться администрация.

Подробнее об особенностях торговых и военных маршрутов в Римской империи, а также о том, какой факт Плутарх, вероятно, исказил в биографии Цезаря, узнаете из полной версии статьи.

Время чтения: 15,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥27🏆9🔥8🥰5🙏3👏21
Новая LLM от Маска, агент от OpenAI, самая большая open-source LLM

Рассказываем, что произошло в мире ИИ за последнее время.

Теперь у некоторых новостей появился раздел «Контекст», в котором вы можете узнать, почему мы считаем выбранные новости важными или примечательными. Увы, новости из-за этого выходят чуть объемнее, так что мы делим их на три отдельных поста!


Grok 4 от Илона Маска

Лаборатория Илона Маска xAI представила четвертую версию своей языковой модели Grok.

Модель доступна в двух вариациях — базовой и продвинутой Grok 4 Heavy. Обе модели в основных тестах показывают результаты выше или сопоставимые с лидерами рынка. Grok 4 опередила OpenAI o3Google Gemini 2.5 ProAnthropic Claude 4 в одном из самых сложных на данный момент тесте Humanity’s Last Exam. Экзамен содержит 2500 вопросов из разных сфер знаний, составленных профессорами и исследователями. Эти вопросы публичны и могут использоваться разработчиками для обучения своих моделей. Тестирование проводится на недоступных в интернете вопросах — это снижает риск утечки данных в обучающую выборку  и делает оценку моделей объективнее. Grok 4 и Grok 4 Heavy доступны владельцам платной подписки xAI, а также через API.

Контекст

В отличие от других крупных ИИ-лабораторий, xAI уделяет меньше внимания безопасности своих моделей. Обычно перед релизом языковые модели обучают не генерировать потенциально опасные или оскорбительные ответы — например, рецепты биологического оружия, наркотических веществ или неполиткорректные высказывания о расовой дискриминации. А также выпускают подробные отчеты о способностях моделей нарушать эти ограничения — пример отчета для Claude 4.

Такое отношение к цензуре продиктовано желанием Илона Маска создать «объективную» модель, не подверженную влиянию левой woke-культуры. Последствия подобной политики проявились в недавнем скандале с Grok 3, интегрированной в соцсеть X (бывший Twitter). На некоторое время модель стала считать себя персонажем игры Wolfenstein 3D — MechaHitler — и генерировала антисемитские высказывания. Также она оскорбила премьер-министра Польши. После жалоб пользователей разработчики временно отключили модель, а через четыре дня компания извинилась и вернула в работу исправленную версию.


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥107🤯3
Агент от OpenAI

Компания OpenAI представила ИИ-агента ChatGPT Agent — систему, использующую модели искусственного интеллекта для автономного выполнения задач на компьютере. Агент способен составлять детальные планы путешествий с учетом бюджета, интересов и предпочтений пользователя, анализировать финансовые отчеты и формировать итоговые таблицы, создавать презентации на заданные темы и выполнять множество других задач.

ChatGPT Agent объединяет возможности двух ранее представленных продуктов компании — Operator и Deep Research. Operator умеет взаимодействовать с интерфейсами компьютерных программ (кликать, вводить текст, прокручивать экран) и автоматизировать выполнение различных задач. Deep Research специализируется на поиске, агрегации и анализе информации из интернета. Комбинация этих возможностей позволяет новому агенту более эффективно справляться с поставленными задачами.

Кроме того, агент может взаимодействовать с внешними сервисами (Gmail, Google Calendar, Notion и другими) через протокол MCP, который унифицирует доступ языковых моделей к различным платформам. Подробнее об MCP мы писали здесь.

В тестировании агент продемонстрировал лучший результат в Humanity’s Last Exam и превзошел модели o3 и o4 в тестах на автоматизацию задач. В одном из внутренних тестов агент выполнил половину набора «экономически значимых» задач лучше экспертов-людей.

ChatGPT Agent станет доступен владельцам подписки в ближайшие недели.

Контекст

Агентные системы с использованием языковых моделей — главный тренд 2024–2025 годов. Постоянно улучшающиеся способности моделей позволяют (полу-)автоматизировать все большее количество рутинных задач. Одним из примеров относительно успешного внедрения агентов является сфера разработки ПО — здесь ИИ существенно повышает продуктивность программистов. Генеральный директор Microsoft заявляет, что 30% кода в компании сейчас пишет искусственный интеллект. А глава Shopify объявил использование ИИ для разработки новым обязательным требованием к сотрудникам.

Независимые исследователи считают развитие агентов важным этапом в прогрессе ИИ, поскольку они смогут продемонстрировать политикам экономическую выгоду от искусственного интеллекта. Это приведет к более глубокой интеграции ИИ в рабочие процессы и увеличению инвестиций.

В то же время многие опасаются кризиса на рынке труда из-за потенциальной замены людей ИИ-системами. Сообщества иллюстраторов и художников в большинстве своем выступают против инструментов для генерации изображений и видео, считая, что искусственный интеллект не должен замещать человека в творческих сферах.


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥8
Kimi K2 — самая большая языковая модель в open-source

Китайская лаборатория MoonshotAI опубликовала языковую модель Kimi K2 с 1 триллионом параметров. Это первая модель такого размера в открытом доступе.

LLM использует архитектуру Mixture of Experts: во время генерации ответа модель задействует лишь часть всех параметров (их называют активными). Какие именно параметры используются, зависит от конкретного запроса пользователя. Всего у модели 32 млрд активных параметров — 3,2% от общего числа. Вместе с моделью лаборатория выпустила технический отчет. До выхода Kimi K2 самой большой открытой моделью была DeepSeek V3, которая в 1,5 раза меньше.

Модель не способна генерировать цепочки рассуждений. В сравнении с моделями без режима рассуждений Kimi K2 либо сопоставима, либо существенно превосходит конкурентов — особенно в задачах программирования.

Модель доступна для тестирования на официальном сайте или через API.

Контекст

На рынке языковых моделей существуют проприетарные решения, разрабатываемые крупными лабораториями и корпорациями, и открытые модели, чаще (но не всегда) создаваемые независимыми компаниями.

Из-за высокой конкуренции создатели проприетарных LLM не раскрывают технические подробности своих моделей — в частности, не публикуют детальные технические отчеты и статьи. Разработчики открытых решений, напротив, раскрывают технические детали, публикуют сами модели и иногда код для их обучения, что особенно важно из-за инженерной сложности обучения моделей такого масштаба.

Open-source сообщество вносит большой вклад в развитие всей области — зачастую проприетарные компании используют его разработки. Также оно создает серьезную конкуренцию коммерческим решениям, поскольку пользователи и бизнес могут разворачивать открытые модели на собственных серверах.

Обучение больших языковых моделей крайне сложно и дорого. До этого обучать модели размером порядка триллиона параметров умели только коммерческие компании уровня OpenAI и Google. Появление открытой модели с триллионом параметров стало большим достижением сообщества, сократившим разрыв с закрытыми техногигантами.


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2213👍9
Цифровые кочевники: весь мир – офис

Сегодня более 30 миллионов человек работают удаленно, сохраняя мобильность. В один день цифровые кочевники могут работать с видом на море, а в другой — прямо с гор. Однако они не просто меняют представление о работе и стабильности. «Системный Блокъ» рассказывает, как цифровое кочевничество меняет глобальные рынки труда и локальные экономики, а ещё — формирует новые сервисы.

Кто такие цифровые кочевники?

Благодаря развитию высокоскоростного интернета и облачных сервисов появились цифровые кочевники — люди, выбирающие образ жизни, который позволяет им работать удаленно и регулярно переезжать с места на место. Цифровое кочевничество возникло благодаря повсеместной доступности интернета и изменения ценностей в сторону свободы и мобильности.

И что теперь?

Глобальная и местная экономика меняются под влиянием цифрового кочевничества. Например, нормой становится работа по краткосрочному контракту c гибкой занятостью и проектным сотрудничеством. Приток фрилансеров активизирует рынок недвижимости, а власти и бизнес инвестируют в улучшение интернет-инфраструктуры и комфорт городской среды для привлечения такой аудитории.

А что в этом плохого?

Но есть и другая сторона: повышение спроса сопровождается ростом цен, что ухудшает положение местного населения. Например, русскоязычные кочевники повлияли на рынки аренды и услуг в Грузии, Армении и Турции, однако их отъезд может вызвать упадок в этих сегментах.

Чего ждать дальше от цифровых кочевников?

Развитие цифрового кочевничества будет зависеть от технологических, социальных и политических факторов. С одной стороны, распространение удаленного формата работы, улучшение скорости и доступности интернета и появление специальных виз скорее всего увеличит число цифровых резидентов. С другой — отсутствие стандартов налогообложения, недовольство местного населения ростом цен на жилье и услуги или экологический вред частых перелетов создадут препятствие для развития кочевничества

Более подробно о том, как живут цифровые кочевники, их влиянии на экономику и создаваемых вызовах, а также о будущем цифрового резидентства читайте в полной версии статьи.

Время чтения: 13 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18128👍2👎1