📄 Конвертация сессий Claude Code в HTML 📄
Этот инструмент позволяет преобразовывать файлы сессий Claude Code (JSON/JSONL) в удобные для чтения HTML-страницы с пагинацией. Идеально подходит для архивирования и просмотра сессий в мобильном формате.
🚀 Основные моменты:
- Преобразует сессии в многостраничные HTML-транскрипты.
- Поддерживает локальные и веб-сессии через API Claude.
- Возможность публикации на GitHub Gist для удобного доступа.
- Автоматическое создание папок для хранения выходных данных.
📌 GitHub: https://github.com/simonw/claude-code-transcripts
#python
Этот инструмент позволяет преобразовывать файлы сессий Claude Code (JSON/JSONL) в удобные для чтения HTML-страницы с пагинацией. Идеально подходит для архивирования и просмотра сессий в мобильном формате.
🚀 Основные моменты:
- Преобразует сессии в многостраничные HTML-транскрипты.
- Поддерживает локальные и веб-сессии через API Claude.
- Возможность публикации на GitHub Gist для удобного доступа.
- Автоматическое создание папок для хранения выходных данных.
📌 GitHub: https://github.com/simonw/claude-code-transcripts
#python
❤3👍1🔥1
100 технических вопросов для интервью Data Analyst / Data Scientist (Middle/Senior)
В этом руководстве мы подробно разберем 100 реальных технических вопросов, которые часто встречаются на собеседованиях для аналитиков данных и специалистов по данным уровня middle и senior.
Вопросы сгруппированы по типам компаний (FAANG, стартапы, финтех, консалтинг), по уровню позиции (middle или senior) и по ключевым категориям знаний.
Используя этот гайд, вы сможете оценить свой уровень подготовки, понять глубину ответов, ожидаемую от опытных кандидатов, и избежать популярных ошибок. Давайте перейдем к вопросам. FAANG: Интервью в крупных технокомпаниях (FAANG – Amazon, Apple, Netflix, Google и аналогичные крупные IT-компании) Middle-уровень – FAANG
SQL – примеры вопросов (Middle, FAANG)
https://uproger.com/100-tehnicheskih-voprosov-dlya-intervyu-data-analyst-data-scientist-middle-senior/
В этом руководстве мы подробно разберем 100 реальных технических вопросов, которые часто встречаются на собеседованиях для аналитиков данных и специалистов по данным уровня middle и senior.
Вопросы сгруппированы по типам компаний (FAANG, стартапы, финтех, консалтинг), по уровню позиции (middle или senior) и по ключевым категориям знаний.
Используя этот гайд, вы сможете оценить свой уровень подготовки, понять глубину ответов, ожидаемую от опытных кандидатов, и избежать популярных ошибок. Давайте перейдем к вопросам. FAANG: Интервью в крупных технокомпаниях (FAANG – Amazon, Apple, Netflix, Google и аналогичные крупные IT-компании) Middle-уровень – FAANG
SQL – примеры вопросов (Middle, FAANG)
https://uproger.com/100-tehnicheskih-voprosov-dlya-intervyu-data-analyst-data-scientist-middle-senior/
❤5👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 AI для пентестинга: PentestAgent
PentestAgent — это инструмент для автоматизированного пентестинга с использованием ИИ. Он поддерживает различные модели, включая OpenAI и Anthropic, и предлагает многофункциональный интерфейс для взаимодействия с пользователем. Включает предустановленные инструменты и сценарии для тестирования безопасности.
🚀Основные моменты:
- Поддержка нескольких ИИ моделей для анализа
- Многоуровневый интерфейс с командной строкой и TUI
- Встроенные инструменты для пентестинга
- Возможность работы в Docker для изоляции
- Автоматизация задач с помощью playbooks
📌 GitHub: https://github.com/GH05TCREW/pentestagent
PentestAgent — это инструмент для автоматизированного пентестинга с использованием ИИ. Он поддерживает различные модели, включая OpenAI и Anthropic, и предлагает многофункциональный интерфейс для взаимодействия с пользователем. Включает предустановленные инструменты и сценарии для тестирования безопасности.
🚀Основные моменты:
- Поддержка нескольких ИИ моделей для анализа
- Многоуровневый интерфейс с командной строкой и TUI
- Встроенные инструменты для пентестинга
- Возможность работы в Docker для изоляции
- Автоматизация задач с помощью playbooks
📌 GitHub: https://github.com/GH05TCREW/pentestagent
❤3👍1👎1🔥1
🎤 Создание голоса для нескольких спикеров с VibeVoiceFusion
VibeVoiceFusion — это веб-приложение для генерации высококачественной синтетической речи с возможностями клонирования голоса. Основанное на модели VibeVoice от Microsoft, оно предлагает полный стек решений для управления проектами, генерации диалогов и оптимизации использования VRAM.
🚀 Основные моменты:
- Удобный интерфейс для генерации речи без программирования
- Поддержка многоголосого синтеза с уникальными характеристиками
- LoRA-файнтюнинг для адаптации голоса и передачи стиля
- Генерация нескольких аудиовариаций за один раз
- Оптимизация для потребительских GPU с 10 ГБ+ VRAM
📌 GitHub: https://github.com/zhao-kun/VibeVoiceFusion
VibeVoiceFusion — это веб-приложение для генерации высококачественной синтетической речи с возможностями клонирования голоса. Основанное на модели VibeVoice от Microsoft, оно предлагает полный стек решений для управления проектами, генерации диалогов и оптимизации использования VRAM.
🚀 Основные моменты:
- Удобный интерфейс для генерации речи без программирования
- Поддержка многоголосого синтеза с уникальными характеристиками
- LoRA-файнтюнинг для адаптации голоса и передачи стиля
- Генерация нескольких аудиовариаций за один раз
- Оптимизация для потребительских GPU с 10 ГБ+ VRAM
📌 GitHub: https://github.com/zhao-kun/VibeVoiceFusion
❤2👎1🔥1
Приехали, Линус тоже стал вайб-кодером 😄
В README одного из его хобби-проектов нашли признание: визуализатор ему помог писать ИИ.
Сам Линус честно говорит:
в аналоговых фильтрах он разбирается куда лучше, чем в Python
https://github.com/torvalds/AudioNoise
В README одного из его хобби-проектов нашли признание: визуализатор ему помог писать ИИ.
Сам Линус честно говорит:
в аналоговых фильтрах он разбирается куда лучше, чем в Python
https://github.com/torvalds/AudioNoise
❤11👍4🔥4🤣2🖕1
🚀 Автоматизированная торговля криптовалютами с AI
PowerTrader_AI — это система автоматической торговли, использующая уникальный ИИ для прогнозирования цен на криптовалюту. Она применяет метод kNN для анализа исторических данных и формирования торговых сигналов на основе предсказанных ценовых уровней. Система включает в себя стратегию усреднения (DCA) и управление прибылью для оптимизации сделок.
🚀 Основные моменты:
- Полностью автоматизированная торговля на основе ИИ.
- Использует многовременные прогнозы для принятия решений.
- Включает стратегию DCA для управления рисками.
- Настраиваемые параметры для торговли на разных криптовалютах.
📌 GitHub: https://github.com/garagesteve1155/PowerTrader_AI
PowerTrader_AI — это система автоматической торговли, использующая уникальный ИИ для прогнозирования цен на криптовалюту. Она применяет метод kNN для анализа исторических данных и формирования торговых сигналов на основе предсказанных ценовых уровней. Система включает в себя стратегию усреднения (DCA) и управление прибылью для оптимизации сделок.
🚀 Основные моменты:
- Полностью автоматизированная торговля на основе ИИ.
- Использует многовременные прогнозы для принятия решений.
- Включает стратегию DCA для управления рисками.
- Настраиваемые параметры для торговли на разных криптовалютах.
📌 GitHub: https://github.com/garagesteve1155/PowerTrader_AI
❤4😁4👍1
Визуализация данных помогает разработчикам и аналитикам превращать таблицы цифр в наглядные графики, карты и панели мониторинга. В 2025 году Python остаётся доминирующим языком для анализа данных и визуализации: популярность языка подтверждают исследовательские индексы и рост сообщества. Экосистема Python предлагает десятки библиотек для построения графиков — от классических 2‑D диаграмм до интерактивных веб‑панелей. Ниже приведён обзор самых актуальных библиотек визуализации данных для Python на 2025 год и их отличительные особенности.
https://uproger.com/sravnenie-luchshih-bibliotek-vizualizaczii-dannyh-na-python-v-2025-godu/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🥰2👍1🔥1
Forwarded from Just Xor
📘 Бесплатный онлайн-учебник по математике с практикой на Python.
Это обновлённая версия книги *Exploring Mathematics with Your Computer*,
где все примеры переписаны на Python и дополнены новыми главами.
Книга разбирает идеи математики через код и эксперименты, охватывая:
- основы алгоритмов и математического мышления
- теорию чисел
- вероятность и статистику
- комбинаторику
- численные методы
- фракталы и хаос
- геометрию и графику
- марковские цепи
- продолженные дроби
- кривые и многое другое
Каждая тема сопровождается пояснениями, упражнениями и примерами кода.
Подходит тем, кто уже знает базовый Python и хочет
через практику прокачать математику и алгоритмическое мышление.
📍 Ссылка на книгу: https://coe.psu.ac.th/ad/explore/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Как запустить Qwen у себя на ПК с Python
Совет: если хочешь развернуть Qwen локально без облака, проще всего поставить её через Transformers - модель скачивается один раз и дальше работает офлайн.
Подходит даже для слабых ПК, если брать маленькие версии (например, Qwen-2.5-1.5B-Instruct).
Совет: если хочешь развернуть Qwen локально без облака, проще всего поставить её через Transformers - модель скачивается один раз и дальше работает офлайн.
Подходит даже для слабых ПК, если брать маленькие версии (например, Qwen-2.5-1.5B-Instruct).
# Установка:
# pip install transformers accelerate torch
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
MODEL_NAME = "Qwen/Qwen2.5-1.5B-Instruct"
# Модель и токенайзер загрузятся один раз — потом работают офлайн
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(
MODEL_NAME,
torch_dtype=torch.float16,
device_map="auto" # автоматически использует GPU, если есть
)
prompt = "Объясни простыми словами, чем контейнер отличается от виртуальной машины."
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
**inputs,
max_new_tokens=200,
do_sample=True,
temperature=0.7
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
❤7👍2👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Токенизация в LLM - как “Hello” превращается в цифры.
Токенизация - это первый шаг перед тем, как LLM вообще начнет “думать”.
Модель не понимает текст напрямую.
Она понимает только числа.
Поэтому любой текст сначала разбивается на маленькие кусочки - токены:
- иногда это целые слова
- иногда части слов (su, per, man)
- иногда один символ
- иногда даже пробел - тоже токен
Пример:
Фраза "I love programming" разбивается не обязательно на слова, а на кусочки слов:
Обрати внимание:
- " love" начинается с пробела - потому что пробел тоже часть токена
- programming разделилось на 2 токена: " program" + "ming"
То есть Токенизация - это когда LLM режет текст на маленькие кусочки (токены) и переводит их в числа.
Важно:
Чем больше токенов - тем дороже запрос и тем быстрее съедается контекст.
Плохая токенизация = странные ошибки (особенно в коде, ссылках, редких словах).
Поэтому LLM отлично понимают частые слова, но могут путаться на редких именах, терминах и смешанных языках.
И лайфхак: если хочешь “дешевле” и “чище” ответы - пиши короче, без мусора, без повторов.
Контекст - это валюта.
https://www.youtube.com/shorts/A7DCcYLq38M
Токенизация - это первый шаг перед тем, как LLM вообще начнет “думать”.
Модель не понимает текст напрямую.
Она понимает только числа.
Поэтому любой текст сначала разбивается на маленькие кусочки - токены:
- иногда это целые слова
- иногда части слов (su, per, man)
- иногда один символ
- иногда даже пробел - тоже токен
Пример:
Фраза "I love programming" разбивается не обязательно на слова, а на кусочки слов:
[I] ,[ love] ,[ program] , [ming]Обрати внимание:
- " love" начинается с пробела - потому что пробел тоже часть токена
- programming разделилось на 2 токена: " program" + "ming"
То есть Токенизация - это когда LLM режет текст на маленькие кусочки (токены) и переводит их в числа.
Важно:
Чем больше токенов - тем дороже запрос и тем быстрее съедается контекст.
Плохая токенизация = странные ошибки (особенно в коде, ссылках, редких словах).
Поэтому LLM отлично понимают частые слова, но могут путаться на редких именах, терминах и смешанных языках.
И лайфхак: если хочешь “дешевле” и “чище” ответы - пиши короче, без мусора, без повторов.
Контекст - это валюта.
# Tokenization demo (Python)
# pip install tiktoken
import tiktoken
text = "I love programming in Python 🐍"
enc = tiktoken.get_encoding("cl100k_base")
tokens = enc.encode(text)
print("Text:", text)
print("Token IDs:", tokens)
print("Tokens count:", len(tokens))
# decode back
print("\nDecoded tokens:")
for t in tokens:
print(t, "->", repr(enc.decode([t])))
https://www.youtube.com/shorts/A7DCcYLq38M
❤5👍2🔥1
Forwarded from Machinelearning
RealOmni - это не просто каталог видео, где роборука хватает кубик на белом столе. Это мультимодальный подарок с траекториями, аннотациями и движениями суставов.
Картинка с Fisheye-камер, данные IMU (инерциалка), энкодеры и данные с тактильных датчиков с разрешением 1 мм.
Снимали в 3000 реальных домах, никаких стерильных лабораторий: складывание одежды, завязывание шнурков, разбор посуды и сортировка всякого хлама.
Почти все таски двурукие.
Медианная длина клипа ~ 210 секунд. То есть это не "схватил-положил", а полноценные процессы "достать, сложить, убрать в ящик".
В свежем обновлении добавили 35 тыс. клипов с фокусом на разгребание куч разнородных предметов. Это именно та задача, на которой сыпется большинство моделей.
Немного цифр о всем датасете
Весть проект запланирован объемом 95 ТБ и хронометражем 10,000 часов. Но если посчитать, то что уже залито (Stage 1 + Stage 2), то суммарно около 5.4 ТБ и ~1600 часов. Остальное обещают догрузить as soon as possible.
Данные собраны специфическим гриппером GenDAS, так что если у вас другой сенсорный массив (или его нет), transfer learning может стать болью. Ассеты заточены под железку GenRobot.
Это все еще телеоперация. То есть мы учим робота копировать движения человека-оператора и если он тупил или руки дрожали сетка это тоже выучит.
Тем не менее, это очень крутой релиз для тех, кто пилит домашних роботов. Данные по завязыванию шнурков и разбору предметов в open-source редкость.
@ai_machinelearning_big_data
#AI #ML #Robotics #Dataset #RealOmni #GenRoborAI
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥1
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
❤3🔥2👍1🥱1