Заметки математика-программиста, Алексей Драль
730 subscribers
924 photos
24 videos
1 file
335 links
Founder at @BigDataTeam | ex. Amazon | 100k+ студентов
Your guide to the world of Big Data & AI

Бесплатный DS/ML тест: проверь уровень, получи рекомендации
👉 https://goo.gl/forms/vxfEMvKxfiCVWATl1

Блог про страны, работу, книги и наблюдения
Download Telegram
🔬 Лайфхаки интернета без интернета

Это конечно нечто. Летишь ты домой в Алматы, взял в 8-часовой перелет все необходимое - шоколадку Казахстан, воду Самал и книжку для чтения.

В книге встречаются незнакомые слова, а загуглить возможности нету. Что делать? И какое это крутое осознание, что у тебя на компе есть не доступ к интернету, а база знаний, из него собранная, которая умеет с тобой разговаривать (см. скриншот).

Подготовка к путешествию (для Mac OS):
brew install ollama
brew services start ollama
ollama pull llama3.1
brew services stop ollama # если не пользуемся и не хотим грузить оперативку


Запуск сервиса для общения:
brew services start ollama  # запускаем демона в бекграунде (если был выключен)
ollama run llama3.1 # запускаем разум


Наблюдения:
* у меня на компе была 3.1 (4.7 GB), поэтому запускал ее. Немного поигрался с версией 3.2 (легковесная и быстрая - 2GB) и, кажется, что модель 3.1. более разумная для ответов на мои частные вопросы;
* у ребят, дообучающих модель для разговоров на казахском, тоже в базе использовалась модель 3.1, а не 3.2;
* есть еще модель 3.3, но для ее работы нужно 42 GB, поэтому затаскивать на ноут для экспериментов не стал.

#work #life
👍8🔥75👏1
💝 Именные гранты на обучение, Александр Гущин

Сегодня произошло историческое событие. Мы с Александром подписали договор о грантовой поддержке в размере 40 грантов 🔥😱 на курс Big Data / Machine Learning Engineer.

Это нереально круто, когда в окружении есть люди, которые сами добились международных высот, а теперь делают социальные проекты такого масштаба.

Это независимый конкурс, который мы проводим в дополнение к конкурсу Tech Orda. И данное мероприятие не будет ограничено Казахстаном и возрастными ограничениями. Мы будем готовы взять на обучение каждого, кто сможет освоить учебную программу и кому грантовая поддержка необходима. Правила именной грантовой поддержки прежние - грант покрывает 50% стоимости обучения на курсах для развития в области Data Science (DS) или Data Engineering (DE).

Даты и дедлайны
*** здесь раньше был план, если бы мир был круглый, идеальный и без форс-мажоров ;)

Формат тестирования и критерии отбора мы планируем опубликовать позже. А пока проходите небольшой тест по базе Python и математики для ML, чтобы получить рекомендации по подготовке и развитию в сфере ML.

🍿 Bonus
Пока Александр в Алматы предлагаем встретиться в 19:00 в субботу (11.01). Вы сможете познакомиться с Сашей лично, узнать о его опыте, что его сподвигло на такой масштабный социальный проект, а также предложить ваши критерии Саше для отбора на гранты самых достойных.

Все анонсы будут опубликованы в официальных пабликах BigData Team и личных каналах (Александр, Алексей). Не забывайте подписываться.

❗️ Пишите под катом ваши предложения, где такие встречи (e.g. PlatformA) удобно проводить и накидывайте "+", чтобы сориентироваться по числу желающих.

P.S. также пишите, какие крутые факты вы нагуглили про Сашу, а мы на неделе опубликуем его полную копилку достижений.

BigData Team: the way your learn best
#work #study
🔥197🤩3👍1
Forwarded from BigData Team (BDT)
💝 Истории замечательных людей, Александр Гущин

В первую очередь мы хотим отметить насколько сложно попасть в TOP 1% какого-либо международного рейтинга. А теперь представьте, что вам нужно попасть в ТОП 5 абсолютного рейтинга 🔥

Факт #1: Саша сделал невозможное - стал #5 в рейтинге Kaggle (в 2017-м году).

Факт #2: Если вы работаете в DS, то почти наверняка пользовались инструментами, которые Саша разрабатывал. Саша работал в роли Fullstack ML Engineer в компании Iterative AI, которая делает продукты типа DVC.

Факт #3: Совпадение? 🤔
По стечению обстоятельств, Саша, как и другие грантодатели (М.А. Ройтберг, Алексей Драль, Виктор Кантор, Эмели Драль) тоже обожает образование. Он преподает как в СНГ, так и за рубежом. В дополнение к этому он руководит подготовкой школьников к международной олимпиаде по AI (IOAI).

Bonus факт: до 10-го класса Саша жил и учился в небольшом городе Казахстана (Павлодар) 🇰🇿

Подписаться на профиль Саши можно на LinkedIn и в телеграм.

P.S. информация по доступным и распределенным именным грантам: тут

BigData Team: the way your learn best
#work #study
🔥151👍1👎1
✍️ Соскучились по красивой физике и математике?

Покажите это вашему ребенку - и его потом от науки за уши не оттащишь. Мне повезло, поскольку у моего деда в туалете было полное собрание сочинений 😅

У кого ручки чешутся - пишите в комментариях какой номер трамвая получился у вас (чтобы не спойлерить ответ сразу).

Подборку журнала Квант за историю 1970 - 2010 удобнее всего будет скачать с этого архива (и читать с помощью DJView). А вот современные выпуски уже в привычном PDF, см. по ссылке: https://kvant.mccme.ru/

Из январского выпуска прошлого года вы также сможете узнать, когда Луна приобретает форму булочки. Разве это не прекрасно?

#life #study
🔥11👍43
💝 Истории замечательных людей, Антон

1-3 раза в год мы делимся историями о членах нашего небольшого профессионального сообщества BigData Team. Новый год, история первая.

Антон проходил обучение на курсе промышленной разработки на Python в конце 2022-го. И как один из лучших выпускников попал в менторское сообщество. Антон пока еще не попал в TOP-10 нашего внутреннего Leaderboard по метрике числа отвеченных вопросов. Но уже попал в попал в ТОП-3 ментора по направлению Python.

Из первых уст:
В настоящий момент я работаю на позиции Junior Software Engineer в Ozon Tech. Учусь в магистратуре ВШЭ по направлению инженерии данных. Ранее работал в PwC, Raiffeisenbank. Сфера текущих профессиональных интересов: Big Data, ML/DL. Также увлекаюсь бегом (5км, 10км, полумарафон), футболом и постоянным прохождением каких-либо курсов.


✍️ Недавно Антон решил попробовать себя в роли автора статей по Python:
Условная конструкция match case в Python

Поддержите пробу пера, накидайте Антону лайков.

Истории замечательных людей, прошлые выпуски:
Света, Николай, Дмитрий, Женя, Андрей

#study #python
🔥12👍5👏3
CEO без понтов — в Казахстане не CEO 😎

Заказал фирменную подставку для телефона за 1,450 тенге, теперь можно работать в удовольствие.

#random
😁22🔥169👍4
🏔 Алматы, январь

Я ведь знаю, что соскучились по Алматы. Последний раз делился закатами в сентябре, у меня все записано 😎.

P.S. я только сейчас осознал, что не поделился с вами закатами из Кении. Исправлюсь в следующих публикациях.

#random
🔥107👏3
Media is too big
VIEW IN TELEGRAM
🏔 Медео-Шымбулак, сумерки 🎧 sound on

Друзья, с ростом числа подписчиков видимо нужно попросить бустов, чтобы можно было закидывать в сторис красивые видео природы.

🥺 подкиньте, пожалуйста

#travel #kazakhstan
11🔥7💘3👏1
😎 Опыт, гибрид человека и LLM ==> скорость работы 5x

Пока китайцы дизраптят рынок и все остальные пытаются понять, правда ли это, что state-of-the-art LLM можно обучить не за 60 млн $, а всего за $5.5M (подробности). Нам, землянам, приходится привыкать и делиться друг с другом опытом использования этих достижений.

От лирики к опыту
На прошлой неделе, в связи с подготовкой к конкурсу на гранты, нам нужно было проанализировать многолетний опыт отбора на гранты (внутренняя кухня CRM) и пользовательский опыт сдачи тестирований. Я просто в восторге афиге от современной скорости исследований и экспериментов в IT.

Если раньше нужен был толковый IT специалист и целый день, чтобы обработать данные, обучить несколько моделей машинного обучения с целью проверить гипотезы, выдвинуть новые (и повторить). То сейчас, весь цикл до получения результата умещается в несколько часов. Мне только пришлось помочь* GPT построить график по значимости факторов на основе Shapley values.

*к сожалению, библиотека SHAP в Python не всегда легко устанавливается. Например, на виртуалке, где крутился GPT агент, это сделать не удалось.

Last, but not least
Кстати, кто не в курсе, кто такой Lloyd Shapley и за что ему дали нобелевку по экономике в 2012 (видео с вручения), посмотрите очень доступное (без шуток) видео с его выступлением на 7.5 минут по ссылке (про то, как сделать максимально "справедливые", с точки зрения общества, союзы мальчиков и девочек).

Call to action
👉 те, кто хочет получить серьезный бекграунд в сфере ML - вы знаете, где нас искать 😉
👇 поделитись вашими лайфхаками оптимизации работы с помощью LLM / GPT

#work
🔥122
😯 ух ты, вам приходилось видеть как лежит GitHub?

Следим за инцидентами и разбирательствами:
https://www.githubstatus.com/

По моему опыту, самая частая проблема восстановления при повышенной нагрузке - это когда все дружно начинаются смотреть: "а что - реально сломалось?"
Users may experience timeouts in various GitHub services. We have identified an issue with our caching infrastructure and are working to mitigate the issue
Jan 30, 2025 - 14:46 UTC

Пойдем дружно посмотрим? 😅

P.S. вот у кого-то сегодня подгорает 🔥

#work #random
😁10🔥5
Forwarded from BigData Team (BDT)
📚 Как подготовиться к техническому собеседованию

⭐️ Продолжаем делиться советами для подготовки к интервью в Big Tech. Сегодня обратим внимание на книгу, которую рекомендуют даже топовые специалисты: Cracking the Coding Interview.

Книга помогает научиться грамотно доносить свои идеи на интервью и подготовиться к его технической части, а 189 задач с разбором помогут «набить руку». Cracking the Coding Interview также предлагает закулисный взгляд автора на то, как крупные компании, вроде Meta или Google нанимают специалистов.

😊 Книга вкупе с постоянной практикой поможет подготовиться к техническому собеседованию.

BigData Team: the way your learn best
#study
🔥63👍2👏2💘1
🌇 The things we do for love

Воспоминания по Новому Году и whiskey sour.
Что бросить первым? (см. цитату)

#travel 🇲🇾 #malaysia
🔥92🥰2