BigData Team (BDT)
757 subscribers
412 photos
13 videos
297 links
BigData Team: the way you learn best

Практико-ориентированное обучение по Big Data, Machine Learning, промышленной разработке на Python.

https://bigdatateam.org/ru

Чтобы бустнуть: https://xn--r1a.website/boost/bigdatateam
Download Telegram
Кто рано сдает, тому BigData Team грант выдает... 🤌

Мы решили переиграть в словах и посчитать в цифрах народную мудрость (не путать с феноменом "мудрость толпы" Фрэнсиса Гальтона, широко используемой в ансамблевых алгоритмах машинного обучения)

У нас было три основных волны отбора кандидатов + 1 дополнительная (последний вагон). Несложно догадаться, что кто раньше встал сдал, того и тапки гранты. Но для математиков (аналитиков), всегда интересно посчитать "the odds" (шансы, будь то игра в покер или оптимизация логистической регрессии на обучающей выборке).

Возьмем для примера конкурс по Астане:
1:5 — если сдали тест вовремя, то конкурс 5 кандидатов на место
1:10 — если сдали тестирование неделей позже ("последний вагон"), то шансы в 2 раза хуже
1:4 — если сдавали тестирование на неделю раньше до объявленного всегобщего дедлайна (волна 2)
1:3 — за 2 недели раньше 😱

Ну что, будете теперь заблаговременно сдавать проекты, домашние задания, тестирования или заблаговременно начинать подготовку к важным моментам в жизни?

Если полезно - ставь лайк и пересылай другу, который делает все в последний момент 😉

BigData Team: the way your learn best
#random
🔥15531
🔥 Big Data, осталось 4 места

Возвращаемся к международным новостям или рубрике "не Tech Orda единым". Многие любят делать все в последний момент (пример), поэтому напомним:
— Практический курс по Big Data проходит два раза в год
— Если хотите на Big Data и не запишитесь сейчас, то следующая доступная запись будет на февраль 2025-го

Ключевая информация
🗓 2 поток: 19.08.2024 — 27.10.2024
👉 полное описание + запись
▶️ пример видеоролика с курса (5 min)

Дополним новым отзывом выпускника последнего запуска:
Ваш курс — это топ из всего, что я видел. Я занимался на Coursera, на разных платформах, и, действительно, у вас всё настолько качественно проработано: и отношение, и обновления, и быстрое оперативное решение всех проблем. У меня только положительные эмоции после курса. В итоге я понимаю, что в голове осталось немало полезной информации, тем более что задачи очень хорошо практически закрепляются. Если просто посмотрел видео и пошёл бы дальше, то осталось бы, как Алексей изначально говорил, процентов 10 в лучшем случае, с непониманием что это за информация и что с ней дальше делать. Я остался очень доволен и курсом, и полученным результатом.

(c) Сергей

BigData Team: the way your learn best
#work #study #feedback
🔥5❤‍🔥41
🍪 Тема дня: файлы cookie

Пока:
1. IT школы распределяют гранты для раунда 2
2. Вы решаетесь записаться на курс по Big Data
2. Или просто ждете новых анонсов BigData Team: Learning Series

Рекомендуем познакомиться или освежить знания по теме "cookies" в картинках.

🔄 Тема прошлого выпуска: рекурсия

credit за находку: руководителю инфраструктуры BigData Team

#meme
5🔥4😁2👏1
🎁 Гранты от BigData Team

Завтра (20.08) начинается раунд 2 распределения грантов и "листов ожидания" на платформе Astana Hub:
🧑‍🏫 20-22 августа, вы можете принять "грант", условия обучения в формате "лист ожидания" (обучение совместно с общей группой грантников, с возможностью перейти на обучение по гранту на условиях школы) или пропустить раунд.

см. полный timeline

Наша школа распределила около 40 грантов Tech Orda. Решением директора, компания выделила 10 грантов в размере 600,000 тенге от BigData Team (грант BDT) . 7 грантов BDT (статус "лист ожидания" на платформе Astana Hub) уже согласованы, осталось еще 3.

Каждый, кто проходил тестирование, получил обратную связь по почте (на всякий случай проверьте папку "спам"). Гранты BDT получат те, кто первым примет решение по обучению и предпримет шаги для их согласования.

Есть кандидаты, которым было отправлено предложение гранта, но поскольку согласование шло медленно, то эти гранты освободили и предоставляем в рамках общего конкурса. Смело пишите на почту techorda@bigdatateam.org и уточняйте условия.

BigData Team: the way your learn best
#work #study #BigDataTeam #TechOrda #AstanaHub
9🔥3👍2🎉2
📚 Fairness-Aware Meta-Learning via Nash Bargaining

Вам приходилось слышать, чтобы Джордан использовал подходы Нэша? Если вы про баскетбол, то нет, а если про математику - то ловите.

Некоторые факты:
— статья свежая, опубликована на arXiv в июне 2024-го
— часть работы была сделана при участии коллег из Meta AI
— работа выполнена при поддержке европейского гранта ERC Ocean

Подход может применяться в ML при работе с "несбалансированными" датасетами. Чуть точнее в части перевода "imbalanced" — там где нам важно качество не в среднем, а по каждому классу (тизер на скриншоте).

Отдельный респект:
— код доступен на github: reds-lab/Nash-Meta-Learning

Всем приятного чтения и использования в production.

🤗 плюс в карму за лайк и репост

#study
7🔥3👨‍💻2
📚 Подборка книг для жизни

Слушатели Практического курса по Big Data, собрали подборку книг, которые цепляют, вдохновляют или даже меняют мировоззрение ♥️

Делимся этим сокровищем с вами:
1. Эрнест Хемингуэй, По ком звонит колокол
2. Хорхе Луис Борхес, Сад расходящихся тропок
3. Рэй Дуглас Брэдбери, Лед и пламя
4. Дэвид Дойч, Начало бесконечности
5. Чак Паланик, Бойцовский клуб
6. Джо Аберкромби, любые произведения
7. Уильям Гибсон, Киберпространство (трилогия)
8. Роберт Хайнлайн, Время для звёзд
9. Антуан де Сент-Экзюпери, Маленький принц
10. Федор Достоевский, Бесы

И еще немного рекомендаций:
🔸 Юваль Ной Харари, Sapiens. Краткая история человечества
🔸 Джордж Самюэль Клейсон, Самый богатый человек в Вавилоне
🔸 Ben Bergeron, Christine Bald, Unlocking Potential: How Great Leaders Get The Most Out of Individuals, Teams & Organizations

👉 Делитесь в комментариях, какие книги вдохновляют вас. Другие интересные подборки, доступны в разделе "заметки выпускников" 🎓 #alumni

🗓 обучения в 2024
#study #life
11🔥5🥰1
🔬 Августовские LLM-эксперименты

Изолированного от интернета (и адекватного) LLM-помощника для изучения казахского языка я пока еще не запустил. Хотя релиз Llama 405B намекает, что все возможно (если у вас свой GPU кластер 😬). Для ноута модельки можно выбрать полегче и посмотреть на качество 8B (как говорится, подписывайтесь и ставьте лайки).

Для работы решил сократить T2M и подключил нейро-помощника с интеграцией в Google (модели Gemini) и Open AI. Приятно, что Google (в отличие от Open AI) можно подключить по API абсолютно бесплатно, без с регистрацией, но хотя бы без смс.

Считаем ROI:
инвестиции: 3.5 часа на изучение документации, эксперименты и поиск котиков
результат: сервис на streamlit с интеграцией в несколько LLM по API. Керемет!

🤔 Какая-нибудь инструкция нужна, чтобы запустить это самостоятельно или (для программистов) и так все ясно?

#work #life
🔥114👎1🥰1
отгадайте кто это?

// ответ под катом

#random
🤔101
🎉 Big Data кораблю - Big Data плавание. Мы запустились!

Счастливых людей как на фото, так и за черными экранами монитора, ждет большое путешествие в мир Big Data и Machine Learning инженерии. Пожелайте коллегам удачи! ❤️

На первой неделе обучения мы уже успели поговорить про профайлинг кода на Python, оптимизацию вычислений и ООП. Неплохой старт, неправда ли?

Если хотите погрузить в мир ООП самостоятельно, от уровня "beginner" до уровня "advanced", то обратите внимание на нашу подборку:
📚 Классы и ООП, полезные материалы

BigData Team: the way your learn best
#work #study #life
🔥116🎉4
😊 Инсайды второй недели обучения

Пишите в комментариях: а какой ваш любимый редактор или IDE?

// Credit (за находку): Виталий М.

#meme #random
😁8
👨‍💻 VSCode без Microsoft телеметрии

Программистам на заметку:
https://github.com/VSCodium/vscodium

Вопрос в продолжение голосовалки за любимый редактор: у кого-нибудь безопасники проверяли исходники VSCodium? Microsoft телеметрии нет, но, возможно, какие другие закопали?

P.S. ChatGPT за эту информацию мамой не клянется 🤔

#work
7
🔬 Big Datych учится быть учителем

Еще никогда не было так просто подружить LLM с векторной базой данных. Зацените, что умеет новая версия Big Datych'а, полностью изолированная от интернета.

💁‍♂️ Технические детали: за основу взяли LLama3.1 8B и, вероятно, месяц+ будем чистить для него данные. У нас благо накопилось несколько лет коммуникаций со слушателями курсов по Big Data, Python и Machine Learning. Как будет время - расскажем поподробнее. Кому не терпится попробовать самостоятельно - ловите ссылку на github и сохраняйте пост в "любимые" 🫶

🔥 Выпускники учебной программы Big Data / Machine Learning Engineer (проходит при поддержке грантов Tech Orda и BigData Team) научатся дообучать LLM в консоли (ноутбуках) под нужды компании, поэтому записывайтесь в очередь за выпускниками по адресу study@bigdatateam.org.

BigData Team: the way your learn best
#work #study #BigDatych
🔥75
Forwarded from DSML.KZ Новости (Ayana Mussabayeva)
Митап для NLP специалистов от Beeline Kazakhstan и QazCode | 24.10.2024, 17:00 | Almaty

24 октября в DAR U мы подискутируем о языковых моделях! Data Scientist QazСode (Beeline) Бексултан Сагындык поделится свежими трендами в NLP и расскажет, как казахский язык интегрируется в эпоху LLM. Бексултан - один из тех, кто разрабатывает ИИ на казахском в Beeline Казахстан и QazCode.

А после - квартирник с экспертами из QazCode, Big Data Team и Conformal Group, с дискуссией об NLP в бизнесе: как применять LLMs в реальных кейсах.

Дата: 24.10, 17:00
Место проведения: DAR U, Коктем-2, 22, 4 этаж

Мероприятие бесплатное, но количество мест ограничено, регистрация по ссылке
🔥61
🧠 Внимание, NLP-специалисты Алматы! 🧠

Уже 24 октября в 17:00 пройдет митап от Beeline Kazakhstan и QazCode, посвященный языковым моделям! 🔥

🎉 Специально для наших подписчиков проводим конкурс: напишите “” в комментариях, и случайным образом мы выберем одного счастливчика, который получит гарантированное место на мероприятии!

Результаты будут объявлены 23 октября в 15:00 (ALA)

📍Конкурс открыт только для жителей Алматы, но если вы из другого города, не стесняйтесь, напишите свой город в комментариях — нам важно знать, где еще есть интерес к NLP!

Не упустите шанс окунуться в мир языковых моделей и получить ценные знания! 🚀

#study #life
🔥121
✍️ Востребованные в индустрии навыки

BigData Team - это не только ценных мех обучение, но и профессиональное сообщество. Прежде чем разрабатывать новый учебный модуль мы обсуждаем с коллегами, какие знания и навыки востребованы непосредственно в их IT-департаменте.

Боли SQL из первых уст:
с оконными функциями прям беда, когда чуть более сложные ранжирования

(c) Алексей Казюлин, Senior Manager @ Yandex.Лавка

В целом, мы собрали список из 10 болей SQL. Поможете собрать 100 лайков, чтобы узнать остальные?

P.S. если казы собирают 35+ лайков, то будет ли сложно собрать 100 лайков по целевой тематике? 🤔 казы vs SQL, round 1

BigData Team: the way your learn best
#study
14👍4🔥4
🤓 Бесплатный интенсив по диффузионкам 👩‍🎨

Обучение в ШАД для меня было не просто трамплином в карьере, а настоящим ракетным ускорителем. Я с большим теплом вспоминаю бессонные ночи этот период и качество полученных практических знаний и навыков. А поэтому всегда горячо рекомендую релевантные активности от ШАД.

Уже на следующей неделе (25 ноября) стартуют первые лекции интенсива по диффузионным моделям (или на понятном - как делать изображения с помощью нейронок).

Налетай, торопись, покупай живопись (c)
🗓 deadline подачи заявки: 2024.11.24

Ставь лайк, регистрируйся и делись с друзьями.

P.S. фото "до" и "после" обучения в ШАД и методов инструментов заработка на жизнь.

#study
7👍3🔥2
👩‍🎓 Истории выпускников, именные гранты

Зинура — выпускница специализации Big Data / Machine Learning Engineer [BDMLE 2023-2024], а также обладательница сразу двух грантов: (1) памяти М.А. Ройтберга и (2) Tech Orda.

👉 Прямая речь - в карусели. Накидайте лайков, если хотите больше историй или нового раунда распределения именных грантов на обучение от BigData Team и ИТ-друзей.

Тем временем, мы напомним: 2 декабря планируется последний запуск 2024-го года — запуск курса промышленной разработки на Python:
🗓 3 поток: 02.12.2024 — 23.02.2025
👉 полное описание + запись
▶️ демо-ролик с курса (9 min) и последние отзывы

‼️ Одна учебная группа уже укомплектована, а во второй у нас осталось всего 5 мест. Не упустите свой шанс получить навыки разработки, востребованные в ведущих международных IT компаниях.

P.S. предварительную заявку (до оплаты) можно оставить на сайте по ссылке.

BigData Team: the way your learn best
#study #life #TechOrda #alumni
🔥52