🔬 Лайфхаки интернета без интернета
Это конечно нечто. Летишь ты домой в Алматы, взял в 8-часовой перелет все необходимое - шоколадку Казахстан, воду Самал и книжку для чтения.
В книге встречаются незнакомые слова, а загуглить возможности нету. Что делать? И какое это крутое осознание, что у тебя на компе есть не доступ к интернету, а база знаний, из него собранная, которая умеет с тобой разговаривать (см. скриншот).
Подготовка к путешествию (для Mac OS):
Запуск сервиса для общения:
Наблюдения:
* у меня на компе была 3.1 (4.7 GB), поэтому запускал ее. Немного поигрался с версией 3.2 (легковесная и быстрая - 2GB) и, кажется, что модель 3.1. более разумная для ответов на мои частные вопросы;
* у ребят, дообучающих модель для разговоров на казахском, тоже в базе использовалась модель 3.1, а не 3.2;
* есть еще модель 3.3, но для ее работы нужно 42 GB, поэтому затаскивать на ноут для экспериментов не стал.
#work #life
Это конечно нечто. Летишь ты домой в Алматы, взял в 8-часовой перелет все необходимое - шоколадку Казахстан, воду Самал и книжку для чтения.
В книге встречаются незнакомые слова, а загуглить возможности нету. Что делать? И какое это крутое осознание, что у тебя на компе есть не доступ к интернету, а база знаний, из него собранная, которая умеет с тобой разговаривать (см. скриншот).
Подготовка к путешествию (для Mac OS):
brew install ollama
brew services start ollama
ollama pull llama3.1
brew services stop ollama # если не пользуемся и не хотим грузить оперативку
Запуск сервиса для общения:
brew services start ollama # запускаем демона в бекграунде (если был выключен)
ollama run llama3.1 # запускаем разум
Наблюдения:
* у меня на компе была 3.1 (4.7 GB), поэтому запускал ее. Немного поигрался с версией 3.2 (легковесная и быстрая - 2GB) и, кажется, что модель 3.1. более разумная для ответов на мои частные вопросы;
* у ребят, дообучающих модель для разговоров на казахском, тоже в базе использовалась модель 3.1, а не 3.2;
* есть еще модель 3.3, но для ее работы нужно 42 GB, поэтому затаскивать на ноут для экспериментов не стал.
#work #life
👍8🔥7❤5👏1
💝 Именные гранты на обучение, Александр Гущин
Сегодня произошло историческое событие. Мы с Александром подписали договор о грантовой поддержке в размере 40 грантов 🔥😱 на курс Big Data / Machine Learning Engineer.
Это нереально круто, когда в окружении есть люди, которые сами добились международных высот, а теперь делают социальные проекты такого масштаба.
Это независимый конкурс, который мы проводим в дополнение к конкурсу Tech Orda. И данное мероприятие не будет ограничено Казахстаном и возрастными ограничениями. Мы будем готовы взять на обучение каждого, кто сможет освоить учебную программу и кому грантовая поддержка необходима. Правила именной грантовой поддержки прежние - грант покрывает 50% стоимости обучения на курсах для развития в области Data Science (DS) или Data Engineering (DE).
Даты и дедлайны
*** здесь раньше был план, если бы мир был круглый, идеальный и без форс-мажоров ;)
Формат тестирования и критерии отбора мы планируем опубликовать позже. А пока проходите небольшой тест по базе Python и математики для ML, чтобы получить рекомендации по подготовке и развитию в сфере ML.
🍿 Bonus
Пока Александр в Алматы предлагаем встретиться в 19:00 в субботу (11.01). Вы сможете познакомиться с Сашей лично, узнать о его опыте, что его сподвигло на такой масштабный социальный проект, а также предложить ваши критерии Саше для отбора на гранты самых достойных.
Все анонсы будут опубликованы в официальных пабликах BigData Team и личных каналах (Александр, Алексей). Не забывайте подписываться.
❗️ Пишите под катом ваши предложения, где такие встречи (e.g. PlatformA) удобно проводить и накидывайте "+", чтобы сориентироваться по числу желающих.
P.S. также пишите, какие крутые факты вы нагуглили про Сашу, а мы на неделе опубликуем его полную копилку достижений.
BigData Team: the way your learn best
#work #study
Сегодня произошло историческое событие. Мы с Александром подписали договор о грантовой поддержке в размере 40 грантов 🔥😱 на курс Big Data / Machine Learning Engineer.
Это нереально круто, когда в окружении есть люди, которые сами добились международных высот, а теперь делают социальные проекты такого масштаба.
Это независимый конкурс, который мы проводим в дополнение к конкурсу Tech Orda. И данное мероприятие не будет ограничено Казахстаном и возрастными ограничениями. Мы будем готовы взять на обучение каждого, кто сможет освоить учебную программу и кому грантовая поддержка необходима. Правила именной грантовой поддержки прежние - грант покрывает 50% стоимости обучения на курсах для развития в области Data Science (DS) или Data Engineering (DE).
Даты и дедлайны
*** здесь раньше был план, если бы мир был круглый, идеальный и без форс-мажоров ;)
Формат тестирования и критерии отбора мы планируем опубликовать позже. А пока проходите небольшой тест по базе Python и математики для ML, чтобы получить рекомендации по подготовке и развитию в сфере ML.
🍿 Bonus
Пока Александр в Алматы предлагаем встретиться в 19:00 в субботу (11.01). Вы сможете познакомиться с Сашей лично, узнать о его опыте, что его сподвигло на такой масштабный социальный проект, а также предложить ваши критерии Саше для отбора на гранты самых достойных.
Все анонсы будут опубликованы в официальных пабликах BigData Team и личных каналах (Александр, Алексей). Не забывайте подписываться.
❗️ Пишите под катом ваши предложения, где такие встречи (e.g. PlatformA) удобно проводить и накидывайте "+", чтобы сориентироваться по числу желающих.
P.S. также пишите, какие крутые факты вы нагуглили про Сашу, а мы на неделе опубликуем его полную копилку достижений.
BigData Team: the way your learn best
#work #study
🔥19❤7🤩3👍1
Forwarded from BigData Team (BDT)
💝 Истории замечательных людей, Александр Гущин
В первую очередь мы хотим отметить насколько сложно попасть в TOP 1% какого-либо международного рейтинга. А теперь представьте, что вам нужно попасть в ТОП 5 абсолютного рейтинга 🔥
Факт #1: Саша сделал невозможное - стал #5 в рейтинге Kaggle (в 2017-м году).
Факт #2: Если вы работаете в DS, то почти наверняка пользовались инструментами, которые Саша разрабатывал. Саша работал в роли Fullstack ML Engineer в компании Iterative AI, которая делает продукты типа DVC.
Факт #3: Совпадение? 🤔
По стечению обстоятельств, Саша, как и другие грантодатели (М.А. Ройтберг, Алексей Драль, Виктор Кантор, Эмели Драль) тоже обожает образование. Он преподает как в СНГ, так и за рубежом. В дополнение к этому он руководит подготовкой школьников к международной олимпиаде по AI (IOAI).
Bonus факт: до 10-го класса Саша жил и учился в небольшом городе Казахстана (Павлодар) 🇰🇿
Подписаться на профиль Саши можно на LinkedIn и в телеграм.
P.S. информация по доступным и распределенным именным грантам: тут
BigData Team: the way your learn best
#work #study
В первую очередь мы хотим отметить насколько сложно попасть в TOP 1% какого-либо международного рейтинга. А теперь представьте, что вам нужно попасть в ТОП 5 абсолютного рейтинга 🔥
Факт #1: Саша сделал невозможное - стал #5 в рейтинге Kaggle (в 2017-м году).
Факт #2: Если вы работаете в DS, то почти наверняка пользовались инструментами, которые Саша разрабатывал. Саша работал в роли Fullstack ML Engineer в компании Iterative AI, которая делает продукты типа DVC.
Факт #3: Совпадение? 🤔
По стечению обстоятельств, Саша, как и другие грантодатели (М.А. Ройтберг, Алексей Драль, Виктор Кантор, Эмели Драль) тоже обожает образование. Он преподает как в СНГ, так и за рубежом. В дополнение к этому он руководит подготовкой школьников к международной олимпиаде по AI (IOAI).
Bonus факт: до 10-го класса Саша жил и учился в небольшом городе Казахстана (Павлодар) 🇰🇿
Подписаться на профиль Саши можно на LinkedIn и в телеграм.
P.S. информация по доступным и распределенным именным грантам: тут
BigData Team: the way your learn best
#work #study
🔥15❤1👍1👎1
✍️ Соскучились по красивой физике и математике?
Покажите это вашему ребенку - и его потом от науки за уши не оттащишь. Мне повезло, поскольку у моего деда в туалете было полное собрание сочинений 😅
У кого ручки чешутся - пишите в комментариях какой номер трамвая получился у вас (чтобы не спойлерить ответ сразу).
Подборку журнала Квант за историю 1970 - 2010 удобнее всего будет скачать с этого архива (и читать с помощью DJView). А вот современные выпуски уже в привычном PDF, см. по ссылке: https://kvant.mccme.ru/
Из январского выпуска прошлого года вы также сможете узнать, когда Луна приобретает форму булочки. Разве это не прекрасно?
#life #study
Покажите это вашему ребенку - и его потом от науки за уши не оттащишь. Мне повезло, поскольку у моего деда в туалете было полное собрание сочинений 😅
У кого ручки чешутся - пишите в комментариях какой номер трамвая получился у вас (чтобы не спойлерить ответ сразу).
Подборку журнала Квант за историю 1970 - 2010 удобнее всего будет скачать с этого архива (и читать с помощью DJView). А вот современные выпуски уже в привычном PDF, см. по ссылке: https://kvant.mccme.ru/
Из январского выпуска прошлого года вы также сможете узнать, когда Луна приобретает форму булочки. Разве это не прекрасно?
#life #study
🔥11👍4❤3
💝 Истории замечательных людей, Антон
1-3 раза в год мы делимся историями о членах нашего небольшого профессионального сообщества BigData Team. Новый год, история первая.
Антон проходил обучение на курсе промышленной разработки на Python в конце 2022-го. И как один из лучших выпускников попал в менторское сообщество. Антон пока еще не попал в TOP-10 нашего внутреннего Leaderboard по метрике числа отвеченных вопросов. Но уже попал в попал в ТОП-3 ментора по направлению Python.
Из первых уст:
✍️ Недавно Антон решил попробовать себя в роли автора статей по Python:
— Условная конструкция match case в Python
Поддержите пробу пера, накидайте Антону лайков.
Истории замечательных людей, прошлые выпуски:
— Света, Николай, Дмитрий, Женя, Андрей
#study #python
1-3 раза в год мы делимся историями о членах нашего небольшого профессионального сообщества BigData Team. Новый год, история первая.
Антон проходил обучение на курсе промышленной разработки на Python в конце 2022-го. И как один из лучших выпускников попал в менторское сообщество. Антон пока еще не попал в TOP-10 нашего внутреннего Leaderboard по метрике числа отвеченных вопросов. Но уже попал в попал в ТОП-3 ментора по направлению Python.
Из первых уст:
В настоящий момент я работаю на позиции Junior Software Engineer в Ozon Tech. Учусь в магистратуре ВШЭ по направлению инженерии данных. Ранее работал в PwC, Raiffeisenbank. Сфера текущих профессиональных интересов: Big Data, ML/DL. Также увлекаюсь бегом (5км, 10км, полумарафон), футболом и постоянным прохождением каких-либо курсов.
✍️ Недавно Антон решил попробовать себя в роли автора статей по Python:
— Условная конструкция match case в Python
Поддержите пробу пера, накидайте Антону лайков.
Истории замечательных людей, прошлые выпуски:
— Света, Николай, Дмитрий, Женя, Андрей
#study #python
🔥12👍5👏3
CEO без понтов — в Казахстане не CEO 😎
Заказал фирменную подставку для телефона за 1,450 тенге, теперь можно работать в удовольствие.
#random
Заказал фирменную подставку для телефона за 1,450 тенге, теперь можно работать в удовольствие.
#random
😁22🔥16❤9👍4
Media is too big
VIEW IN TELEGRAM
🏔 Медео-Шымбулак, сумерки 🎧 sound on
Друзья, с ростом числа подписчиков видимо нужно попросить бустов, чтобы можно было закидывать в сторис красивые видео природы.
🥺 подкиньте, пожалуйста
#travel #kazakhstan
Друзья, с ростом числа подписчиков видимо нужно попросить бустов, чтобы можно было закидывать в сторис красивые видео природы.
🥺 подкиньте, пожалуйста
#travel #kazakhstan
❤11🔥7💘3👏1
😎 Опыт, гибрид человека и LLM ==> скорость работы 5x
Пока китайцы дизраптят рынок и все остальные пытаются понять, правда ли это, что state-of-the-art LLM можно обучить не за 60 млн $, а всего за $5.5M (подробности). Нам, землянам, приходится привыкать и делиться друг с другом опытом использования этих достижений.
От лирики к опыту
На прошлой неделе, в связи с подготовкой к конкурсу на гранты, нам нужно было проанализировать многолетний опыт отбора на гранты (внутренняякухня CRM) и пользовательский опыт сдачи тестирований. Я просто в восторге афиге от современной скорости исследований и экспериментов в IT.
Если раньше нужен был толковый IT специалист и целый день, чтобы обработать данные, обучить несколько моделей машинного обучения с целью проверить гипотезы, выдвинуть новые (и повторить). То сейчас, весь цикл до получения результата умещается в несколько часов. Мне только пришлось помочь* GPT построить график по значимости факторов на основе Shapley values.
*к сожалению, библиотека SHAP в Python не всегда легко устанавливается. Например, на виртуалке, где крутился GPT агент, это сделать не удалось.
Last, but not least
Кстати, кто не в курсе, кто такой Lloyd Shapley и за что ему дали нобелевку по экономике в 2012 (видео с вручения), посмотрите очень доступное (без шуток) видео с его выступлением на 7.5 минут по ссылке (про то, как сделать максимально "справедливые", с точки зрения общества, союзы мальчиков и девочек).
Call to action
👉 те, кто хочет получить серьезный бекграунд в сфере ML - вы знаете, где нас искать 😉
👇 поделитись вашими лайфхаками оптимизации работы с помощью LLM / GPT
#work
Пока китайцы дизраптят рынок и все остальные пытаются понять, правда ли это, что state-of-the-art LLM можно обучить не за 60 млн $, а всего за $5.5M (подробности). Нам, землянам, приходится привыкать и делиться друг с другом опытом использования этих достижений.
От лирики к опыту
На прошлой неделе, в связи с подготовкой к конкурсу на гранты, нам нужно было проанализировать многолетний опыт отбора на гранты (внутренняя
Если раньше нужен был толковый IT специалист и целый день, чтобы обработать данные, обучить несколько моделей машинного обучения с целью проверить гипотезы, выдвинуть новые (и повторить). То сейчас, весь цикл до получения результата умещается в несколько часов. Мне только пришлось помочь* GPT построить график по значимости факторов на основе Shapley values.
*к сожалению, библиотека SHAP в Python не всегда легко устанавливается. Например, на виртуалке, где крутился GPT агент, это сделать не удалось.
Last, but not least
Кстати, кто не в курсе, кто такой Lloyd Shapley и за что ему дали нобелевку по экономике в 2012 (видео с вручения), посмотрите очень доступное (без шуток) видео с его выступлением на 7.5 минут по ссылке (про то, как сделать максимально "справедливые", с точки зрения общества, союзы мальчиков и девочек).
Call to action
👉 те, кто хочет получить серьезный бекграунд в сфере ML - вы знаете, где нас искать 😉
👇 поделитись вашими лайфхаками оптимизации работы с помощью LLM / GPT
#work
🔥12❤2
😯 ух ты, вам приходилось видеть как лежит GitHub?
Следим за инцидентами и разбирательствами:
https://www.githubstatus.com/
По моему опыту, самая частая проблема восстановления при повышенной нагрузке - это когда все дружно начинаются смотреть: "а что - реально сломалось?"
Пойдем дружно посмотрим? 😅
P.S. вот у кого-то сегодня подгорает 🔥
#work #random
Следим за инцидентами и разбирательствами:
https://www.githubstatus.com/
По моему опыту, самая частая проблема восстановления при повышенной нагрузке - это когда все дружно начинаются смотреть: "а что - реально сломалось?"
Users may experience timeouts in various GitHub services. We have identified an issue with our caching infrastructure and are working to mitigate the issue
Jan 30, 2025 - 14:46 UTC
Пойдем дружно посмотрим? 😅
P.S. вот у кого-то сегодня подгорает 🔥
#work #random
😁10🔥5
Forwarded from BigData Team (BDT)
📚 Как подготовиться к техническому собеседованию
⭐️ Продолжаем делиться советами для подготовки к интервью в Big Tech. Сегодня обратим внимание на книгу, которую рекомендуют даже топовые специалисты: Cracking the Coding Interview.
Книга помогает научиться грамотно доносить свои идеи на интервью и подготовиться к его технической части, а 189 задач с разбором помогут «набить руку». Cracking the Coding Interview также предлагает закулисный взгляд автора на то, как крупные компании, вроде Meta или Google нанимают специалистов.
😊 Книга вкупе с постоянной практикой поможет подготовиться к техническому собеседованию.
BigData Team: the way your learn best
#study
⭐️ Продолжаем делиться советами для подготовки к интервью в Big Tech. Сегодня обратим внимание на книгу, которую рекомендуют даже топовые специалисты: Cracking the Coding Interview.
Книга помогает научиться грамотно доносить свои идеи на интервью и подготовиться к его технической части, а 189 задач с разбором помогут «набить руку». Cracking the Coding Interview также предлагает закулисный взгляд автора на то, как крупные компании, вроде Meta или Google нанимают специалистов.
😊 Книга вкупе с постоянной практикой поможет подготовиться к техническому собеседованию.
BigData Team: the way your learn best
#study
🔥6❤3👍2👏2💘1
🔥9❤2🥰2