Где пообщаться с датасаентистами? В нашем чате, конечно
Здесь можно обмениваться мемами, обсуждать проекты, учебу, новости индустрии и вообще все что угодно! Кстати, если хотите пообщаться с нашими авторами – вам тоже сюда.
😻 Вот ссылка на чат, присоединяйтесь!
Здесь можно обмениваться мемами, обсуждать проекты, учебу, новости индустрии и вообще все что угодно! Кстати, если хотите пообщаться с нашими авторами – вам тоже сюда.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🤯3🤔2❤1
Что общего у анализа данных и варки пива?
Думаете, ничего? А вот статья «Анализировать данные — это как варить пиво» говорит об обратном. Автор три года работал пивоваром, а сейчас сеньор-аналитик в ретейле. Он говорит про пайплайны, придание формы, фильтрацию, отбрасывание лишнего – и еще несколько пунктов, по которым варить пиво == анализировать данные. Забавное и легкое чтиво. Советуем!
😻 #advice
Думаете, ничего? А вот статья «Анализировать данные — это как варить пиво» говорит об обратном. Автор три года работал пивоваром, а сейчас сеньор-аналитик в ретейле. Он говорит про пайплайны, придание формы, фильтрацию, отбрасывание лишнего – и еще несколько пунктов, по которым варить пиво == анализировать данные. Забавное и легкое чтиво. Советуем!
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32🤯6🥰3🔥2❤1👍1🤩1
2 чит-листа по структурам данных
Скорее всего, если вы в каком-то виде занимаетесь данными, то постоянно будете иметь дело в разничными структурами, типа списков, стеков, очередей и так далее. Но часто их особенности забываются, и на этот случай мы нашли для вас целых два полноценных чит-листа:
1) Data Structures Reference. Здесь перечисленны все структуры данных с краткими определениями и визуализацией. Если нужны дополнительные сведения, можно кликнуть и получить сильные и слабые стороны структуры, фишки и связанные алгоритмы.
2) An Executable Data Structures Cheat Sheet for Interviews. Здесь, помимо общих сведений, есть еще код, дополнительные ресурсы для изучения и видеоуроки по каждой структуре.
Идеально для подготовки к собесу. Сохраняйте!
😻 #advice
Скорее всего, если вы в каком-то виде занимаетесь данными, то постоянно будете иметь дело в разничными структурами, типа списков, стеков, очередей и так далее. Но часто их особенности забываются, и на этот случай мы нашли для вас целых два полноценных чит-листа:
1) Data Structures Reference. Здесь перечисленны все структуры данных с краткими определениями и визуализацией. Если нужны дополнительные сведения, можно кликнуть и получить сильные и слабые стороны структуры, фишки и связанные алгоритмы.
2) An Executable Data Structures Cheat Sheet for Interviews. Здесь, помимо общих сведений, есть еще код, дополнительные ресурсы для изучения и видеоуроки по каждой структуре.
Идеально для подготовки к собесу. Сохраняйте!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35❤3🤯3
TiSASRec
BERT4Rec – это, конечно, хорошо, но там никак не используется информация о временных промежутках между действиями пользователя. Хотя очевидно, что сезонность и другие подобные фичи однозначно должны влиять на рекомендации. Об этом в 2020 году подумала группа исследователей, которая предложила модель TiSASRec – Time Interval aware Self-Attention based Sequential Recommendation, в которой используются персонализированные временные интервалы между действиями пользователей.
Статья и код
😻 #NN
BERT4Rec – это, конечно, хорошо, но там никак не используется информация о временных промежутках между действиями пользователя. Хотя очевидно, что сезонность и другие подобные фичи однозначно должны влиять на рекомендации. Об этом в 2020 году подумала группа исследователей, которая предложила модель TiSASRec – Time Interval aware Self-Attention based Sequential Recommendation, в которой используются персонализированные временные интервалы между действиями пользователей.
Статья и код
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30🔥6
QQ-плот и с чем его едят
Сначала объяснили, кто такие куку и как они строятся. Потом раскрыли все секреты того, как их читать и делать по ним важные выводы. А напоследок показали универсальный код на питоне для построения этих графиков.
😻 #analytics
Сначала объяснили, кто такие куку и как они строятся. Потом раскрыли все секреты того, как их читать и делать по ним важные выводы. А напоследок показали универсальный код на питоне для построения этих графиков.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40👍20🤯6❤🔥1
ЯндексМузыка теперь будет пропускать публикации через ML-алгоритм перед публикацией
«Рекомендации касаются работы с опасным или неприятным контентом и должны помочь стриминговым сервисам создать комфортную и безопасную среду для слушателей». Контент будет проверяться на соответствие правилам по гибридной модели: сначала при помощи ИИ, а затем вручную. Также алгоритм будет использоваться для выявления контента на «чувствительные темы», который может вызвать дискомфорт у слушателей.
Добро пожаловать в мир ИИ-цензуры. Ваше мнение?
😻 #news
«Рекомендации касаются работы с опасным или неприятным контентом и должны помочь стриминговым сервисам создать комфортную и безопасную среду для слушателей». Контент будет проверяться на соответствие правилам по гибридной модели: сначала при помощи ИИ, а затем вручную. Также алгоритм будет использоваться для выявления контента на «чувствительные темы», который может вызвать дискомфорт у слушателей.
Добро пожаловать в мир ИИ-цензуры. Ваше мнение?
Please open Telegram to view this post
VIEW IN TELEGRAM
😨30👍21🤯8❤2🔥2👌1🌭1🤨1
Как понять, какая IT-профессия вам подойдёт?
Бесплатный профориентационный проект «IT-рентген» от Skillfactory поможет определить подходящую профессию
Начните с прохождения теста: он определит, кто вы в мире IT — дата-сайентист, тестировщик,аналитик или разработчик
А 10 июля обязательно приходите на онлайн-встречу, на которой расскажут о трендах в IT-сфере,о наиболее простых точках входа и ошибках новичков
На встрече вы получите доступ к материалам, которые заменят более 100 вебинаров и сэкономят порядка 50 часов на поиске информации
Проходите тест и узнайте, кто вы в IT
Реклама. ООО "СКИЛФЭКТОРИ". ИНН 9702009530. 2RanynuHiDe
Бесплатный профориентационный проект «IT-рентген» от Skillfactory поможет определить подходящую профессию
Начните с прохождения теста: он определит, кто вы в мире IT — дата-сайентист, тестировщик,аналитик или разработчик
А 10 июля обязательно приходите на онлайн-встречу, на которой расскажут о трендах в IT-сфере,о наиболее простых точках входа и ошибках новичков
На встрече вы получите доступ к материалам, которые заменят более 100 вебинаров и сэкономят порядка 50 часов на поиске информации
Проходите тест и узнайте, кто вы в IT
Реклама. ООО "СКИЛФЭКТОРИ". ИНН 9702009530. 2RanynuHiDe
🤨5😐4🤔2🗿2🤯1
В новую версию Wolfram Mathematica будет добавлена LLM для помощи разработчику
Чтобы сохранить концепцию языка "Все – фукнции", LLM будет использоваться тоже в виде функций (список). Но при этом общность не теряется, потому что фукнций будет много, и к тому же работать они будут возможно даже чуть лучше, чем средний неструктурированный запрос к GPT, так как уже будут преднастроены нужным образом. Например, появятся фукнции InformalRephrase и CoverLetterSuggest. И, конечно, будет CodeWriter – карманный Copilot в WM. Даже можно будет, как в GPT, выбрать роль для ИИ (включая Стивена Вольфрама).
Кстати, плагин GPT от Wolfram сейчас в топе самых популярных, потому что в отличие от базового бота он блестяще справляется с математическими задачами и почти не врет в ответах. В GPT его можно попросить реализовать какой-нибудь алгоритм, посчитать предел, производную, нарисовать график, собрать данные и так далее. Поэтому новые возможности WM – это очень многообещающе и волнительно.
Вообще, концепция естественного языка для программирования – это точь-в-точь та идея, с которой Стивен Вольфрам создавал функциональный язык WolframMathematica. Поэтому добавление в него ИИ хорошо бьется с политкой компании и должно отлично вписаться.
😻 #news
Чтобы сохранить концепцию языка "Все – фукнции", LLM будет использоваться тоже в виде функций (список). Но при этом общность не теряется, потому что фукнций будет много, и к тому же работать они будут возможно даже чуть лучше, чем средний неструктурированный запрос к GPT, так как уже будут преднастроены нужным образом. Например, появятся фукнции InformalRephrase и CoverLetterSuggest. И, конечно, будет CodeWriter – карманный Copilot в WM. Даже можно будет, как в GPT, выбрать роль для ИИ (включая Стивена Вольфрама).
Кстати, плагин GPT от Wolfram сейчас в топе самых популярных, потому что в отличие от базового бота он блестяще справляется с математическими задачами и почти не врет в ответах. В GPT его можно попросить реализовать какой-нибудь алгоритм, посчитать предел, производную, нарисовать график, собрать данные и так далее. Поэтому новые возможности WM – это очень многообещающе и волнительно.
Вообще, концепция естественного языка для программирования – это точь-в-точь та идея, с которой Стивен Вольфрам создавал функциональный язык WolframMathematica. Поэтому добавление в него ИИ хорошо бьется с политкой компании и должно отлично вписаться.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯22❤9👍9🔥3👏2
Wikidata — 10 миллиардов бесплатных cтруктурированных фактов
Wikidata – это огромное хранилище данных, привязанное к Википедии. Каждое наблюдение имеет "отпечаток пальца" (описание на нескольких языках, другие названия и т.д.). При этом каждое наблюдение связано с некоторыми другими через «свойства» (идентификатор, начинающийся с P). Получается, что данные имеют вид мультиграфа. Например, на картинке фрагмент этого графа, связывающий ПО с Ubuntu.
Для этого графа ресерчерами из facebook были посчитаны эмбеддинги, так что помимо того, что за счет рекурсивных вызовов по графу мы можем расширять почти любые свои текстовые данные (пример), прямо на этих эмбеддингах можно обучать многие самостоятельные модели, например DistMult или RESCAL. Настоящий простор для исследований!
😻 #NN #train
Wikidata – это огромное хранилище данных, привязанное к Википедии. Каждое наблюдение имеет "отпечаток пальца" (описание на нескольких языках, другие названия и т.д.). При этом каждое наблюдение связано с некоторыми другими через «свойства» (идентификатор, начинающийся с P). Получается, что данные имеют вид мультиграфа. Например, на картинке фрагмент этого графа, связывающий ПО с Ubuntu.
Для этого графа ресерчерами из facebook были посчитаны эмбеддинги, так что помимо того, что за счет рекурсивных вызовов по графу мы можем расширять почти любые свои текстовые данные (пример), прямо на этих эмбеддингах можно обучать многие самостоятельные модели, например DistMult или RESCAL. Настоящий простор для исследований!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🙈1
Незабываемая пятерка: топ самых крутых датавизов от нашей редакции
Смотрим, залипаем и учимся: как превращать данные во что-то изящно простое и одновременно красивое на примере 5 дашбордов.
😻 #analytics
Смотрим, залипаем и учимся: как превращать данные во что-то изящно простое и одновременно красивое на примере 5 дашбордов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤31👍10