Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Без лишних слов, друзья, просто алфавит для дата сайентистов

Кто узнал все термины?

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
42👍11🔥7🤯1
А вы что-нибудь слышали про Ангилью?

Это такой небольшой остров в Карибском море. Его площадь чуть меньше площади Новгорода, там почти нет природных ресурсов, и живет Ангилья только за счет туристов.

Точнее, так было раньше. В конце прошлого века у острова появился национальный домен .ai. Понимаете, куда мы клоним? Начиная с 2009 года в зоне Ангильи появились Stability.ai, X.ai Илона Маска, Character.ai и многие другие стартапы и компании в области ИИ. И спрос продолжает расти.

По данным управляющего доменами острова, в 2017 Ангилья получила от регистрации сайтов миллион долларов, а в 2023 году, по предварительной оценке, доходы составят $25–30 млн.

Повезло, повезло

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥1121
Сегодня день программиста!

Он отмечается традиционно в 256 день года. Число 256 выбрано потому, что это количество различных значений, которые можно выразить с помощью восьмиразрядного байта.

Мы поздравляем наших подписчиков и в честь праздника показываем вам прикольную карту проектов гитхаба. Это выглядит прямо как реальная карта со странами: Питония, Джаваландия и так далее. Каждая точка на карте – это проект. Всего таких точек более чем 400к. ИИландия тоже имеется.

Нашли свой репозиторий?

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33❤‍🔥7🔥5😁2
На Reddit завирусился тред, в котором пользователь попросил представителей разных профессий дать один, самый важный совет.

Там уже более 4 тысяч ответов — и советы от представителей Data Science тоже есть:

🌟 ЛЕГКО заставить данные говорить то, что вы хотите, ЛЕГКО собрать «плохие данные» и проинтерпретировать их ложно, не осознавая этого, но действительно ТРУДНО доказать истину.

🌟Сделайте резервную копию своих данных со всех ваших устройств, минимум одну. А лучше две: дома и в облаке.

🌟 x% от y — это то же самое, что y% от x.

🌟 Прежде, чем обращаться в тех-поддержку, перезагрузите компьютер.

И наш любимый:

🌟 Наберитесь терпения. Поймите, что люди, с которыми вы работаете, могут не знать того, что знаете вы, и это не делает их менее умными по сравнению с вами. Всеобщее эго и чувство превосходства — вот настоящие проблемы индустрии.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍579
Периодическая таблица методов визуализации

Осторожно: залипалово. Интересная и запоминающаяся подача материала. И кстати, если тыкнуть на какой-нибудь элемент, увидите пример соответствующей визуализации.

Менделеев gold edition

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50❤‍🔥86😁6👏1
История OpenAI

Лаборатория OpenAI была образована в декабре 2015 года как некоммерческая организация, которая должна работать на благо всего человечества. Но со временем ситуация изменилась и сегодня бизнес OpenAI идёт вовсю. Разбираемся, как суровая реальность постепенно разрушила идеалистический посыл.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍234😁2🔥1🤯1
Для тех, кто хотел разнообразить обучение

Представляем вашему вниманию: парень исполняет песенку про то, как обучить модельку в PyTorch. Весело, понятно, запоминается на ура.

😻 #forfun #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19😁11🔥5
Увлекательная история теоремы Байеса

Всем ведь знакома великая теорема Байеса, на основе которой построены несколько известных алгоритмов машинного обучение? Гарольд Джеффис писал, что для теории вероятностей она значит столько же, сколько теорема Пифагора для геометрии.

А знаете ли вы, что эта теорема была опубликована уже после смерти автора? Вообще, при жизни Байес опубликовал всего две работы (одна из них богословская), и в них не было вообще ничего про великую теорему.

Только через 2 года после смерти Томаса, в 1763, его друг нашел в рукописях то, что мы называем теоремой и формулой Байеса. Мог бы опубликовать под своим именем, но как человек благородный обессмертил своего друга, отправив рукопись в Королевское общество.

Кстати, огласке она не придавалась аж до 1812, пока ее не переоткрыл Лаплас. Он-то и опубликовал современную формулировку теоремы в своей книге «Аналитическая теория вероятностей».

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4716
А вы читали "Понедельник начинается в субботу"?

Это повесть братьев Стругацких 1965 года – о программисте, который попал в сказочную реальность. Вообще, книга считается фантастической. Хотя, в 2023 так кажется все меньше... Как думаете, они что-то знали?

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍598🔥4
#читалиТвиттер и нашли вот такую схему: полу-мем, полу-чеклист по ML System Design.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🔥8❤‍🔥51
Есть те, кому скучно в понедельник на работе?

Специально для вас: игра TensorTrust с ChatGPT. Здесь у вас есть банковская ячейка, которую нужно защитить промтом – таким, чтобы его никто не одолел. Задача номер два: хакать ячейки других игроков.

Кстати, там даже есть гайд, который позволит взломать часть соперников.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍43🐳2
Обычный человек vs Data Scientist

Профдеформация вещь опасная, поэтому мы решили напомнить вам оригинальные значения DS-терминов.

Не забудь отправить друзьям, чтобы лучше тебя понимали.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁86🔥16👍112🤯21
И снова с вами рубрика интересные факты: мудрость толпы

Однажды 1906 году на сельской ярмарке в Плимуте приключилась история. 800 человек участвовали в конкурсе, где нужно было угадать вес убитого и освежёванного быка. Назывались самые разные числа, и никто не так и не угадал точный вес. Об этом соревновании услышал статистик Фрэнсис Гальтон. Из интереса он посчитал медиану всех вариантов и получил 547 кг, тогда как действительный вес составлял 543 кг, то есть коллективная ошибка составила менее 1%. Это настолько поразило ученого, что он продолжил исследовать феномен.

В итоге подобная точность в оценке параметров или количества каких-либо предметов ещё не раз наблюдалась в экспериментах в разных странах. Этому статистическому являнию дали название «мудрость толпы».

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥68👍51🍌1🗿1
Бетховен, 2Pac, Стас Михайлов? А может лучше виртуальные музыканты?

Обновляем плейлист ИИ-треками, а заодно и узнаем истории их создания.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16💅1
Смотрите, какую залипательную схему с историей NLP мы нашли на просторах интернета

А все ли перечисленные модели вы знаете? Ладно-ладно, до 2008 не считается

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍83🤯2
Не знаешь чем заняться в cубботу?

А как насчет пройти наш кроссворд? Можно проходить коллективно в комментариях, а можно подумать самому и после запушить все ответы. Должно быть не сложно, но интересно. Все ответы на английском языке.

По горизонтали:

1. любимые животные дата сайентистов
4. продолжите правильно: Data ...
5. это лучше, чем TensorFlow
8. там команды наших подписчиков всегда первые в лидерборде
9. качественный ... – залог успеха в любом деле
12. постоянно out of memory
14. жизнь без этого – сущий ад
15. то, что можно не читать

По вертикали:

2. если видишь fit, то он где-то рядом
3. он любил ирисы и распределения
6. постоянно взлетает, хотя должен падать
7. проблема любого датасета
10. наш любимый стек
11. планета, на которой водятся ноутбуки
13. Сэма Альтмана там больше нет

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥1051🤯1🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
Доска Гальтона – нормальное распределение наглядно

Доска состоит из набора штырьков, о которые случайно отталкиваются засыпанные сверху мелкие шарики. Каждое столкновение шарика со штыком – это испытание Бернулли (отлетит влево или вправо).

Симметричное построение доски Гальтона обеспечивает удивительное: при достаточно небольшом количестве рядов препятствий биномиальное распределение в соответствии с центральной предельной теоремой становится нормальным гауссовским колоколом.

Случайности не случайны.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8214👍9🤯3😁1
Как болтали первые языковые модели

Самой древней языковой моделью (1966) считается ELIZA, которая, ориентируясь на ключевые слова, имитировала психотерапевта. Точнее, она просто задавала уточняющие вопросы. Например: "Я расстроен" – "Почему ты расстроен?". Все было запрограммированно по шаблону.

В 1972 в пару к ELIZA появился PARRY, который также был шаблонным, но "обучен" был моделировать поведение параноидального шизофреника – уклоняться от ответов и переводить тему.

А потом... ELIZA и PARRY поговорили. Представляете этот диалог? Хотя и представять не надо – его фрагменты можно найти здесь. В конце не хватает только "Спасибо, с вас 10 тысяч".

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32😁19👍43
Несем забавный пример степенной регрессии в ее естественной среде обитания – закон Клейбера о зависимости расхода энергии животного от массы его тела. Только посмотрите на этот прекрасный график.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥465👾4