دستاوردهای یادگیری عمیق(InTec)
9.53K subscribers
363 photos
40 videos
44 files
674 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
بعد از سالهای سال بالاخره دوره
Machine Learning Specialization

آقای اندرو انگ آپدیت شده و از فردا در وبسایت Coursera در دسترس عموم قرار خواهد گرفت.

اگر تازه شروع کردید، این دوره رو جایگزین دوره قبلی کنید.
👍36🎉7😢3👎2👏2🔥1
تو کمتر از ۲۴ ساعت :

1.1K GitHub Stars

Yandex

100 Billion parameter on 1.7 Terabytes of data

کاملاً رایگان و دردسترس همگان (برخلاف همه مدل‌های بزرگ و قبلی)

Github Link

این رو حتماً ببینید و اگر تسک‌ های جالبی باهاش زدید به اشتراک بذارید خروجی رو
(تو همین ۹ ساعت چندین مدل pretrain، چندتا حالت chatbot ازش بیرون اومده)
👍12
دستاوردهای یادگیری عمیق(InTec)
#تجربه یک سری چیزا برای ما روتین شده؛ انقدر که تجربه‌اش کردیم و دیدیم که توی ناخوآگاه مغزمون فرو رفته و حتی اگر خودمون هم نخوایم انجامش میدیم و دنبال explore ‌روش‌های جدید نمیریم. در حال تدریس؛ این روزا درگیر درس دادن دیپ‌لرنینگ به یک گروه فوق‌العاده و قوی…
ی بحث‌هایی تو گروه (کامنت این پست شد)

و گفتیم که ارزش مقاله شدن داره و ...
الان @Mohammad_Talaei لطف کرد و
اطلاعاتی رو به اشتراک گذاشت که بله بحثی که داشتیم مقاله‌اش هم بیرون اومد، دوست داشتید تو گروه می‌تونید دنبال کنید، رفرنس مقاله و ... هم اونجاس


قبلاً هم گفتم توی صحبت‌ها گفتم:
ما ایده‌اش رو داریم، وقتشو نداریم
وقتش رو داریم، تجهیزاتشو نداریم
(واقعاً ریسرچ تو ایران همچین وضعیتی داره)
👍9👎1😁1
Google Python Style Guide

بحثی داشتیم با دوستان راجب موضوع و کتاب Clean Code من همونطور که قبلا هم گفتم بنظرم حداقل برای کامیونیتی پایتون و جاوا‌اسکریپت که خودم کد میزنم و تجربه دارم؛ موضوع اصلی جوگیر شدن آدما بود.

یک زمانی خیلی از افراد شروع کردن پست گذاشتن راجب این کتاب و ...
نظر شخصی من و چیزی که یادگرفتم اینه که؛ حداقل توی دنیای الان با زبان‌های برنامه نویسی بالا و توی موضوعات کاری ما
همه‌ی موارد چرت و پرت هست (قبلا Lambda AWS رو مثال زدم توی گروه)

بجای خوندن این کتاب بنظرم فقط کافیه توافق عمومی پایتون رو رعایت کنید؛ هر شرکت بزرگی برای خودش ی توافق نامه داره مثل گوگل که لینکش رو گذاشتم و بر اساس اون پیش میره

اما مهم تر از اون اینه که شما وقتی وارد یک گروه یا تیم می‌شید توافق و نحوه کد زدن اون تیم رو رعایت کنید (حتی اگر ۱۰۰٪ درست نباشه) سورس ‌کدها رو بخونید و با اون استاندارد کد بزنید این خیلی مهمه که حتی توی همین داکیومنت گوگل هم روش تاکید شده :

If you’re editing code, take a few minutes to look at the code around you and determine its style

خلاصه که موضوعات مهمتری هم هست.
👍35👎3
Python 3.11
اون ورژنی هست که بهش آپگرید میکنم

هرچند وقت یکبار آپدیت‌های قشنگی روی پایتون میخوره که خب همیشه کدهارو تغییر نمیدیم فقط می‌دونیم چه اتفاقاتی افتاده

آخرین باری که من آپگرید ۳.۶ بود (البته بگم که الان کدهای جدید رو روی ۳.۸ میزنم ) و کد‌های قدیمی که هنوز نیاز به نگهداری و ... دارند رو روی ۳.۶ نگه داشتم

نسخه ۳.۱۱ که الان روی بتا هست خبرهای خوبی راجبش شنیده میشه (تست منم همین رو نشون داد تا حدودی)
نکات مهم برای من : سریعتر شدن runtime, uptime هست (این ینی زمان کمتر صرف optimization بشه) وقتی میگم زمان کمتر منظورم حداقل ۳۰ ساعت هست
توی سایت اشاره به ۱۰-۶۰٪ سریعتر شدن کرده که توی تست‌های من از ۲۰٪ که خیلی پیش میومد تا ۵۰٪ توی چند مورد دیدم

ویژگی مهم دوم برای من تمیز تر اشاره کردن به خطی هست که ارور داره (از نسخه ۳.۱۰ قویتر هست طبق گزارشات کاربرا)

سوم اضافه کردن متن به ارور Exception برای اینکار توی پیکیج‌های داخلی یک شرکت (موضوع ۳ سال پیش) واقعا چه راهکارهایی که نزدیم (چه عذابی بود) الان فقط یک تابع شده

بنظرم همین ۳ تا بهترین دلیل‌ها برای من هست تا کدهای قدیمی و ... رو بیارم روی ۳.۱۱

اگر دوست داشتید تستش کنید 👌
👍28🔥1
دستاوردهای یادگیری عمیق(InTec)
Photo
lab_utils_uni.py
14.2 KB
این دوره Visualization ها و نمودارهای خیلی خوبی داره که بنظرم در حد ی cook-book عالی هست

مثلا سورس کد نمودار Interactive اش واقعا جذاب بود و ساده برای همین تصمیم گرفتم اینجا ارسال کنم

پ.ن : این سورس مربوط به توابع داخلی هست که توی lab ایمپورت شده و خود jupyter نیست.
👍12
دستاوردهای یادگیری عمیق(InTec)
قطعا خیلی از دوستان PyImageSearch رو می‌شناسند؛ حداقل ۱-۲ بار بهش سر زدید یا ازش شنیدید ‌ی مجموعه دوره‌های آموزشی داره به اسم PyImageSearch University نسخه کامل این مجموعه رو می‌تونید ازین لینک دانلود کنید (برای مدت محدود) PyImageSearch University Tutorial…
این دوره‌ها خیلی وقت پیش لینک گذاشتم که خب چون Mega خیلی زود بررسی کرد لینک‌هارو (رکوردی بود، کمتر از ۲ ساعت) متأسفانه خیلی از اعضای کانال نتونستند دانلود کنند،

یک کتابی از ایشون یافت شده، که گفتم شاید بد نباشه به اشتراک بذارم

توی کانال بنا به دلایل ریپورت شدن و ... قرار نمیدم دوستان می‌تونند از گروه دانلود کنند
👍9👏1
#تجربه #قبل_از_مصاحبه
.
سفته ندید.
.
قبلا راجب سفته و ... صحبت کردم کلی بچه‌هایی هم که به مشکلات جدی خوردند هم گفتند این موضوع رو --> به هیچ وجه سفته به هیچ‌ جا ندید.
شما برای حسن خدمات و ادعاهای مدیر شرکت سفته نمی‌گیرید
شرکت برای سواد شما از شما مصاحبه میگیره و ...
سفته جز برای نیت‌های کثیف هیچ بهانه دیگه‌ای پشتش نیست.
-------------------------------------------------------------------------------------------------------------
.
رزومه‌ برای شخص نفرستید.
.
اخیرا ؛ خیلی خیلی زیاد شده با اکانت شخصی توی لینکدین و ... پیام میدند و رزومه درخواست می‌کنند.
بهترین کار اینکه از طرف بخواید آدرس ایمیل رسمی شرکت رو بده شخصا برای شخص رزومه نمیفرستم.
این مورد حداقل توی شغل ما خیلی مهم هست؛ مخصوصا برای بچه‌هایی که دسترسی به سرور دارند.
چندسال پیش یکی از ادمین سرورها اینکارو کرده بود؛ طرف یک سایتی رو هک کرده بود و لیست پسوردها و علایق و .... رو پیدا کرده بود بین افرادی که توی سایت بودند ایمیل و اطلاعات این ادمین رو هم پیدا کرده بود و بهش پیام داده بود که رزومه و .. بفرست من از فلان شرکت هستم؛ که خب این بنده خداهم فرستاده بود.
خلاصه طرف شرکت‌هایی که ادمین کار میکرده + کلی اطلاعات مفید رو بدست آورده بود و به سرور شرکت attack زده بود و دسترسی کامل داشت
هم شرکت رو بیچاره کرد هم خودش رو (این شرکت خیلی مطرح بود توی ایران اون زمان)
----------------------------------------------------------------------------------------------------------------
.
از افراد بیشعور فاصله بگیرید.
.
این هفته از طرف یکی از دوستان برای یک مصاحبه کاری دعوت شدم.
که خب بخاطر مشکلات و ... مجبور شدیم چندبار زمان رو جابجا کنیم تا به زمان مناسبی برسیم (اصلا چیز بدی نیست چون همواره زودتر باهم چک میکردیم؛ البته هم جلسه مهم بود و هم طولانی میشد که خب دلیل اصلی همین بود)
۷-۸ نفر توی این جلسه حضور داشتن ؛ اما از همون ابتدای صحبت از مدیر عامل و مدیرفنی تیم خیلی خوشم نیومد (بخاطر نوع حرف زدن و رفتارشون) و یکسری قضاوت کردم راجبشون و بعدتر مطمئن شدم درست بود
بخاطر دوستمون که سهامدار اصلی شرکت هم هست جلسه رو تحمل کردم آخرای جلسه چندتا مورد دیگه از مدیر فنی دیدم که خیلی عصبیم کرد
قبل از پایان جلسه گفت که :
- خلاصه که ما این جا مثل یک خانواده هستیم واقعا
+ من واسه تشکیل خانواده و رفاقت اینجا نیومدم واسه کار اومدم؛ که فکر نکنم بدرد هم بخوریم پس
خواستم بگم ازین کارفرماها فرار کنید؛ این کارفرما نسبت به مبالغ جاافتاده تو بازار ۵ برابر به من دستمزد میداد درسته پروژه سختی بود
اما رفتار از هرچیزی بسیار بسیار مهمتر هست
اگر میخواید مشکل اعصاب و ... نگیرید با این آدما کار نکنید.‌
👍46👎4
قبلا راجب نسخه سرور پست گذاشتم (هزینه‌های سرور رو کم کرده)
سری جدید کارت گرافیک‌های Intel این بار برای دسکتاپ به زودی وارد بازار میشه
و این موضوع اهمیت داره :
۱- هدف گذاری فروش ۴ میلیونی سری رده بالاتر ARC 7
۲- رسیدن به این هدف؛ که نوید قیمت پایین‌تر رو می‌تونه بده
۳- رغیب جدید و جدی برای Nvidia - Amd البته شاید بیشتر Nvidia چرا که از همون ابتدا Intel با هدف‌گذاری پردازش تخصصی وارد این بیزینس شد
بعید هم نیست؛ به ۲ دلیل واضح :
- اول اینکه :
اینتل نسخه گرافیک سرور برای پردازش‌های AI رو قبلتر ارائه داده پس درایورها و فریمورکها باهاش آشنایی دارند و براش توسعه داده شدند
دوم اینکه :
می‌تونم بخاطر بیارم از نسخه حدودا Tensorflow 0.7 اینتل یک نسخه مختص به CPU های خودش رو ارائه میداد که علاوه بر کامپایل‌های اپتیمایز شده حتی توی بخش کدها هم اپتیمایز شده بود (پس مثل AMD دور نبوده بلکه مثل nvidia درگیر بوده از اوایل)
۴- معماری کمی متفاوت که طبق گفته مهندس‌های Intel بهشون اجازه داده هزینه ‌ها رو کم کنند.
۵- پروژه‌های اینتل همیشه ۲ حالت داره : شکست مطلق - پیروزی نوید بخش
جوری که اینتل وارد بازار شده و بنچمارک‌ها و ...
عکس العمل Nvidia که طبق شایعات (قابل اتکا) - کودا کور و ... توی نسخه 4090 حدودا ۲ برابر ۳۰۹۰ خواهد بود نشون میده اینتل تاثیر خودش رو گذاشته
برای درک بهتر سخت‌افزار و .... ویدئو زیر رو ببینید :
Youtube Link
👍9
دستاوردهای یادگیری عمیق(InTec)
قبلا راجب نسخه سرور پست گذاشتم (هزینه‌های سرور رو کم کرده) سری جدید کارت گرافیک‌های Intel این بار برای دسکتاپ به زودی وارد بازار میشه و این موضوع اهمیت داره : ۱- هدف گذاری فروش ۴ میلیونی سری رده بالاتر ARC 7 ۲- رسیدن به این هدف؛ که نوید قیمت پایین‌تر رو…
با افت شدید قیمت رمز ارز‌ها :
قیمت GPU های سری 30X تا 500 دلار کاهش یافته
بعنوان مثال 3090Ti Founder Edition روی Amazon حدودا 410 دلار تخفیف خورده
اما این قیمت‌ها ثابت هست چون باقی شرکت‌ها (Evga - Asus - Msi و...) قیمت‌های جدید رو اعلام کردند
این مسئله نگرانی‌های جدی تری رو هم برای Nvidia و سری 40X بوجود آورده
هم از لحاظ رسیدن به هدفگذاری فروش هم از لحاظ قیمت گذاری (این رو میگم بخاطر حجم سفارشی که Nvidia به tsmc قبل از داغون شدن قیمت رمز‌ارزها داده)
.
پ.ن : tsmc گفته قرارداد رو لغو نمی‌کنه؛ Nvidia می‌تونه مشتری براش پیدا کنه 😂
قطعا این شرایط برای AMD هست این رو توجه داشته باشید
.
شرایط دوس داشتنی
😁14👍21🔥1🥰1
داشتم بین وسایلم دنبال چیزی میگشتم؛ که این رو دیدم
window 98
یاد زمانی افتادم که موقع write CD تهش رو باز میذاشتیم شاید قسمت شد چیز دیگه ریختیم روش.
۱۰ سال پیش این موقع رفتم ی فلاپی ریدر خریدم چون نسخه فلاپی بازی محبوب بچگیم رو توی انباری پیدا کرده بودم (هنوزم کار میکرد)
برای اونهایی که نمیدونند :
فلاپی چون حجم کمی داشت ۲-۴ مگ اگر اشتباه نکنم (فکر میکنم ۴.۲ مگ بود دقیقش) ی بازی ۲ بعدی اون زمان با فشرده سازی حدود ۴-۵ فلاپی میشد
اگر نصبی نبود؛ یک سری مراحل رو بازی میکردی رو فلاپی اول - بعد که جلو میرفتی ازت میخواست که فلاپی ۲ و ... رو بذاری
تنها چیزی که رو سیستم ذخیره میشد یک فایل متنی بود از دستاوردهایی که توی اون بازی داشتی.
.
خلاصه که یاد خاطرات قدیم جذاب بود؛ گفتم به اشتراک بذارم به یادگار بمونه
33👍11👎2😢2
دستاوردهای یادگیری عمیق(InTec)
اصلا نیازی به صحبت نداره؛ تست کنید مقاله و ... اشون هم موجود هست . 11X faster bert-large
ی نکته بگم برای اون‌هایی که دقت نکردند و Optimization هم کار کردند :‍
.
توجه کنید که حتی با اینکه Quantization روش زده شده اما دقتش هیچ تغییری نداشته
.
این روش ۱۰۰٪ برای پروداکشن بدرد بخوره
👍7
امروز یک دعوت به همکاری دیدم
نوشته بود یک نیرو میخوایم برای تیم DevOps؛ برداشت من این بود که ی تیم جدا تشکیل دادند به نام devops
دوستان مدیران عزیزی که تو کانال هستند :
دقت دارید که DevOps نباید یک تیم جدا باشه بلکه یک فرهنگ سازمانی هست با هدف همکاری بین تیم های
Development و Operation اصلا به همین دلیل هم اسمش شده DevOps لطفا اگر فکر دیگه‌ای دارید کتاب زیر (البته نسخه ۱ هم مناسب هست) رو بخونید از بزرگان DevOps, اینجا واقعا باید developmentهارو بریزید تو operationها نه اینکه ی گروه جدا automation تشکیل بدید واقعا اون یک چیز دیگه‌ای هست 🤦‍♂️ :
The DevOps Handbook, 2nd Edition
.
پ.ن : اینه که وقتی به طرف میگیم ما روزانه بیش از ۱۵ دیپلوی انجام میدیم خیلی‌ها باور نمی‌کنند و یا درکی از موضوع ندارند --> اضافه کنم ما به گرد پای تیم‌های حرفه‌ای و حتی معدود بچه‌های حرفه‌ای DevOps ایران هم نمیرسیم.
👍14👎14
چندروز پیش ی سری به LinkedIn زدم (بعد از مدت‌ها) ی چالش جالب از
Laurence Moroney
دیدن، چون تسک کاری نداشتم و حوصلم سر رفته بود گفتم ی سعی کنم ببینم چی میشه.
این لینک چالش اگر دوست داشتید تمرین جالبی هست

چندتا از دوستان درخواست کد رو دادند، ایشون بعد از خوندن کد نظر هم دادند (من اصلاً فکر نمیکردم مفید باشه) باقی افراد هم تشکر کرده بودند و ...

خلاصه دیدم نتیجه مثبت بود گفتم به اشتراک بذارم شاید اینجاهم بدرد کسی خورد.

نکته : اصلا سعی نکردم کد رو optimize کنم و اصلا هم در حد کارهای product نیست اما ۲ تا نکته رو رعایت کردم :

۱- چندوقته دارم همه‌ی داکیومنت‌‌ها و آموزش‌هایی که چندسال اخیر دادم رو جمع‌آوری می‌کنم که ی منبع جامع و کامل و ۱۰۰٪ کاربردی باشه کد رو جوری زدم که کسایی که تازه شروع می‌کنند راحت متوجه بشن (با هدف استفاده بجای cifar10 - mnist)

۲- فقط می‌خواستم تو سریع ترین زمان کد رو بزنم و خروجی بگیرم
👍13
دستاوردهای یادگیری عمیق(InTec)
چندروز پیش ی سری به LinkedIn زدم (بعد از مدت‌ها) ی چالش جالب از Laurence Moroney دیدن، چون تسک کاری نداشتم و حوصلم سر رفته بود گفتم ی سعی کنم ببینم چی میشه. این لینک چالش اگر دوست داشتید تمرین جالبی هست چندتا از دوستان درخواست کد رو دادند، ایشون بعد از…
اینم از آموزش‌هایی که گفتم (البته هنوز خیلی کار داره و فعلا فقط مقدمات هست) هر ۲ فریمورک رو هم داره
Pytorch - Tensorflow
با کلی تصویر, gif و ...
انگلیسی بودنش ی ذره بخاطر جونیور‌ها و سخنرانی‌های شرکت هست و بیشتر از اون بخاطر اینکه Markdown فارسی رو خوب پشتیبانی نمی‌کنه ؛ مخالف ترجمه کلمات تخصصی هم هستم.

هدف بعدی - deep شدن روی کاربردهای مختلف هست (بصورت سطحی ۲۵ فصل شده بدون pytorch و آخرین مباحث هم RL هست همه‌ی ریاضیات و ... رو هم شامل میشه - تمام کدها جدا هست البته)

امیدوارم چیز خوبی از کار در بیاد که با کدهاش بذارم گیت‌هاب (self-study خوبی خواهد بود قطعاً)

پ.ن : توی کاربردها، pretrain استفاده کردن فقط مثال زده میشه، سعی می‌کنیم خودمون یک شبکه حتی ساده بسازیم (مثلاً Gan - Pose Estimate - Transformer و ...)
👍16👏7🎉3👎1
بعد از سال‌ها :

قدیما، قبل از اینکه خیلی از بچه‌ها از ایران برن
ی سری دورهمی‌های ماهانه ٫ هفتگی و ... داشتیم
Code Party
اصطلاحا، که دورهم کد میزدیم و مزیتش این بود که خیلی از هم یاد می‌گرفتیم.

ممکن بود من از یکی مسأله مهمی در Docker یاد بگیرم اون از من یک نکته Python و ...

چندروز پیش با ادمین‌های
Django Expert , Dlex
همدیگر رو دیدیم، با این فقط ملاقات بود و نه Code Party منو یاد روزای قدیمی انداخت.


گفتم شاید مناسب باشه با کانال این موضوع رو راه بندازم، اگر کسی دوست داشت هم حضوری من باهاش آشنا میشم و هم اگر سوالی بود که بلد باشم کمکش کنم.

نمی‌دونم چطور پیش بره، تو گروه می‌تونیم بحث کنیم و همونجا هم میگم روزها و ساعت‌ها و آدرس پاتوق رو 😊

پ.ن : اکثراً روزهایی که میرم : ۲شنبه - ۵شنبه / ۶-۶:۳۰ هست - تهران
👍39👎1
مشکل دیتاهای گیگابایتی و pandas کاملاً مشهود هست
تا به امروز هم بیش از ۵-۶ تا راه‌حل رو تو کانال بررسی کردیم (که به شخصه فقط از Rapids برای محاسبات سنگین روی دیتاهای خیلی زیاد استفاده می‌کنم و کم پیش میاد ابزار دیگه رو جایگزین pandas برای دستورات عادی کنم)

اما اگر این گزارش درمورد Datatable درست باشه، قطعاً ترجیح میدم دیگه
pandas as pd
رو تو import‌هام نبینم.
👍24👎1🤩1