دستاوردهای یادگیری عمیق(InTec)
9.47K subscribers
362 photos
40 videos
44 files
673 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
قبل از شروع یادگیری چیزهای جدید و خرید منابع (کتاب؛ دوره آموزشی؛ و حتی کلاس حضوری)

بهترین گزینه اینه که چندساعتی وقت بذاریم و ی مقدار باهاش آشنا بشیم (طبیعتاْ عملی) تا اگر راستای کار ما نیست یا چیزی که فکر می‌کردیم و شنیده بودیم نیست وقت زیادی صرفش نکرده باشم (علاقه مهمترین چیز برای پیشرفت هست البته استثنا هم وجود داره)

کانال یوتوب
freeCodeCamp.org
ی منبع خیلی خوب و مناسب هست که بدون تبلیغات اینتروداکشن‌های خوبی میذاره
ترجیح میدم نسبت به منابع رایگان موجود دیگه : چون تمام مطلب توی یک ویدئو آموزش چندساعته هست.

https://www.youtube.com/channel/UC8butISFwT-Wl7EV0hUK0BQ
ی پروژه اپن سورس که خیلی راجبش صحبت می‌شد و همینطور بحث‌ها داره جدی‌تر می‌شه
سایت
OpenCV یا Intel
پروژه برای دیپلوی کردن مدلهای دیپ‌لرنینگ مربوط به عکس و ویدئو هست
که اگر تجهیزات اینتل دارید پیشنهاد من نسخه ادیت شده اینتل هست (پرفورمنس بهتری بهتون می‌ده)

بسیاری از مدل‌های از پیش آموزش دیده تو این پروژه آماده هست فقط کافیه ی سر به گیت‌هاب
OpenCV
بزنید و مدلی که به کار شما میاد رو دانلود کنید ودقت بالا رو بگیرید یا مدل ترین شده خودتون رو با نسخه اینتل ببرید برای پروداکت

خیلی فکر نمی‌کنم این پروژه معروف شده باشه یا استفاده شده باشه هنوز اما چیز خیلی خوبیه و خیلی کمک می‌کنه (قرار نیست دوباره چرخ رو اختراع کنیم)

نسخه اینتل ی آموزش خیلی خوب هم براش گذاشته که آپدیت می‌شه
ی سر به پلی لیستش بزنید.

https://www.youtube.com/playlist?list=PLDKCjIU5YH6jMzcTV5_cxX9aPHsborbXQ
Discussion Group :

قابلیت جدید؛ تلگرام رسمی
ممکنه نیاز به آپدیت باشه (بررسی نشده)

https://xn--r1a.website/joinchat/B1fWSlR0a960tUgBhoDYmA
جدیداْ در یک پروژه متنی شرکت داشتم و می‌تونم بگم ۹۰-۹۵٪ کار بخش پیش‌پردازش و تمیز کردن داده هست (حداقل تو این پروژه که بود)

کار زمانبری هم هست؛ اولین چیزی که به ذهن میرسه برای پردازش داده متنی
regex
هست اما وقتی دیتا از ی حدی بیشتر می‌شه بسیار زمانبر هست

یکی از بهترین جایگزین‌ها؛
FlashText
هست که سرعت بالایی داره و کارباهاش هم ساده‌ هست

اگر تابحال استفاده نکردید پیشنهاد ویژه؛ برای پروژه‌های متنی

@pytens
👍1
#خارج‌ـازـبحث

دنیا ازون چیزی که فکر می‌کنید ترسناکتره ؛ تو بحث امنیت همیشه موقع ذخیره هش پسورد یوزرها: ادمین همیشه طولانی ترین و سخت ترین الگوریتم رو انتخاب می‌کنیم و از کاربرها می‌خوایم که پسوردها طولانی‌ باشه و کاراکتر ویژه حروف کوچک و بزرگ و عدد رو شامل بشه (اما صادق باشیم خیلی‌ها پسورد ساده میذارن و امنیت رو به مدیران سرور و سایت میسپارن چون پسورد سخت رو نمی‌تونن به ذهن بسپارند)

امروز خیلی اتفاقی با دوستی آشنا شدم بخاطر کانفیگ سیستمش (۴تا کارت گرافیک) اولین چیزی که به ذهنم رسید و باعث صحبت بیشتر شد این بود که #دیپ‌لرنینگ کار باشه

اما شاید باورتون نشه شغل ایشون :
Password Cracking بود
حتی نمیدونم چجوری باید توی رزومه ازش صحبت کرد؛ ارزون شدن قیمت جهانی کارت گرافیک‌ها و کودا و ... باعث شده ابزارهایی مثل
HashCat بوجود بیاد

این ابزار از تمام قدرت کارت‌گرافیک‌های موجود استفاده می‌کنه و هش‌ها رو برای شما می‌شکونه روش دیکشنری - بروت‌فرس - وایلدکارد و ...

بسیار بسیار سریع هست و فوق‌العاده؛ اونقد سریع و خطرناک که اگه راه داشته باشه باید خوندن
/ect/passwd
رو برای یوزرهای غیر سودوئر حتماْ بست

ازین ابزار برای شکوندن پسورد وای‌فای و ... هم استفاده می‌شه
پس ازونجا که همچین شغلی بوجود اومده:

۱- اگر ادمین هستید؛ الگوریتم‌های هش رو جدی بگیرید و الگوریتم‌های قدیمی رو بریزید دور (تو چند ثانیه کارشون تمومه)
۲- اگر یوزر هستید؛ حتماْ پسوردهاتون رو جدی بگیرید برای سایت‌های مهم حداقل پسورد ترکیبی بذارید (عدد - سمبل - حروف کوچیک و بزرگ) اگر طول پسورد بالای ۹-۱۰ حرف باشه حداقلش اینه که زمانبرتر می‌شه؛ برای کرکرهای رندم (شما هدف نیستید) شاید اصلاْ تست هم نشه چون زمانبر هست
خیلی وقتا پیشنهاد سیستم برای #دیپ‌لرنینگ اینه که حداقل ۲ برابر حافظه گرافیکی موجود روی سیستم؛ حافظه رم داشته باشید.

شخصاْ حداقل ۴-۵ برابر استفاده می‌کنم
اما متوجه شدم خیلی از دوستان (حتی دولوپر‌های حرفه‌ایی) فقط این مقدار رو پیشنهاد می‌دهند ولی عملاْ هروفت از سیستم
htop بگیرید
میزان استفاده از رم سیستم به این مقدار نمی‌رسه

توی لینوکس ۲تا استفاده خیلی مهم از رم‌ می‌شه کرد وقتی حجم I/O خیلی بالاس
RamFS & tmpFS
سرعتی تا ۲۰ برابر نسبت به SSD برای کار روی دیتاها بهتون میده و دقیقاْ کارش اینه ی بخشی از رم سیستم رو بصورت فایل سیستم فرمت کنید و مثه هارد ازش استفاده کنید (پیشنهاد من برای #دیپ‌لرنینگ کارها مخصوصاْ
tmpFS هست
به دلیل مشکلات RamFS )

اما این حافظه بعد هر ریبوت باید دوباره ساخته بشه یا اینکه خیلی ساده فقط توی
/etc/fstab اضافه‌اش کنید.

حالا ازین به بعد :
هم کدهاتون خیلی سریعتر اجرا می‌شه؛ هم میدونید چرا حداقل ۲برابر حافظه گرافیکی رم برای سیستم می‌گیرید.

امیدوارم مفید باشه
PyData 2019
رو با هیچ بهانه‌ایی از دست ندید؛ ماهم کنفرانس پایتون داریم اینا هم کنفرانس دارن

https://www.youtube.com/playlist?list=PLGVZCDnMOq0qtkoXglrDC6pS8NvY94QQw
در نبرد رستم و اسفندیار به رستم پیشنهاد می‌کند که به جای نبرد تن به تن، دو لشگر را به جنگ هم بفرستیم. پاسخ شاهزاده جوان یکی از زیباترین ابیات شاهنامه است:
مبادا چنین هرگز آیین من
سزا نیست این کار در دین من
که ایرانیان را به کشتن دهم
خود اندر جهان تاج بر سر نهم

فردوسی
#خارج‌ـازـبحث
یه چندساعتی می‌شه خبر اندروید ملی رو می‌شنویم :

متن خبر :‌
در حالی‌که شرکت هواوی در حال توسعه نسخه خاص سیستم عامل خود بر پایه اندروید است ایران هم اعلام کرده قصد توسعه «اندروید ملی» را دارد.

من ی چندتا نکته رو بگم :
۱- چندین و چندسال هزینه شد برای سیستم‌عامل ملی آخرشم گفتن شکست خورد

۲- این پروژه کلاْ شکست خورده‌اس؛ شرکتی مثل هواوی یکی از بزرگترین عرضه ‌کننده‌های تلفن همراه هست که مارکت بسیار بزرگی هم داره و قراره برای سخت‌افزار خودش هم نرم‌افزار ارائه کنه

۳- توی ایران شرکت تولید کننده سخت‌افزار ؛ و یا حتی اسمبل کردن و تولید تلفن همراه مطرحی دیده نمی‌شه (شاید جی‌ال‌ایکس) که به لطف تحریم‌ها و فشارهای اقتصادی و قیمت بالای گوشی‌همراه برخی از مردم محروم ؛ محکوم به خریدش هستند

۴- خیلی از شرکت‌ها تغییر رام - روت شدن تلفن همراه و ... رو حذف گارانتی تلقی می‌کنند؛ چه برسه تغییر کامل سیستم‌عامل

۵- پشتیبانی و ارسال آپدیت و ... برای این همه مدل گوشی کار ساده‌ایی نیست و هزینه گزافی هم داره (بخش خصوصی و شرکتهای تولید کننده موبایل‌ها هم پشتیبانی طولانی مدتی ندارند)

۶- یکی از دوستان اشاره کرد؛ امنیت ملی - و سران مملکتی و جاسوسی؛ آیا عاقلانه‌اس تو شرایط بد اقتصادی موجود میلیاردها تومان پول صرف پروژه‌ایی بشه که فقط یک عده خاص استفاده ‌خواهند کرد به نظرم یه برنامه ارتباطی ابنکریپت شده راه‌حل کم خرجتر و عملی تری هست

از ته قلبم امیدوارم یک دروغ و یک شایعه باشه این موضوع
اگر نه : امیدوارم تصمیم‌گیران مملکت یک تجدید نظر کنن

در نهایت باید بگم : این پروژه شکست خورده‌ هست و باید دید چه شرکت و چه افرادی قراره با این پروژه پول مردم رو به جیب بزنن
👍1
خبرگذاری‌های داخلی گذارش‌هایی مبنی بر حضور سرمایه گذاران چینی و مزرعه‌های استخراج بیت‌کوین اونها میده (که خب طبق قوانین کشور کاری غیرقانونی هست)

بخش خیلی جالبش اینه که هیچکس به بی‌ارزش شدن پول ملی اشاره نمی‌کنه و همه فقط میگن برق ارزون هست؛ امیدوارم موضوع مثه بنزین نباشه و بهونه برای گرونتر شدن‌ (که بخش بزرگی از ارزونی بنزین هم مشکلش همین بی‌ارزشی پول هست وگرنه ماها ارزونی احساس نمی‌کنیم)

اما چه ربطی به دنیای کامپیوتر داره:
حدود ۲-۳ سال قبل که در زمینه بیگ‌دیتا کار می‌کردم پیشنهاد؛ کنتورهای هوشمند و تحلیل دیتا رو ارائه دادم - بگذریم از این که بعد از کلی دوندگی و وعده‌های الکی مسئولان فراری از صحنه اجازه عملی شدن به پروژه داده نشد

اما این پروژه علاوه بر اینکه امروز خیلی بدرد می‌خورد (البته که خیلی زودتر ازین بدرد می‌خورد و پیشگیری بود جلوی ۲ سال برق دزدی از مملکت) ؛ نیروی کار و سرمایه مملکت رو هم ذخیره می‌کرد برای کارهای بزرگتر و ارزشمندتر - البته اونروزا هنوز بحث برق دزدی برای بیت‌کوین نبود و بیشتر بحث دستکاری کنترها (آب-برق-گاز) + حفظ منابع مالی + نیروی انسانی بود.

خلاصه؛ ی وقتایی خیلی از صحبت‌ها بهونه هست واسه اینکه کارها انجام نشه برای اینکه یکسری آدم خاص ضرر نکنن

* ایده + طرح این پروژه بطور کامل هنوز در دسترس هست و اگر کسی می‌تونه اجرا کنه ؛ با به اشتراک گذاشتنش مشکلی ندارم
کتاب پایتورچ (کلی از تنسورفلو صحبت کردیم)
کتاب ۲۰۱۹ - پایتورچ) خیلی پایتورچ کار نیستم اما از سرفصل‌ها فکر می‌کنم کتاب خوبی باشه و شاید بهونه‌ایی برای یادگیری پایتورچ خودم
یک تحقیق بسیار جالب ؛ که می‌تونه برای بازی سازها + فیلم سازی و ... بسیار بسیار کمک کنه
فکر کنید همین رو بر ای موجودات زنده‌ی دیگه هم پیاده سازی کنید و نحوه کامل حرکت اون‌هارو هم پیاده سازی کنید انقدر خوب و طبیعی و عالی
انیمیشن + بازی سازی به معنای واقعی متحول می‌شه.

http://mrl.snu.ac.kr/research/ProjectScalable/Page.htm

کدهاشون رو هم در گیت‌هاب قرار دادند.