دستاوردهای یادگیری عمیق(InTec)
9.45K subscribers
363 photos
40 videos
44 files
674 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
خیلی وقتا کار کردن با تیم‌های خارجی سخت می‌شه
مخصوصاْ وقتی ما تو تعطیلات سال نو هستیم و تیم تو اوج کار

تو این چند روز درگیر پیدا کردن راه‌کاری بودم که بشه مدل دیپ‌لرنینگ رو روی تموم دیتاها ترین کرد ؛ خب وظیفه من این بود که راه‌کار مناسب رو ارائه بدم ؛ نسبت به کار باقی تیم ساده بنظر میاد ولی خیلی سخت شد (حاضرم قسم بخورم)

از حجم دیتا همین رو بگم که DGX هم جوابگو نبود
کلی راهکار تست شد و چندتایی هم جواب داد ولی راهکاری نبود که ما لازم داشتیم

درنهایت بالاخره به راهکار مناسب رسیدم :
https://github.com/horovod/horovod
ی ابزار کاملاْ مناسب برای اینکار (و البته ساده)با پشتیبانی از فریمورک‌های معروف و توسعه داده شده توسط اووبر


حالا می‌شه تعطیلات شروع بشه
سال نو مبارک 🌹🌹🌹🌹
#NeuroSAT
NeuroSAT, a message passing neural network that learns to solve SATproblems after only being trained as a classifier to predict satisfiability

مقاله‌ایی بسیار جالب و بسیار کاربردی پیشنهاد می‌کنم حتماْ مطالعه کنید

https://arxiv.org/pdf/1802.03685.pdf
یکی از جذابترین کاربردهای یادگیری عمیق (نظر شخصی) همین ماشین‌های خودران و جذابتر ازون
Autonomus Flying Vehicle هست

بخاطر علاقه‌ایی که شخصاْ به این کاربرد دارم و درحد توان شخصی هر از گاهی تحقیق (عملی) و تست‌هایی انجام میدم

وقتی صحبت ازین چیزها می‌شه اولین شرکت‌هایی که جلب توجه می‌کنه ؛ گوگل - بایدو - اوبر هستند و نمی‌شه در این زمینه کار کرد و پروژه آپولو بایدو رو نشناخت
طبق تعریف خودشون :

Apollo is a high performance, flexible architecture which accelerates the development, testing, and deployment of Autonomous Vehicles.

تمامی بخش‌ها و تمام اطلاعات و حتی HD MAP های خود بایدو (آپولو بخاطر کمک‌های بزرگش تو این زمینه و بهبود استانداردها بسیار معروف هست)
بطور کامل در دسترس هست.

یکی از بخش‌هایی که خیلی من رو به آپولو و کارشون علاقه مند کرد همین موضوع
OpenSource
بودن بود؛ به لطف این شرکت نقشه‌ها و سخت‌افزارهای لازم ؛ اتصالات بهینه و نحوه کالیبره کردن نیز در اختیار قرار گرفته

اگر شما هم به این مباحث علاقه مند هستید و می‌خواید بیشتر آشنا بشید
بنظرم لینک‌های زیر رو از دست ندید :

https://github.com/ApolloAuto/apollo
https://github.com/ApolloAuto/apollo/blob/master/docs/quickstart/apollo_3_0_quick_start.md
https://github.com/ApolloAuto/apollo/blob/master/docs/quickstart/apollo_2_5_hardware_system_installation_guide_v1.md


@Pytens
دستاوردهای یادگیری عمیق(InTec)
روز تعطیل و بطور ویژه جمعه‌ها روزهای خوبیه برای تست چیزهایی که در طول هفته و یا ماه و ... روش کار و تحقیق کردید ؛ Speech to text فایل mp3 و text ایی که قرار خواهم داد ورودی و خروجی مدل speech to txt هست که البته هنوز مدل رو بطور کامل با کل DataSet آموزش…
تو ادامه این پروژه رفتم سراغ wavenet و خواستم خوندن رو هم اون انجام بده
که قبلتر تو پستی بهش اشاره کردم

اما ی مقدار با صداها مشکل داشتم (جذاب نبود برام)
بعد از کلی تست و جستجو به ی کتابخونه خیلی باحال رسیدم تو پایتون
اگر کار شماهم با صدا هست
بنظرم تستش کنید خیلی باحاله.

https://pypi.org/project/audiotsm/

"AudioTSM is a python library for real-time audio time-scale modification procedures, i.e. algorithms that change the speed of an audio signal without changing its pitch."
در حال خوش گذرونی در
distrowatch
بودم که ی توزیع خیلی باحال پیدا کردم

دیپ لرنینگ کارای عزیزی که به دلیل برخی مشکلات (مثلاْ دردسرهای py3 روی CentOS) مجبور به استفاده از ubuntu بودید

تجدید نظر کنید با

https://system76.com/pop

بخوام ساده بگه ؛ کاملاْ ساده و با داغترین آپدیت‌ها

مثلاْ نصب تنسورفلو + کودا + cudnn روی این سیستم :

sudo apt install tensorflow-cuda-latest

خودم واسه بازی کردن رو لینوکس مفید دیدمش (اوبنتو و ... اصن خوب آپدیت نمی‌شدن هی باس پاک میشد و دوباره نصب می‌شد)
احتمالاْ تعداد کمی از دوستان پروژه
JumpCutter
رو می‌شناسید ی دانشجوی (ژاپنی - کره‌ایی یا شایدم چینی) از دانشگاه استنفورد
تلاش می‌کنه بامزه باشه اما بنظرم جلف هست بیشتر

بگذریم ؛ خوب کد میزنه مخصوصاْ توی موضوع دیپ‌لرنینگ یا ایده‌های باحالی داره که البته خوب اجرا نمی‌شه

ولی این کدش خیلی باحال نوشته شده :
اگر شماهم وقت کمی دارید و دوست دارید موضوعات جدید رو یاد بگیرید ویدئوها همیشه گزینه خوبی هستند و اگه مثه من حوصلتون خیلی زود سر میره سرعت ۲ برابر کاریه که برای دیدن ویدئوها انجام میدید (بیشتر کردنش خیلی جوابگو نیست بعضی وقتاهم باید بیاریمش روی ۱.۷۵)

خب تا اینجای کار رو همه ابزارها انجام میدن
کار جالبی که تو این کد انجام شده اینه که جاهایی که هیچ صحبتی وجود نداره و حرفی زده نمی‌شه (یا صدا از ۰.۴ دسی کمتر می‌شه مثلاْ جاهایی که یکی دیگه داره سوال می‌کنه یا جواب سوال مدرس رو می‌ده ) رو هم با سرعت ۴-۶ برابر اجرا می‌کنه

بطور تست روی دوره جدید استنفورد حدود ۲ ساعت وقت کمتر نسبت به سرعت ۲ برابر لازم شد تا تمومش کنم

امیدوارم برای شماهم مفید باشه

https://github.com/carykh/jumpcutter
حتماْ همه راجب گوگل STADIA شنیدید
ی پلتفرم خفن که بازی کردن رو برای همه ارزون و راحت می‌کنه (سخت‌افزار از گوگل هزینه و اینترنت از شما و روی هر سیستمی می‌تونید بازی کنید.)

بخش جالب این قضیه اینه که با
VMWARE
هم همه ما سالها همچین کاری رو بدون GPU انجام میدادیم
برای منم از اینجا شروع شد می‌شه با VMWARE کارت گرافیک رو هم به اشتراک گذاشت

بعد از کلی تست و تکنولوژی‌های AMD نویس اینکار انجام شد.
اما اگه از هدف بازی‌کردن بگذریم (خیلی‌هم لذت بخشه می‌دونم)

چیزی که منو جذب کرد تا اینکارو تست کنم این بود که اینکار می‌تونه آزمایشگاهای دیپ‌لرنینگ رو خیلی ارزون قیمت مجهز کنه (البته راهکارهای دیگه بسیار هست اما این مورد راحت‌تر و بهتره)

علاوه بر اون سمت سرور هم می‌شه کارهای جالب بسیاری انجام داد
مخصوصاْ بعد از زمان train

اگر دوست داشتید ی STADIA می‌تونید راه بندازید
دستاوردهای یادگیری عمیق(InTec)
این ویدئو کاری با دیپ‌لرنینگ نداره یادمه قبلترهم راجب گوگل و دیتاهایی که استفاده می‌کنه متن گذاشته بودم https://www.youtube.com/watch?v=hLjht9uJWgw
خوشبختانه تموم دیتایی که گوگل از من داره
به این ۲ مگ ختم می‌شه

اگر می‌خواید خودتون تست کنید
https://support.google.com/accounts/answer/3024190?hl=en

دلیل اینکه گوگل دیتایی از بنده نداره ؛ شاید بخاطر اینه که ایمیل خرید و ... سایتهای مختلفم به گوگل وصل نیست (شخصی هست)
موتور جستجو هم داک‌داک‌گو هست
و از جیمیل فقط برای ایمیل ساده استفاده می‌کنم

تمامی سرویس‌هاش روهم خاموش کردم (برای بکاپ دیتا هم از NextCloud روی سیستم شخصی استفاده می‌کنم)
معاون دادستان کل: چاره‌ای نباشد «اینستاگرام» را فیلتر می‌کنیم.

یاد توییت جناب وزیر آقای جهرمی افتادم و پاسخ هموطنمون ؛

«با فیلترینگ توییتر، تلگرام و وب‌سایت‌های مختلف، چی رو ثابت کردید؟ به دنیا گفتید که از اون چیزی که یک ملت ممکنه بگن، می‌ترسید. همین!»

عجب !!!
وقتی میگم گیت‌هاب برای یادگیری و تمرین خوبه
منظورم این نیست که دوستان کد‌های بخش
model - research
ریپوزیتوری خود تنسورفلو رو بخونن تا یاد بگیرند.

ی سری کد ساده که شمارو درگیر آبجکت و کلاس و کلی فایل نکنه و روتین کد زده باشه
و دسته بندی هم شده باشه

مثه این :
https://github.com/dragen1860/TensorFlow-2.x-Tutorials
ی ذره چینی داره ولی خب خیلی اهمیتی نداره
بخش‌های مهم انگلیسی هستند
#خبر
#درگذشت خالق زبان برنامه‌نویسی در ۶۸ سالگی
#Erlang

https://www.kth.se/profile/jlarm/

قشنگترین توصیف در مورد نحوه پیشرفتشون در برنامه نویسی :

At 17, Joseph began programming Fortran on his school district’s mainframe. This experience helped him during his physics studies at University College London, where he debugged the programs of his fellow students in exchange for beer.

خدایش بیامرزد
#خارجـازـبحث
امروز یکی از دوستان باهام تماس گرفت و گفت احساس می‌کنه کسی به گوشیش دسترسی گرفته
دلایلش :
حجم بسته‌هاش خیلی زود تموم می‌شه
بیشترین مصرف دیتارو گوشیش داره (روی شبکه و مودم)
چندتا پسوردهاش رو هم انگار کسی دسترسی گرفته

دلایلش که قانع کننده نبود ولی خب تست انجام دادم :
۱- اول گوشی رو خاموش کردم و بعد با ابزارهای موجود مثه #وایرشارک و ... شروع به دریافت پکت‌ها کردم و گوشی رو روشن (آی‌پی استاتیک برای مک‌آدرس گوشی قرار دادم)
۲- آنالیز پکت‌ها رو (لیست آی‌پی‌ها) رو بصورت
csv
گرفتم از برنامه
۳- با پایتون تمام آی‌پی‌های لوکال و دی‌ان‌اس و ... رو حذف کردم و باقیش رو
unique
کردم
۴- به کمک
https://traceroute-online.com/ip-asn-lookup/
لیست آی‌پی‌هایی که موند رو چک کردم تا ببینم کدوماشون شناخته شده و ... هست
۵- نهایتاْ به ۸ تا آی‌پی رسیدم که مشکوک بود ۷ تاشون رو به کمک
https://www.shodan.io/
پیدا کردم که برای کدوم برنامه هست و ...

آخرین آدرس آی‌پی که مونده بود رو تست کردم و اصلاْ‌ شناخته شده نبود (این‌بار حق با دوستمون بود)
اولین کاری که کردم پورت اسکن بود و چیزی که پیدا کردم پورت دیفالت
mariaDB
بود پورت ۸۰ هم باز بود (اگر فکر می‌کنید عمراْ کسی پورت دیفالت رو باز نمیذاره یادتون باشه تاکسی آنلاین مملکت پورت دیفالت مانگو رو تغییر نداده بود - ادمین دوروزه)
ی سر به آدرس با مروگر زدم و با ی جستجو فهمیدم که ی صفحه
scam - fakepage
هم اونجا راه انداخته
پسوردهای دیفالت اولین چیزیه که همه تست می‌کنن (منم اینکارو کردم)
ولی ازونجا که فیلم ایرانی نیست (جواب نداد) ؛ خوب همینجا می‌شه آی‌پی رو با فایروال (آندروید) بن کرد.

ولی برای آخرین تست توی صفحه فیک‌پیج ی کوئری ارسال کردم و ی یوزر جدید ساختم و دسترسی کامل بهش دادم
با ترمینال و رو پورت باز
MariaDB
تست کردم و دسترسی برقرار بود.

حدود ۲ هزارتا سطر داشت دیتابیس طرف (خیلی تلاش کرده بود معلوم بود) و کاری که کردم drop بود.

ازونجا که ممکن بود وضعیت مشابه برای خیلی از دوستان اتفاق بیوفته گفتم این متن رو قرار بدم تا دوستان اگر خواستند خودشون تست کنند. (تا جایی که با فایروال آی‌پی رو ببندید هرشخصی می‌تونه انجام بده)
امیدوارم مفید باشه 🌹
1👍1🤯1
درگذشت پدر جناب دکتر #عسگری عزیز رو به خودشون و خانواده محترمشون تسلیت عرض می‌کنیم

#روحشون شاد
وقتی کسی از شما منبعی برای یادگیری دیپ‌لرنینگ درخواست می‌کنه ؛ احتمالاْ جزو اولین گزینه‌ها (با فرض اینکه طرف برنامه‌نویسی و ... رو اشراف داره)

deeplearningbook.org

هست ؛ اما خیلی‌ها با ی مرور سریع و دیدن اون همه ریاضیات تصمیم می‌گیرند که این کتاب رو کنار بذارند

https://www.youtube.com/playlist?list=PLsXu9MHQGs8df5A4PzQGw-kfviylC-R9b

این پلی‌لیست یوتوب ویدئوهایی راجب همین کتاب هست که خیلی می‌تونه مفید باشه
اگر از دیپ‌لرنینگ در زمینه‌های

drug discovery, materials science, quantum chemistry, and biology

پیشنهاد می‌کنم حداقل یکبار؛ نگاهی به
https://www.deepchem.io/

بندازید
دوره آموزش کد زنی
Tensorflow 2.0
این دوره تازه داره کامل می‌شه و ی برنامه نویس مثل خیلی از ماها داره دوره رو می‌ذاره

۲ تا ویدئو اول آپلود شده و بنده ی مروری کردم تا اینجا خوب و مفید هست
اگر می‌خواید تنسورفلو رو یاد بگیرید (تئوری دیپ لرنینگ رو بلد هستید.)

این دوره می‌تونه مفید باشه :

https://www.youtube.com/playlist?list=PLzMcBGfZo4-lak7tiFDec5_ZMItiIIfmj
👍1
ی وقتایی به این فکر می‌کنم، شاید تنبلی بیش از حد اکثریت آدما ‎#هوش_مصنوعی رو مهمتر کرده