دستاوردهای یادگیری عمیق(InTec)
9.45K subscribers
363 photos
40 videos
44 files
674 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
کنفرانس مد نظرم،
#نه_به_کنفرانس_کت‌وشلواری_برنامه‌نویسی 😂

src:
Coding Tech, Deno, Replace Node.JS?
قیمت سرویس‌های کلود گوگل برای هر Gpu T4 و به ازای هر ساعت رو مدنظر بگیرید، شاید دیگه نیازی به خرید سیستم دیپ‌لرنینگ نداشته باشید. (همکاری انویدیا و گوگل)

Link
isna.tgz
11.3 MB
اینکه دیپ‌لرنینگ نیاز به دیتای زیادی داره درست، اما بهونه برای عدم کار (تمرین) نشه
توی این فایل حدود ۱۳.۰۰۰ اخبار کرال شده از سایت #ایسنا وجود داره که کاملاً هم قانونی (Robot.txt) کرال شده، و همه‌ی تگ‌ها بصورت جداگونه و در یک فایل json ذخیره شده

* اگر از تیم ایسنا، درخواستی برای حذف دیتاست هست می‌تونن با آیدی
,--------
در ارتباط باشند، هرچند طبق قوانین و با تعداد رکوئست بسیار پایین سایت کرال شده.
دستاوردهای یادگیری عمیق(InTec)
isna.tgz
برخی از دوستان درخواست سورس کد این کرالر رو دادند که بنا به دلایل زیر امکانش نیست :

۱- قوانین سایت روی ساده‌ترین حالت قرار داره (نمیدونیم واقعاً هدف همین بوده، یا یک فراموشی برای تغییر دادن)

۲- کرالر به هیچ‌وجه در زمان دانلود بلاک نشد، حتی زمان کرال بیش از ۵۰۰.۰۰۰ خبر

۳- با توجه به عدم بلاک شدن، پخش شدن این کد می‌تونه رکوئست‌های زیادی رو به سمت سایت بفرسته که حتی اگه سایت دان نشه (طبیعتاً نباید بشه)؛ می‌تونه هزینه زیادی داشته باشه برای نگهداری و ...
گوگل ریسرچ پروژه‌های بسیاری رو open source قرار داده به همراه کد و توضیحات و ....
برای جزئیات بیشتر گیت‌هاب و لینک ریسرچ رو می‌تونید دنبال کنید

Google Research

Github Link
شاید اگر بگن استرینگ ها (کلمات، جملات و ...) رو توی یک corpus خیلی بزرگ مقایسه کنید اولین چیزی که به فکر میرسه و کد زده می‌شه

somestring1 == somestring2

باشه؛ اما مشکل اینجاس که برای corpus های خیلی خیلی بزرگ اینکار بسیار زمانبر هست و بدتر ازون اینکه اگر بخواید vec هم در بیارید ازش می‌تونه بسیار وقت گیر باشه و به حافظه بسیار بسیار بیشتری نیاز داشته باشه (که باعث بشه نتونید روی سیستم یا سرور فعلی اجرا کنید کد رو، البته بسیاری از ابزارهای موجود از تکنیکی که خواهم گفت استفاده می‌کنند)

ی راهکار دیفالت در پایتون برای این مسئله هست که بطور خودکار، برای اسم
functions, variables, classes
و خلاصه هرچیزی که درطول اجرای برنامه واجبه استفاده می‌شه؛ از این تکنیک در
Python Core

برای اپتیمایز کردن استفاده می‌شه، پکیج sys در پایتون هم دارای متدی هست به نام
intern()
که بعنوان ورودی یک string رو میگیره و خروجی اون یک آدرس حافظه هست (تمامی متغییر‌هایی که توی پایتون تعریف می‌کنیم آدرس حافظه هست)

به این ترتیب، اگر کل corpus رو با این روش آدرس دهی کنید، می‌تونید خیلی راحت و البته به مراتب سریعتر بین stringها مقایسه کنید.
somestring1 is somestring2


sys.intern() python documentation
“Artificial Neural Networks are Reconstructing Human Thoughts in Realtime”


Blog Post Link
👍1
تشخیص فاصله اشیا در عکس (دیتاست + کد)
این کار برای رباتیک و کنترل اتوماتیک مفید خواهد بود (مخصوصاً با توجه به قیمت بسیار بالای برخی از انواع سنسورها و تجهیزات)

توجه داشته باشید، که تولیدات سری Jetson توانایی اجرای همزمان چندین مدل رو نیز دارند.

Link

@pytens
جمعی از دوستان متخصص تصمیم گرفتن تجربیات و تخصص خودشون رو در زمینه وب و پایتون (بطور تخصصی Django ) به اشتراک بگذارند

اگر به این موضوع علاقه دارید می‌تونید کانال

@DjangoEX

رو دنبال کنید 🌹🌹
OctConv
چیه و چرا باید جایگزین Conv های معمول توی کدهامون بشه ؟!
- جواب ساده : مصرف کمتر حافظه و پردازنده البته بهمراه دقت بالاتر

Paper Summary