Hugging Face (🤗)
رو قبلتر برای دوستان nlp کار معرفی کردم، حالا این تیم درحال کار روی Gpt-3 هست (احتمال میره سایز مدل کامل چیزی بین 350-750G باشه
نکته جالب اینه که تعداد پارامترها و سایز مدلها تنها چیزیه که این روزها بهش اشاره میشه
توی پستها تعداد خیلی کمی به بهبودهای این مدل و اینکه چه تسکهایی رو انجام میده اشاره کردند ( آیا واقعاً کار شما به همچین مدلی نیاز داره ؟!)
Github Link
رو قبلتر برای دوستان nlp کار معرفی کردم، حالا این تیم درحال کار روی Gpt-3 هست (احتمال میره سایز مدل کامل چیزی بین 350-750G باشه
نکته جالب اینه که تعداد پارامترها و سایز مدلها تنها چیزیه که این روزها بهش اشاره میشه
توی پستها تعداد خیلی کمی به بهبودهای این مدل و اینکه چه تسکهایی رو انجام میده اشاره کردند ( آیا واقعاً کار شما به همچین مدلی نیاز داره ؟!)
Github Link
GitHub
Add upcoming GPT-3 model · Issue #4658 · huggingface/transformers
🌟 New model addition Model description The GPT-3 paper just landed on ArXiv: https://arxiv.org/abs/2005.14165. Would be great to integrate it into Transformers, whenever models are available. Here ...
LongFormer (Transformer for big documents)
هم به hugging face اضافه شد
هم به hugging face اضافه شد
GitHub
longformer/README.md at master · allenai/longformer
Longformer: The Long-Document Transformer. Contribute to allenai/longformer development by creating an account on GitHub.
ParsBERT: Transformer-based Model for Persian Language Understanding
https://arxiv.org/abs/2005.12515
https://arxiv.org/abs/2005.12515
ابزاری برای نمایش ساختار شبکه (بسیار مناسب برای گذارش دهی)
فقط کافیه مدل ذخیره شده رو بهش بدید
Github Link
فقط کافیه مدل ذخیره شده رو بهش بدید
Github Link
GitHub
GitHub - lutzroeder/netron: Visualizer for neural network, deep learning and machine learning models
Visualizer for neural network, deep learning and machine learning models - lutzroeder/netron
بالاخره من یه روزی میرم دفتر گوگل و بهشون ثابت میکنم که ربات نیستم. (کولب gpu)
۵ روز تا شروع
دوره جدید deeplearning.ai که تخصصی به موضوعات پیرامون NLP خواهد پرداخت
دوره جدید deeplearning.ai که تخصصی به موضوعات پیرامون NLP خواهد پرداخت
درحال ساخت اکانت اسپم برای کولب بودم که توی مرحله ارسال کد از طریق پیامک گوگل، هر بار که درخواست دادم با یک شماره متفاوت پیام اومد.
دوحالت داره :
۱- ایرانسل درحال رصد پیامکهاست (حتی کدهای هویتی)
۲- گوگل خط ایرانسل خریده :/
اگر کسی متوجه موضوع شد، برای منم توضیح بده (بیش از ۱۰ بار تست شد)
پ.ن: دوستان میگن این موضوع برای اینستاگرام هم دیده شده
فعلاً بهترین راهکار فعال سازی،
Two step verification
هست
دوحالت داره :
۱- ایرانسل درحال رصد پیامکهاست (حتی کدهای هویتی)
۲- گوگل خط ایرانسل خریده :/
اگر کسی متوجه موضوع شد، برای منم توضیح بده (بیش از ۱۰ بار تست شد)
پ.ن: دوستان میگن این موضوع برای اینستاگرام هم دیده شده
فعلاً بهترین راهکار فعال سازی،
Two step verification
هست
GitHub Link
#پیشنهاد_ویژه
برای درک بهتر نحوهی عملکرد مدلهای ماشین لرنینگ و دیپ لرنینگ که آموزش میدید.
#پیشنهاد_ویژه
برای درک بهتر نحوهی عملکرد مدلهای ماشین لرنینگ و دیپ لرنینگ که آموزش میدید.
GitHub
GitHub - shap/shap: A game theoretic approach to explain the output of any machine learning model.
A game theoretic approach to explain the output of any machine learning model. - shap/shap
دستاوردهای یادگیری عمیق(InTec)
GitHub Link #پیشنهاد_ویژه برای درک بهتر نحوهی عملکرد مدلهای ماشین لرنینگ و دیپ لرنینگ که آموزش میدید.
برای توضیح نحوه عملکرد CNN هم ميتونید ازین مقاله استفاده کنید
Grad-CAM stands for Gradient-weighted Class Activation Mapping
Grad-CAM attempts to solve interpreting problem by giving us a graphical visualisation of parts of an image that are the most relevant for the CNN when predicting a particular class
https://arxiv.org/abs/1610.02391
Grad-CAM stands for Gradient-weighted Class Activation Mapping
Grad-CAM attempts to solve interpreting problem by giving us a graphical visualisation of parts of an image that are the most relevant for the CNN when predicting a particular class
https://arxiv.org/abs/1610.02391
قبلاً راجب
GPUDirect RDMA (Remote Direct Memory Address)
صحبت کردم (خیلی خیلی قبلتر) و اینکه چقدر مهمه برای شبکه کردن GPU ها
چون دسترسی مستقیم و کنترل کارت شبکه رو به GPU میده و سربار انتقال و کنترل CPU رو از روی workerها بر میداره (در نهایت سرعت بالاتر میده)
حالا به لطف پیشرفتها
GPUDirect Storage(Direct Path Between Storage and GPU Memory)
(تصویر فوق)
رو داریم که لود کردن داده رو تا بیش از 10 برابر سریعتر و بیشتر میکنه، اگر حجم دیتا خیلی زیاد هست پیشنهاد میکنم با این دو تکنولوژی کار کنید.
GPUDirect RDMA (Remote Direct Memory Address)
صحبت کردم (خیلی خیلی قبلتر) و اینکه چقدر مهمه برای شبکه کردن GPU ها
چون دسترسی مستقیم و کنترل کارت شبکه رو به GPU میده و سربار انتقال و کنترل CPU رو از روی workerها بر میداره (در نهایت سرعت بالاتر میده)
حالا به لطف پیشرفتها
GPUDirect Storage(Direct Path Between Storage and GPU Memory)
(تصویر فوق)
رو داریم که لود کردن داده رو تا بیش از 10 برابر سریعتر و بیشتر میکنه، اگر حجم دیتا خیلی زیاد هست پیشنهاد میکنم با این دو تکنولوژی کار کنید.
👍1
FakeCovid
دیتاست جدیدی راجب COVID-19 البته این دیتاست بصورت متن هست ( اخبار پیرامون کوید-۱۹) که درستی اونها چک شده
5182 اخبار به 40 زبان مختلف (اکثریت انگلیسی)
GitHub Link
دیتاست جدیدی راجب COVID-19 البته این دیتاست بصورت متن هست ( اخبار پیرامون کوید-۱۹) که درستی اونها چک شده
5182 اخبار به 40 زبان مختلف (اکثریت انگلیسی)
GitHub Link
FakeCovid
About Fake news on coronavirus, corona virus, Covid