Data world with Mina
4.17K subscribers
371 photos
62 videos
169 files
389 links
minarabti32@gmail.com
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti
Download Telegram
SQL summary.pdf
447.5 KB
چیت شیت sql
منبع مطالب دیتا ساینس و هوش مصنوعی

@datalook_ir
🙏31
Data_Science_Interview_Prep_for_SQL__Panda__Python__R_Langu.pdf
840.8 KB
جدیدترین سوالات (با پاسخ )مصاحبه حوزه دیتا ساینس
در مباحث پایه #دیتا_ساینس
#یادگیری_ماشین
#الگوریتم_ها
#پایتون و #برنامه نویسی
#پانداس
#sql



@datalook_ir
🙏4👏2
🌸 فرا رسیدن نوروز باستانی
یادآور شکوه ایران و یگانه یادگار جمشید جم، بر همه ایرانیان پاک پندار، راست گفتار و نیک کردار خجسته باد 🌸

امیدوارم و از ته قلبم آرزو میکنم سال ۱۴۰۲
برای همه ایرانیان در هر جای دنیا
نو باشه و پر از امید و موفقیت 😍🤩

مینا ربطی
آکادمی آموزشی دیتا لوک
منبع مطالب آموزشی دیتا ساینس و هوش مصنوعی
@dataloook_ir
23🙏2🤩1
Channel name was changed to «mina_rabti»
دوازده کتابخانه‌ برتر مدل‌سازی سری‌های زمانی در Python در سال ۲۰۲۲
🙏132👏1
Time Series skforecast.pdf
3 MB
راهنمای گام‌به‌گام مدل‌سازی سری‌های زمانی با استفاده از کتابخانه skforecast

خاویر اسکوبار، دانشمند داده IKEA

مخزن کدها و فعال‌سازی:
https://github.com/JoaquinAmatRodrigo/skforecast
🙏63👏2👍1
با سلام و عرض ادب

🔴 به اطلاع اساتید ، دانشجویان و فارغ التحصیلان می رساند مرکز رشد دانشگاهی در صدد جذب نیرو در زمینه ی هوش مصنوعی می باشد.🔴

در صورت تمایل به همکاری رزومه ی خود را به آیدی زیر ارسال نمایید.

🆔 @ma_python
🙏5
تابع مهم و بسیار پر کاربرد لامبدا در پایتون

#python
#data_science


https://xn--r1a.website/datalook_ir
👍13
Forwarded from Milad Nouri(ツ) میلاد نوری
اینکه به ChatGPT می‌گه، چتٕ جی‌پی‌تی، به کنار.
اینکه به ChatGPT می‌گه پیام‌رسان هم به کنار.
اونجا که برای نمایش بد بودن چت جی‌پی‌تی می‌گه با پشتیبانی مایکروسافت "امریکا"، خبر داره چند درصد سازمان و اداره‌های دولتی ما از ویندوز و آفیس و... مایکروسافت امریکا استفاده می‌کنن؟

‏جوری از مسدود شدن چت جی‌پی‌تی در ایتالیا ذوق‌زده شدن، انگار توجیه پیدا کردن تو ایران هم مسدودش کنن.
درحالی که چتِ جی‌پی‌تی خودش از قبل به آی‌پی و شماره ایران سرویس نمی‌ده.


📝 @MiladNouriChannel
😁11
Forwarded from Milad Nouri(ツ) میلاد نوری
توییتر سورس مربوط به سیستم ریکامندیشین خودش رو به صورت اوپن سورس منتشر کرد.
اگر علاقه‌مند بودید بررسی کنید:

https://github.com/twitter/the-algorithm

📝 @MiladNouriChannel
SAM: Segment Anything Model.
A Foundation model for image segmentation.
From FAIR.

code: https://github.com/facebookresearch/segment-anything
demo: https://segment-anything.com/demo


انتشار توسط yann leCun در لیندکین
دیتا ساینتیست در متا
👏7🙏1
5
💠 "رویداد استارتاپی متاورس"
💢 مراکز آموزش علمی - کاربردی جهاددانشگاهی کرج، خانه کارگر ساوجبلاغ با همکاری سازمان فرهنگی، اجتماعی و ورزشی شهرداری فردیس و پارک علم و فناوری البرز برگزار می کند.
"ویژه دانشجویان، مدرسان، کارکنان و علاقه مندان به حوزه فناوری اطلاعات"
🔖 محورهای رویداد:
1. بلاک چین
2.شهر هوشمند
3.مدیریت پسماند
4. جذب مشتری در علم داده
5.فناوری نوین معماری و شهرسازی
🏆 معرفی ایده های برتر به صنایع مرتبط و اهداء جوایز نفیس به ایده های برتر
🗓 مهلت ارسال ایده: 22 اردیبهشت ماه 1402
تاریخ برگزاری: 22 تیرماه 1402
ثبت نام از طریق:
http://jalborz.ir/fa/news/52629

🟧 دانشگاه جهاد دانشگاهی کرج
🔲 دوره‌های هنر • it • مدیریت • زبان • حقوق
سایت | تلگرام | اینستاگرام 🔹🔶
🔥1
«🤖ترانسفورمر» یک مدل یادگیری عمیق است که مکانیسم توجه به خود، به‌طور متفاوتی اهمیت هر بخش از داده‌های ورودی را وزن می‌کند. عمدتاً در زمینه‌های پردازش زبان طبیعی (NLP) و بینایی رایانه ای (CV) استفاده می‌شود.

مانند شبکه عصبی بازگشتی (RNN)، ترانسفورمرها برای مدیریت داده‌های ورودی متوالی، مانند زبان طبیعی، برای کارهایی مانند ترجمه و خلاصه متن طراحی شده‌اند. با این حال، برخلاف شبکه عصبی بازگشتیها، ترانسفورمرها لزوماً داده‌ها را به ترتیب پردازش نمی‌کنند. در عوض، مکانیسم توجه زمینه را برای هر موقعیتی در دنباله ورودی فراهم می‌کند. به عنوان مثال، اگر داده ورودی یک جمله زبان طبیعی باشد، ترانسفورمر نیازی به پردازش ابتدای جمله قبل از پایان ندارد.

📚این ویژگی اجازه می‌دهد تا موازی سازی بیشتر از شبکه عصبی بازگشتیها باشد و بنابراین زمان آموزش را کاهش می‌دهد.

داده‌های بزرگتر از زمانی که ممکن بود را می‌دهد. این منجر به توسعه سیستم‌های از پیش آموزش دیده مانند مدل Bert و
GPT( Generative Pre-trained Transformer)
شده است.
آموزش ترانسفورمرها
در کانال یوتیوب
mina rabti

https://m.youtube.com/channel/UCvxKAC5IdZp6U_75sre0CEw
👍7🔥6🙏32
کورس Data Visualization لینکدین:
linkedin.com/learning/data-visualization-a-lesson-and-listen-series

این آقای Bill Shander توی این کورس یه مصاحبه داشته با Nadieh Bremer،
که ایشون توی Pinterest یه عالمه تصویر ذخیره کرده برای ایده و الهام گرفتن

اگه به دیتا ویژوالیزیشن علاقه دارین
خوبه که یه نگاهی بندازین بهش:
https://www.pinterest.com/nadiehbremer

درضمن بخش Blog پورتفولیوی این خانم هم کلی مطلب آموزشی خوب داره:
https://www.visualcinnamon.com/blog
7👍3
Forwarded from Data world with Mina (Mina Ra)
کتابخانه Dask


- اگر با دیتاست حجیمی روبرو هستید که حافظه اصلی (RAM) کامپیوتر شما گنجایش نگه‌داری آن برای پردازش را ندارد…
- اگر در حال توسعه سیستم نرم‌افزاری و یا یک پایپلاین ETL هستید که کوئری سنگینی را به دیتابیس میزند و مدت زیادی طول می‌کشد (long-run query) یا دیتابیس عملیاتی شما را با اختلال مواجه می‌کند…
- اگر قرار است یک پردازش سنگین مثل تحلیل اکتشافی داده‌ها (EDA) بر روی حجم بالایی از کلان‌داده‌ها داشته باشید که بدون پردازش موازی امکان‌پذیر به نظر نمی‌آید…

احتمالا شما نیاز به یک ابزار مناسب برای پردازش موازی، توزیع شده و مقیاس‌پذیر دارید. ابزارهایی مثل Apache Spark و Hadoop مبتنی بر اکوسیستم Java اند و احتمالا به همین دلیل مورد علاقه خیلی از Data Scientist ها و Data Analyst ها نیستند. در مقابل Dask کاملا بر اکوسیستم Python سوار است و به Data Scientist ها و Data Analyst ها اجازه می‌دهد ابزارهای روزمره خود مثل Numpy و Pandas و Scikit-learn و XGBoost و TensorFlow رو به صورت توزیع شده، موازی و مقیاس پذیر به کار گیرند.


الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
🙏7👍3👏1
Forwarded from Data world with Mina (Mina Ra)
برای کار به عنوان داده کاو یا دانشمند داده در یک شرکت‌‌، باید مصاحبه فنی مربوطه را با موفقیت پشت سر گذاشت. اما چه سوالهایی معمولا برای این مصاحبه پرسیده می شوند؟ چند نمونه از این سوالات را که خودم در مصاحبه ها با آنها مواجه شده ام را در اینجا مطرح می کنم. با توجه به اینکه سابقه کار در این زمینه را در ایران ندارم، لذا سوالات مربوطه از مصاحبه های فنی موسسات و شرکتهای واقع در خارج از ایران نظیر IBM, ANZ bank, Sportsbet, iSelect
می باشد.
(صحبت های یک دیتا ساینتیست در خارج ایران)
۱- تعریف و توضیح در مورد
P-value

۲- رگولاریزاسیون چیست و برای حل چه مشکلی استفاده میشود؟ تفاوت بین نرم L1 و L2 چیست؟

۳- تبدیل Box-Cox چیست؟

۴- توضیح در مورد MultiCollinearity
و چگونگی حل آن؟

۵- آیا الگوریتم Gradient descent همیشه به نقطه یکسانی همگرا میشود؟

۶- چگونه در الگوریتم K-means تعداد کلاسترهای بهینه را می توان مشخص کرد؟

۷- بردار ویژه و مقدار ویژه چیست؟

۸- با چه کتابخانه های داده کاوی از زبان پایتون آشنایی دارید؟ همچنین سوالاتی که توانایی شما را در کدنویسی ارزیابی میکند که معمولا این کدها را باید بر روی تخته وایت بردی که در اختیار شما قرار می گیرد، بنویسید

۹- نفرین بعدیت چیست؟

۱۰- چرا خطای کمترین مربعات همیشه متریک مناسبی برای ارزیابی خطا نیست؟ چه متریک دیگری را پیشنهاد می کنید؟

۱۱- آیا استفاده از ۵۰ درخت تصمیم کوچک به جای یک درخت تصمیم بزرگ اولویت دارد؟ چرا؟

۱۲- تعامل بین بایاس و واریانس به چه معناست؟






۱۳- منحنی
ROC
چیست؟

۱۴- کدام را ترجیح می دهید؟ داشتن تعداد زیادی جواب منفی کاذب و یا داشتن تعداد زیادی جواب مثبت کاذب؟

۱۵- چرا دسته بندی کننده نایو بیز، الگوریتم مناسبی نیست؟ برای مسئله تشخیص اسپم در ایمیل، چه روشی را برای بهبود نایو بیز پیشنهاد می کنید؟

۱۶ در بعضی مواقع یک سناریو به داوطلب داده می شود و از او خواسته می شود که برای آن سناریو راه حل پیشنهاد کند. به عنوان مثال: مدیر یک موسسه انتشاراتی که پنج مجله در آن به چاپ می رسد از شما ( به عنوان داده کاو) می خواهد روشی ارائه دهید برای طراحی یک سیستم توصیه به خواننده که بر اساس سلیقه خواننده مجله مورد علاقه اش را به او پیشنهاد می کند.




الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
👍18🙏32