💠 "رویداد استارتاپی متاورس"
💢 مراکز آموزش علمی - کاربردی جهاددانشگاهی کرج، خانه کارگر ساوجبلاغ با همکاری سازمان فرهنگی، اجتماعی و ورزشی شهرداری فردیس و پارک علم و فناوری البرز برگزار می کند.
"ویژه دانشجویان، مدرسان، کارکنان و علاقه مندان به حوزه فناوری اطلاعات"
🔖 محورهای رویداد:
1. بلاک چین
2.شهر هوشمند
3.مدیریت پسماند
4. جذب مشتری در علم داده
5.فناوری نوین معماری و شهرسازی
🏆 معرفی ایده های برتر به صنایع مرتبط و اهداء جوایز نفیس به ایده های برتر
🗓 مهلت ارسال ایده: 22 اردیبهشت ماه 1402
⏰ تاریخ برگزاری: 22 تیرماه 1402
✍ ثبت نام از طریق:
http://jalborz.ir/fa/news/52629
🟧 دانشگاه جهاد دانشگاهی کرج
🔲 دورههای هنر • it • مدیریت • زبان • حقوق
سایت | تلگرام | اینستاگرام 🔹🔶
💢 مراکز آموزش علمی - کاربردی جهاددانشگاهی کرج، خانه کارگر ساوجبلاغ با همکاری سازمان فرهنگی، اجتماعی و ورزشی شهرداری فردیس و پارک علم و فناوری البرز برگزار می کند.
"ویژه دانشجویان، مدرسان، کارکنان و علاقه مندان به حوزه فناوری اطلاعات"
🔖 محورهای رویداد:
1. بلاک چین
2.شهر هوشمند
4. جذب مشتری در علم داده
5.فناوری نوین معماری و شهرسازی
🏆 معرفی ایده های برتر به صنایع مرتبط و اهداء جوایز نفیس به ایده های برتر
🗓 مهلت ارسال ایده: 22 اردیبهشت ماه 1402
⏰ تاریخ برگزاری: 22 تیرماه 1402
✍ ثبت نام از طریق:
http://jalborz.ir/fa/news/52629
🟧 دانشگاه جهاد دانشگاهی کرج
🔲 دورههای هنر • it • مدیریت • زبان • حقوق
سایت | تلگرام | اینستاگرام 🔹🔶
🔥1
«🤖ترانسفورمر» یک مدل یادگیری عمیق است که مکانیسم توجه به خود، بهطور متفاوتی اهمیت هر بخش از دادههای ورودی را وزن میکند. عمدتاً در زمینههای پردازش زبان طبیعی (NLP) و بینایی رایانه ای (CV) استفاده میشود.
✅مانند شبکه عصبی بازگشتی (RNN)، ترانسفورمرها برای مدیریت دادههای ورودی متوالی، مانند زبان طبیعی، برای کارهایی مانند ترجمه و خلاصه متن طراحی شدهاند. با این حال، برخلاف شبکه عصبی بازگشتیها، ترانسفورمرها لزوماً دادهها را به ترتیب پردازش نمیکنند. در عوض، مکانیسم توجه زمینه را برای هر موقعیتی در دنباله ورودی فراهم میکند. به عنوان مثال، اگر داده ورودی یک جمله زبان طبیعی باشد، ترانسفورمر نیازی به پردازش ابتدای جمله قبل از پایان ندارد.
📚این ویژگی اجازه میدهد تا موازی سازی بیشتر از شبکه عصبی بازگشتیها باشد و بنابراین زمان آموزش را کاهش میدهد.
دادههای بزرگتر از زمانی که ممکن بود را میدهد. این منجر به توسعه سیستمهای از پیش آموزش دیده مانند مدل Bert و
GPT( Generative Pre-trained Transformer)
شده است.
آموزش ترانسفورمرها
در کانال یوتیوب
mina rabti
https://m.youtube.com/channel/UCvxKAC5IdZp6U_75sre0CEw
✅مانند شبکه عصبی بازگشتی (RNN)، ترانسفورمرها برای مدیریت دادههای ورودی متوالی، مانند زبان طبیعی، برای کارهایی مانند ترجمه و خلاصه متن طراحی شدهاند. با این حال، برخلاف شبکه عصبی بازگشتیها، ترانسفورمرها لزوماً دادهها را به ترتیب پردازش نمیکنند. در عوض، مکانیسم توجه زمینه را برای هر موقعیتی در دنباله ورودی فراهم میکند. به عنوان مثال، اگر داده ورودی یک جمله زبان طبیعی باشد، ترانسفورمر نیازی به پردازش ابتدای جمله قبل از پایان ندارد.
📚این ویژگی اجازه میدهد تا موازی سازی بیشتر از شبکه عصبی بازگشتیها باشد و بنابراین زمان آموزش را کاهش میدهد.
دادههای بزرگتر از زمانی که ممکن بود را میدهد. این منجر به توسعه سیستمهای از پیش آموزش دیده مانند مدل Bert و
GPT( Generative Pre-trained Transformer)
شده است.
آموزش ترانسفورمرها
در کانال یوتیوب
mina rabti
https://m.youtube.com/channel/UCvxKAC5IdZp6U_75sre0CEw
👍7🔥6🙏3❤2
کورس Data Visualization لینکدین:
linkedin.com/learning/data-visualization-a-lesson-and-listen-series
این آقای Bill Shander توی این کورس یه مصاحبه داشته با Nadieh Bremer،
که ایشون توی Pinterest یه عالمه تصویر ذخیره کرده برای ایده و الهام گرفتن
اگه به دیتا ویژوالیزیشن علاقه دارین
خوبه که یه نگاهی بندازین بهش:
https://www.pinterest.com/nadiehbremer
درضمن بخش Blog پورتفولیوی این خانم هم کلی مطلب آموزشی خوب داره:
https://www.visualcinnamon.com/blog
linkedin.com/learning/data-visualization-a-lesson-and-listen-series
این آقای Bill Shander توی این کورس یه مصاحبه داشته با Nadieh Bremer،
که ایشون توی Pinterest یه عالمه تصویر ذخیره کرده برای ایده و الهام گرفتن
اگه به دیتا ویژوالیزیشن علاقه دارین
خوبه که یه نگاهی بندازین بهش:
https://www.pinterest.com/nadiehbremer
درضمن بخش Blog پورتفولیوی این خانم هم کلی مطلب آموزشی خوب داره:
https://www.visualcinnamon.com/blog
LinkedIn
Data Visualization: A Lesson and Listen Series Online Class | LinkedIn Learning, formerly Lynda.com
Learn about key themes in data visualization, data storytelling, and information design, and listen to interviews with leading designers and data visualization experts.
❤7👍3
این لینک ویدیو در یوتیوب به شما در استخدام و جذب پروژه به صورت ریموت با درآمد دلاری خیلی کمک میکند.
https://m.youtube.com/watch?v=jQLC8p86vz8&t=1240s
@datalook_ir
https://m.youtube.com/watch?v=jQLC8p86vz8&t=1240s
@datalook_ir
YouTube
مصاحبه با راضیه درباره فرصت کاری ریموت - به عنوان برنامه نویس- لیتوانی
سلام
توی این ویدیو از راضیه درباره تمام مراحل کارش توی لیتوانی به عنوان برنامه نویس ریموت سوال پرسیدم
ممنون ازش بابت این گپ دوستانه و ممنون از شما بابت تماشای این مصاحبه
اگر سوالی بود میتونید تو کامنت ها بپرسید خودش میاد جواب میده :))
توی این ویدیو از راضیه درباره تمام مراحل کارش توی لیتوانی به عنوان برنامه نویس ریموت سوال پرسیدم
ممنون ازش بابت این گپ دوستانه و ممنون از شما بابت تماشای این مصاحبه
اگر سوالی بود میتونید تو کامنت ها بپرسید خودش میاد جواب میده :))
🙏5👍3
Forwarded from Data world with Mina (Mina Ra)
کتابخانه Dask
- اگر با دیتاست حجیمی روبرو هستید که حافظه اصلی (RAM) کامپیوتر شما گنجایش نگهداری آن برای پردازش را ندارد…
- اگر در حال توسعه سیستم نرمافزاری و یا یک پایپلاین ETL هستید که کوئری سنگینی را به دیتابیس میزند و مدت زیادی طول میکشد (long-run query) یا دیتابیس عملیاتی شما را با اختلال مواجه میکند…
- اگر قرار است یک پردازش سنگین مثل تحلیل اکتشافی دادهها (EDA) بر روی حجم بالایی از کلاندادهها داشته باشید که بدون پردازش موازی امکانپذیر به نظر نمیآید…
احتمالا شما نیاز به یک ابزار مناسب برای پردازش موازی، توزیع شده و مقیاسپذیر دارید. ابزارهایی مثل Apache Spark و Hadoop مبتنی بر اکوسیستم Java اند و احتمالا به همین دلیل مورد علاقه خیلی از Data Scientist ها و Data Analyst ها نیستند. در مقابل Dask کاملا بر اکوسیستم Python سوار است و به Data Scientist ها و Data Analyst ها اجازه میدهد ابزارهای روزمره خود مثل Numpy و Pandas و Scikit-learn و XGBoost و TensorFlow رو به صورت توزیع شده، موازی و مقیاس پذیر به کار گیرند.
الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
- اگر با دیتاست حجیمی روبرو هستید که حافظه اصلی (RAM) کامپیوتر شما گنجایش نگهداری آن برای پردازش را ندارد…
- اگر در حال توسعه سیستم نرمافزاری و یا یک پایپلاین ETL هستید که کوئری سنگینی را به دیتابیس میزند و مدت زیادی طول میکشد (long-run query) یا دیتابیس عملیاتی شما را با اختلال مواجه میکند…
- اگر قرار است یک پردازش سنگین مثل تحلیل اکتشافی دادهها (EDA) بر روی حجم بالایی از کلاندادهها داشته باشید که بدون پردازش موازی امکانپذیر به نظر نمیآید…
احتمالا شما نیاز به یک ابزار مناسب برای پردازش موازی، توزیع شده و مقیاسپذیر دارید. ابزارهایی مثل Apache Spark و Hadoop مبتنی بر اکوسیستم Java اند و احتمالا به همین دلیل مورد علاقه خیلی از Data Scientist ها و Data Analyst ها نیستند. در مقابل Dask کاملا بر اکوسیستم Python سوار است و به Data Scientist ها و Data Analyst ها اجازه میدهد ابزارهای روزمره خود مثل Numpy و Pandas و Scikit-learn و XGBoost و TensorFlow رو به صورت توزیع شده، موازی و مقیاس پذیر به کار گیرند.
الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
🙏7👍3👏1
Forwarded from Data world with Mina (Mina Ra)
برای کار به عنوان داده کاو یا دانشمند داده در یک شرکت، باید مصاحبه فنی مربوطه را با موفقیت پشت سر گذاشت. اما چه سوالهایی معمولا برای این مصاحبه پرسیده می شوند؟ چند نمونه از این سوالات را که خودم در مصاحبه ها با آنها مواجه شده ام را در اینجا مطرح می کنم. با توجه به اینکه سابقه کار در این زمینه را در ایران ندارم، لذا سوالات مربوطه از مصاحبه های فنی موسسات و شرکتهای واقع در خارج از ایران نظیر IBM, ANZ bank, Sportsbet, iSelect
می باشد.
(صحبت های یک دیتا ساینتیست در خارج ایران)
۱- تعریف و توضیح در مورد
P-value
۲- رگولاریزاسیون چیست و برای حل چه مشکلی استفاده میشود؟ تفاوت بین نرم L1 و L2 چیست؟
۳- تبدیل Box-Cox چیست؟
۴- توضیح در مورد MultiCollinearity
و چگونگی حل آن؟
۵- آیا الگوریتم Gradient descent همیشه به نقطه یکسانی همگرا میشود؟
۶- چگونه در الگوریتم K-means تعداد کلاسترهای بهینه را می توان مشخص کرد؟
۷- بردار ویژه و مقدار ویژه چیست؟
۸- با چه کتابخانه های داده کاوی از زبان پایتون آشنایی دارید؟ همچنین سوالاتی که توانایی شما را در کدنویسی ارزیابی میکند که معمولا این کدها را باید بر روی تخته وایت بردی که در اختیار شما قرار می گیرد، بنویسید
۹- نفرین بعدیت چیست؟
۱۰- چرا خطای کمترین مربعات همیشه متریک مناسبی برای ارزیابی خطا نیست؟ چه متریک دیگری را پیشنهاد می کنید؟
۱۱- آیا استفاده از ۵۰ درخت تصمیم کوچک به جای یک درخت تصمیم بزرگ اولویت دارد؟ چرا؟
۱۲- تعامل بین بایاس و واریانس به چه معناست؟
۱۳- منحنی
ROC
چیست؟
۱۴- کدام را ترجیح می دهید؟ داشتن تعداد زیادی جواب منفی کاذب و یا داشتن تعداد زیادی جواب مثبت کاذب؟
۱۵- چرا دسته بندی کننده نایو بیز، الگوریتم مناسبی نیست؟ برای مسئله تشخیص اسپم در ایمیل، چه روشی را برای بهبود نایو بیز پیشنهاد می کنید؟
۱۶ در بعضی مواقع یک سناریو به داوطلب داده می شود و از او خواسته می شود که برای آن سناریو راه حل پیشنهاد کند. به عنوان مثال: مدیر یک موسسه انتشاراتی که پنج مجله در آن به چاپ می رسد از شما ( به عنوان داده کاو) می خواهد روشی ارائه دهید برای طراحی یک سیستم توصیه به خواننده که بر اساس سلیقه خواننده مجله مورد علاقه اش را به او پیشنهاد می کند.
الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
می باشد.
(صحبت های یک دیتا ساینتیست در خارج ایران)
۱- تعریف و توضیح در مورد
P-value
۲- رگولاریزاسیون چیست و برای حل چه مشکلی استفاده میشود؟ تفاوت بین نرم L1 و L2 چیست؟
۳- تبدیل Box-Cox چیست؟
۴- توضیح در مورد MultiCollinearity
و چگونگی حل آن؟
۵- آیا الگوریتم Gradient descent همیشه به نقطه یکسانی همگرا میشود؟
۶- چگونه در الگوریتم K-means تعداد کلاسترهای بهینه را می توان مشخص کرد؟
۷- بردار ویژه و مقدار ویژه چیست؟
۸- با چه کتابخانه های داده کاوی از زبان پایتون آشنایی دارید؟ همچنین سوالاتی که توانایی شما را در کدنویسی ارزیابی میکند که معمولا این کدها را باید بر روی تخته وایت بردی که در اختیار شما قرار می گیرد، بنویسید
۹- نفرین بعدیت چیست؟
۱۰- چرا خطای کمترین مربعات همیشه متریک مناسبی برای ارزیابی خطا نیست؟ چه متریک دیگری را پیشنهاد می کنید؟
۱۱- آیا استفاده از ۵۰ درخت تصمیم کوچک به جای یک درخت تصمیم بزرگ اولویت دارد؟ چرا؟
۱۲- تعامل بین بایاس و واریانس به چه معناست؟
۱۳- منحنی
ROC
چیست؟
۱۴- کدام را ترجیح می دهید؟ داشتن تعداد زیادی جواب منفی کاذب و یا داشتن تعداد زیادی جواب مثبت کاذب؟
۱۵- چرا دسته بندی کننده نایو بیز، الگوریتم مناسبی نیست؟ برای مسئله تشخیص اسپم در ایمیل، چه روشی را برای بهبود نایو بیز پیشنهاد می کنید؟
۱۶ در بعضی مواقع یک سناریو به داوطلب داده می شود و از او خواسته می شود که برای آن سناریو راه حل پیشنهاد کند. به عنوان مثال: مدیر یک موسسه انتشاراتی که پنج مجله در آن به چاپ می رسد از شما ( به عنوان داده کاو) می خواهد روشی ارائه دهید برای طراحی یک سیستم توصیه به خواننده که بر اساس سلیقه خواننده مجله مورد علاقه اش را به او پیشنهاد می کند.
الگوریتم های #یادگیری_ماشین
#مصاحبه_علم_داده
#علم_داده
@datalook_ir
منبع مطالب رایگان علم داده، کتاب ، نمونه کد
فیلم آموزشی
کارگاه و وبینار رایگان
👍18🙏3❤2
نمونه سوالات مصاحبه کارشناس یادگیری ماشین
با پاسخ
Date - 24-04-2023
Company name: Elica
Role: ML Engineer
Topic: PCA, SGD, decision tree, ARM
1. What is the difference between stochastic gradient descent (SGD) and gradient descent (GD)?
Gradient Descent and Stochastic Gradient Descent are the algorithms that find the set of parameters that will minimize a loss function.
The difference is that in Gradient Descent, all training samples are evaluated for each set of parameters. While in Stochastic Gradient Descent only one training sample is evaluated for the set of parameters identified.
2. Can you mention some advantages and disadvantages of decision trees?
The advantages of decision trees are that they are easier to interpret, are nonparametric and hence robust to outliers, and have relatively few parameters to tune.
On the other hand, the disadvantage is that they are prone to overfitting.
3. What do you mean by Associative Rule Mining (ARM)?
Associative Rule Mining is one of the techniques to discover patterns in data like features (dimensions) which occur together and features (dimensions) which are correlated. It is mostly used in Market-based Analysis to find how frequently an itemset occurs in a transaction. Association rules have to satisfy minimum support and minimum confidence at the very same time.
4. What is the Principle Component Analysis?
The idea here is to reduce the dimensionality of the data set by reducing the number of variables that are correlated with each other. Although the variation needs to be retained to the maximum extent.
The variables are transformed into a new set of variables that are known as Principal Components’. These PCs are the eigenvectors of a covariance matrix and therefore are orthogonal.
مینا ربطی
@datalook_ir
با پاسخ
Date - 24-04-2023
Company name: Elica
Role: ML Engineer
Topic: PCA, SGD, decision tree, ARM
1. What is the difference between stochastic gradient descent (SGD) and gradient descent (GD)?
Gradient Descent and Stochastic Gradient Descent are the algorithms that find the set of parameters that will minimize a loss function.
The difference is that in Gradient Descent, all training samples are evaluated for each set of parameters. While in Stochastic Gradient Descent only one training sample is evaluated for the set of parameters identified.
2. Can you mention some advantages and disadvantages of decision trees?
The advantages of decision trees are that they are easier to interpret, are nonparametric and hence robust to outliers, and have relatively few parameters to tune.
On the other hand, the disadvantage is that they are prone to overfitting.
3. What do you mean by Associative Rule Mining (ARM)?
Associative Rule Mining is one of the techniques to discover patterns in data like features (dimensions) which occur together and features (dimensions) which are correlated. It is mostly used in Market-based Analysis to find how frequently an itemset occurs in a transaction. Association rules have to satisfy minimum support and minimum confidence at the very same time.
4. What is the Principle Component Analysis?
The idea here is to reduce the dimensionality of the data set by reducing the number of variables that are correlated with each other. Although the variation needs to be retained to the maximum extent.
The variables are transformed into a new set of variables that are known as Principal Components’. These PCs are the eigenvectors of a covariance matrix and therefore are orthogonal.
Happy Learning💙مینا ربطی
@datalook_ir
👏7🙏3
Date: 26-04-2023
Company name: Numerator
Role: Data Scientist
Topic : RNN, pop & remove, calculated field, views
1. What are the uses of using RNN in NLP?
The RNN is a stateful neural network, which means that it not only retains information from the previous layer but also from the previous pass. Thus, this neuron is said to have connections between passes, and through time.
For the RNN the order of the input matters due to being stateful. The same words with different orders will yield different outputs.
RNN can be used for unsegmented, connected applications such as handwriting recognition or speech recognition.
2. How to remove values to a python array?
Ans: Array elements can be removed using pop() or remove() method. The difference between these two functions is that the former returns the deleted value whereas the latter does not.
3. What are the advantages and disadvantages of views in the database?
Answer: Advantages of Views:
As there is no physical location where the data in the view is stored, it generates output without wasting resources.
Data access is restricted as it does not allow commands like insertion, updation, and deletion.
Disadvantages of Views:
The view becomes irrelevant if we drop a table related to that view.
Much memory space is occupied when the view is created for large tables.
4. How to create a calculated field in Tableau?
Click the drop down to the right of Dimensions on the Data pane and select “Create > Calculated Field” to open the calculation editor.
Name the new field and create a formula.
👉🏻 برای منتورینگ مسیرعلم داده و اطلاع از کلاسهای آموزشی
@minarabti
Company name: Numerator
Role: Data Scientist
Topic : RNN, pop & remove, calculated field, views
1. What are the uses of using RNN in NLP?
The RNN is a stateful neural network, which means that it not only retains information from the previous layer but also from the previous pass. Thus, this neuron is said to have connections between passes, and through time.
For the RNN the order of the input matters due to being stateful. The same words with different orders will yield different outputs.
RNN can be used for unsegmented, connected applications such as handwriting recognition or speech recognition.
2. How to remove values to a python array?
Ans: Array elements can be removed using pop() or remove() method. The difference between these two functions is that the former returns the deleted value whereas the latter does not.
3. What are the advantages and disadvantages of views in the database?
Answer: Advantages of Views:
As there is no physical location where the data in the view is stored, it generates output without wasting resources.
Data access is restricted as it does not allow commands like insertion, updation, and deletion.
Disadvantages of Views:
The view becomes irrelevant if we drop a table related to that view.
Much memory space is occupied when the view is created for large tables.
4. How to create a calculated field in Tableau?
Click the drop down to the right of Dimensions on the Data pane and select “Create > Calculated Field” to open the calculation editor.
Name the new field and create a formula.
👉🏻 برای منتورینگ مسیرعلم داده و اطلاع از کلاسهای آموزشی
@minarabti
👍4❤3🙏3
🚨JOB OPENING ALERT🚨
لینک چند اپلای شغلی لیندکین
Company: Saisystems Technology
Role: Data Scientist
Exp: 0-2 years
Link: APPLY NOW
Company: Aston Carter
Role: Data Analyst
Exp: 0-1 year
Link: APPLY NOW
Company:Litra Venture
Role: Data Analyst
Exp: 0-2 years
Link: APPLY NOW
Company: Premium
Role: Data Analyst
Exp: 0-2 Years
Link: APPLY NOW
Company: NDS Infoserve
Role: Data Scientist
Exp: 0-2 years
Link: APPLY NOW
Company: S & P global inc
Role: Data Analyst
Exp: 0-2 years
Link: APPLY NOW
Company: Savista
Role: Hr Data Analyst
Exp: 0-1 years
Link: APPLY NOW
لینک چند اپلای شغلی لیندکین
Company: Saisystems Technology
Role: Data Scientist
Exp: 0-2 years
Link: APPLY NOW
Company: Aston Carter
Role: Data Analyst
Exp: 0-1 year
Link: APPLY NOW
Company:Litra Venture
Role: Data Analyst
Exp: 0-2 years
Link: APPLY NOW
Company: Premium
Role: Data Analyst
Exp: 0-2 Years
Link: APPLY NOW
Company: NDS Infoserve
Role: Data Scientist
Exp: 0-2 years
Link: APPLY NOW
Company: S & P global inc
Role: Data Analyst
Exp: 0-2 years
Link: APPLY NOW
Company: Savista
Role: Hr Data Analyst
Exp: 0-1 years
Link: APPLY NOW
Naukri.com
Jr. AIML developer - Pune - Saisystems Technology - 0 to 2 years of experience
Job Description for Jr. AIML developer in Saisystems Technology in Pune for 0 to 2 years of experience. Apply Now!
🙏6
تا دیروز ۴ ایرانی از دپارتمان ریاضی محض هاروارد دکترا گرفته بودن. فرشید جمشیدیان (۱۹۸۰)، پیروز وکیلی (۱۹۸۸)، مریم میرزاخانی (۲۰۰۴)، علی اکبر دائمی (۲۰۱۴). دیروز یک اسم به این لیست اضافه شد: تینا ترکمان با موفقیت از تز خود با راهنمایی کورتیس مکمالن، برنده مدال فیلدز، دفاع کرد.
شاید لازم به گفتن نباشه: چنین دستاوردی بسیار دشواره (به طور خاص دپارتمان ریاضی محض ۴-۵ دانشگاه رده اول)، حداقل سختی اش قابل مقایسه اس با برنده شدن مدال المپیک. اما چون ریاضی مهجوره تا کسی جایزه شناخته شده تری مثل فیلدز رو نگیره در فضای عمومی توجه ای به خودش جلب نمی کنه.
باعث افتخاره🤩🤩🤩👏🏻👏🏻👏🏻👏🏻
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
شاید لازم به گفتن نباشه: چنین دستاوردی بسیار دشواره (به طور خاص دپارتمان ریاضی محض ۴-۵ دانشگاه رده اول)، حداقل سختی اش قابل مقایسه اس با برنده شدن مدال المپیک. اما چون ریاضی مهجوره تا کسی جایزه شناخته شده تری مثل فیلدز رو نگیره در فضای عمومی توجه ای به خودش جلب نمی کنه.
باعث افتخاره🤩🤩🤩👏🏻👏🏻👏🏻👏🏻
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
❤38👍6👏5
نمونه مصاحبه یک شرکت برای شغل
#دیتا_ساینتیست
Date: 28-04-2023
Company name: Infosys
Role: Data Scientist
Topic: LSTM, kmeans, cte, numpy
1. Can you explain how the memory cell in an LSTM is implemented computationally?
The memory cell in an LSTM is implemented as a forget gate, an input gate, and an output gate. The forget gate controls how much information from the previous cell state is forgotten. The input gate controls how much new information from the current input is allowed into the cell state. The output gate controls how much information from the cell state is allowed to pass out to the next cell state.
2. What is CTE in SQL?
A CTE (Common Table Expression) is a one-time result set that only exists for the duration of the query. It allows us to refer to data within a single SELECT, INSERT, UPDATE, DELETE, CREATE VIEW, or MERGE statement's execution scope. It is temporary because its result cannot be stored anywhere and will be lost as soon as a query's execution is completed.
3. List the advantages NumPy Arrays have over Python lists?
Python’s lists, even though hugely efficient containers capable of a number of functions, have several limitations when compared to NumPy arrays. It is not possible to perform vectorised operations which includes element-wise addition and multiplication. They also require that Python store the type information of every element since they support objects of different types. This means a type dispatching code must be executed each time an operation on an element is done.
4. Explain some cases where k-Means clustering fails to give good results
k-means has trouble clustering data where clusters are of various sizes and densities.
Outliers will cause the centroids to be dragged, or the outliers might get their own cluster instead of being ignored. Outliers should be clipped or removed before clustering.
If the number of dimensions increase, a distance-based similarity measure converges to a constant value between any given examples. Dimensions should be reduced before clustering them.
@minarbti
@datalook_ir
#دیتا_ساینتیست
Date: 28-04-2023
Company name: Infosys
Role: Data Scientist
Topic: LSTM, kmeans, cte, numpy
1. Can you explain how the memory cell in an LSTM is implemented computationally?
The memory cell in an LSTM is implemented as a forget gate, an input gate, and an output gate. The forget gate controls how much information from the previous cell state is forgotten. The input gate controls how much new information from the current input is allowed into the cell state. The output gate controls how much information from the cell state is allowed to pass out to the next cell state.
2. What is CTE in SQL?
A CTE (Common Table Expression) is a one-time result set that only exists for the duration of the query. It allows us to refer to data within a single SELECT, INSERT, UPDATE, DELETE, CREATE VIEW, or MERGE statement's execution scope. It is temporary because its result cannot be stored anywhere and will be lost as soon as a query's execution is completed.
3. List the advantages NumPy Arrays have over Python lists?
Python’s lists, even though hugely efficient containers capable of a number of functions, have several limitations when compared to NumPy arrays. It is not possible to perform vectorised operations which includes element-wise addition and multiplication. They also require that Python store the type information of every element since they support objects of different types. This means a type dispatching code must be executed each time an operation on an element is done.
4. Explain some cases where k-Means clustering fails to give good results
k-means has trouble clustering data where clusters are of various sizes and densities.
Outliers will cause the centroids to be dragged, or the outliers might get their own cluster instead of being ignored. Outliers should be clipped or removed before clustering.
If the number of dimensions increase, a distance-based similarity measure converges to a constant value between any given examples. Dimensions should be reduced before clustering them.
@minarbti
@datalook_ir
👍8🙏3❤1
Regularization (ridge, lasso, ElasticNet).pdf
3.1 MB
رگولارازسیون شکلی از رگرسیون است که برآوردهای ضریب به سمت صفر را محدود یا کوچک میکند. به عبارت دیگر، این تکنیک یادگیری یک مدل پیچیدهتر یا انعطافپذیرتر را منع میکند تا از خطر بیش برازش اجتناب شود.
این جزوه خیلی کاربردی و به زبان ساده در خصوص رگولارکردن سه مدل رگرسیون توضیح داده
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
این جزوه خیلی کاربردی و به زبان ساده در خصوص رگولارکردن سه مدل رگرسیون توضیح داده
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
🙏8👍4❤3
Forwarded from Samane Rahmati
📣استخدام در شرکت های بین المللی با درآمد دلاری به صورت دورکاری
👈 میانگین درآمد به صورت دورکاری ساعتی ۴۰ تا ۱۵۰ دلاره (یعنی ساعتی ۲ الی ۸ میلیون تومان)
📆دوشنبه ۱۸ اردیبهشت ساعت ۲۰
✅برای آشنایی بیشتر برای این همکاری کلیک کنید
https://etekanesh.com/7c1v
ارتباط با ما :
🆔@grouplancingcom
👈 میانگین درآمد به صورت دورکاری ساعتی ۴۰ تا ۱۵۰ دلاره (یعنی ساعتی ۲ الی ۸ میلیون تومان)
📆دوشنبه ۱۸ اردیبهشت ساعت ۲۰
✅برای آشنایی بیشتر برای این همکاری کلیک کنید
https://etekanesh.com/7c1v
ارتباط با ما :
🆔@grouplancingcom
NLP with NLTK.pdf
56.5 KB
چیت شیت پردازش متن با Nltk
دستورات مهم
#nlp
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
دستورات مهم
#nlp
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
❤5
❤5👍1
Decision trees: The answer to all your non-linear classification problems.😂😂😂😂
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
منبع مطالب دیتاساینس، یادگیری ماشین و یادگیری عمیق
@datalook_ir
@minarabti
👏2
Forwarded from SiaExplains
🏁 اگه دنبال گرفتن جاب آفر (ویزا اسپانسرشیپ) از این کشورها هستید این ویدیو رو ببینید:
اتریش٬ انگلیس٬ فنلاند٬ فرانسه٬ آلمان٬ ایرلند٬ ایتالیا٬ هلند٬ نیوزلند٬ نوروژ٬ اسپانیا و سوید.
https://www.youtube.com/watch?v=A-qS1cx8bfk
آدرس اصلی کانال:
🎯 @FollowThePathWithUs
اتریش٬ انگلیس٬ فنلاند٬ فرانسه٬ آلمان٬ ایرلند٬ ایتالیا٬ هلند٬ نیوزلند٬ نوروژ٬ اسپانیا و سوید.
https://www.youtube.com/watch?v=A-qS1cx8bfk
آدرس اصلی کانال:
🎯 @FollowThePathWithUs
YouTube
لیست شرکت هایی که جاب آفر میدن
لیست شرکت هایی که جاب آفر میدن در کشورهایی مثل:
آلمان٬ اتریش٬ انگلیس٬ فنلاند٬ ایتالیا٬ هلند٬ نوروژ٬ نیوزلند٬سوید و اسپانیا و ... رو براتون گذاشتیم توی گیت هاب و به کمک دوستان داریم این لیست رو تکمیل تر میکنیم تا کمکی باشه برای بچه هایی که میخوان مهاجرت یا…
آلمان٬ اتریش٬ انگلیس٬ فنلاند٬ ایتالیا٬ هلند٬ نوروژ٬ نیوزلند٬سوید و اسپانیا و ... رو براتون گذاشتیم توی گیت هاب و به کمک دوستان داریم این لیست رو تکمیل تر میکنیم تا کمکی باشه برای بچه هایی که میخوان مهاجرت یا…
👍8👏1
کدام یک از تکنیک های زیر برای حل مشکل رده نامتوزان در داده ها imbalancedبه کار گرفته می شود.
Anonymous Poll
4%
costSensitive methods
30%
oversampling with Smote
12%
outlier detection on majorityClass
53%
All of above