هوش مصنوعی و علم داده به فارسی
6.08K subscribers
981 photos
266 videos
317 files
1.06K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
توسعه چت‌بات از داده‌های شخصی با استفاده از LangChain


https://learn.deeplearning.ai/langchain-chat-with-your-data


📊 @DataPlusScience | @DataScience
Forwarded from TechTube 𝕏 تک توب
موسسه نواوری تکنولوژی کشور امارات نسخه جدیدی از مدل زبانی بزرگ Falcon رو عرضه کرده که 180 میلیارد پارامتر داره و در تستها نه تنها از مدل متن باز LLaMA 2 متا بهتر عمل کرده بلکه از مدلهای متن بسته مثل PaLM گوگل (که نسخه اول بارد از اون استفاده میکرد) و نسخه کوچک و متوسط PaLM 2 عملکرد بهتری داره و فقط پشت مدلهایی مثل نسخه جدید بارد و GPT-4 قرار میگیره.

این مدل به صورت متن باز عرضه شده و شرکتها میتونن اون روی سخت افزار خودشون اجرا کنن یا تمرین بدن ولی به دلیل بزرگ بودن نیاز به حداقل 8 کارت گرافیک A100 40GB برای اجرای اون دارن.

این مدل رو میتونید از اینجا به صورت انلاین و رایگان ازمایش کنید.

🔎 Huggingface.co

📍 @TechTube
@DataPlusScience_NLP Transformers.pdf
6.1 MB
مدل‌های ترنسفورمری چطور کار کرده و در مدل‌های بزرگ زبانی استفاده می‌شوند؟

How is the transformer work, and how is it used in many large language models?


📊 @DataPlusScience | @DataScience
@DataPlusScience_Handwritten Machine Learning Notes..pdf
66 MB
Handwritten Machine Learning Notes

جزوه دست‌نویس و مفصل یادگیری ماشین


📊 @DataPlusScience | @DataScience
Scope of AI, Deep Learning, and Machine Learning


📊 @DataPlusScience | @DataScience
@DataPlusScience _large language models.pdf
5.2 MB
داکیومنتی عالی برای آشنایی با مفاهیم مدل‌های بزرگ زبانی (LLM)



📊 @DataPlusScience | @DataScience
@DataPlusScience_ Machine Learning Cheatsheets.pdf
8.1 MB
Machine Learning Cheatsheets

مجموعه ای ارزشمند از خلاصه‌برگ‌های یادگیری ماشین مشتمل بر:
🌟 NumPy Basics
🐼 pandas
🔧 Data Wrangling with pandas
📊 Data Visualization with ggplot2
🌊 Seaborn
📈 Matplotlib
🤖 TensorFlow
🔬 Scikit-Learn
🔬 SciPy
🚀 PySpark
🤖 Keras
🧠 neural network

📊 @DataPlusScience | @DataScience
📙 #کتاب_فارسی

یادگیری عمیق: از اصول اولیه تا ساخت شبکه‌های عصبی عمیق با پایتون

📝 نگارنده: میلاد وزان

📖 سرفصل‌ها:
- مقدمه‌ای بر یادگیری عمیق
- شبکه‌های عصبی پیش‌خور
- شبکه‌های عصبی کانولوشنی
- شبکه‌های عصبی بازگشتی
- شبکه متخاصم مولد

🆓 این کتاب به رایگان و توسط نگارنده منتشر شده است.

📊 @DataPlusScience | @DataScience
📘📈 Effective Pandas | Matt Harrison

کتاب Effective Pandas بدون شک یکی از بهترین منابع برای یادگیری کتابخانه Pandas است. 🙌

مطالعه و تمرین این کتاب را به همه دوستانی که می‌خواهند مهارت پانداز را کسب کنند توصیه می کنیم. 🔝


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📝💼 Business Analysis cheat sheet

خلاصه برگ 14 صفحه ای بسیار کاربردی تحلیلگری کسب‌و‌کار


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🎁 جزوه دست‌نویس داده کاوی و یادگیری ماشین مقدماتی جناب دکتر کاویانی



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📌 ChatGPT cheat sheet for Data Science | Data Camp

📚 راهنمای استفاده از ChatGPT در علوم داده
👨‍🏫 کاری از Data Camp



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📚 The Ultimate Guide to Machine Learning Job Interviews | Springboard

💡 کتابچه بی‌نظیر مجموعه پرسش و پاسخ یادگیری ماشین برای آمادگی مصاحبه‌های تخصصی | ۱۲۱ صفحه



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📊 Machine Learning Model Metrics (Classification Metrics)

💡 این جزوه مفید به توضیح مختصر دوازده شاخص انتخاب بهترین الگوریتم‌های طبقه‌بندی می‌پردازد.

🔍 الگوریتم‌های مورد اشاره در این جزوه عبارتند از:
- Accuracy
- Precision
- Recall (Sensitivity or True Positive Rate)
- F1-Score
- ROC-AUC
- PR-AUC
- Confusion Matrix
- False Positive Rate (FPR)
- True Negative Rate (TNR) or Specificity
- Matthews Correlation Coefficient (MCC)
- Log Loss (Cross-Entropy Loss)
- Cohen's Kappa


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
هزار؛ کتابخانه جامع هوش مصنوعی برای زبان فارسی شامل مدل‌های مختلف برای پردازش متن، صوت، تصویر و …

هرچند این عنوانِ خلاصه‌ای برای این پروژه‌ست؛ اگر بخوایم دقیق‌تر توصیف کنیم «هزار» یک کتابخونه و فریموورک برای دموکراتیزه کردن تمام کارهای خفن هوش مصنوعی اعم از مدل، دیتاست، تکنیک‌های پیش‌پردازش و آموزش مدل و … هست که یا قبلا توسط افرادی توی کامیونیتی فارسی انجام شده یا در آینده توسط این کامیونیتی (و به ویژه تیم هزار) انجام می‌شه.
در حال حاضر ما توی این پروژه، بیست‌واندی مدل برای کاربردهای مختلفی از جمله speech recognition، OCR، image captioning، masked language modeling، text generation، word embedding و … آموزش دادیم (یا از مدل‌های آموزش داده شده قبلی استفاده کردیم)
بعضی از مدلامون در نوع خودشون نوین هستند و تا قبل از این مشابه‌شون به شکل عمومی منتشر نشده (مثل مدل‌هایی که برای image captioning و ocr و speech recognition زدیم) و خب این تازه اول راهمونه و برنامه‌های جدی برای آموزش مدل‌های خیلی خفن‌تر در آینده داریم...
توصیه می‌کنم حتما به گیت‌هاب پروژه سر بزنید:

zaya.io/vi76p
منبع
📝 SQL Basics Cheat Sheet

📝 خلاصه برگ دستورات پایه‌ای SQL



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍1
🌟 یکی از کاربران لینکدین 60 سوال علم داده‌ای از ChatGPT پرسیده که توی این فایل میتونید پرسش‌ها، پاسخ‌ها و #کدهایی که ChatGPT نوشته رو ببینید.




برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📝 Top 50 Python Interview QNA

در این جزوه به ۵۰ سوال پرکاربرد در مصاحبه‌های پایتون پاسخ‌ داده شده است.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience