هوش مصنوعی و علم داده به فارسی
6.08K subscribers
975 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
@DataPlusScience__Intro to RAG .pdf
45.7 MB
📚 مقدمه‌ای بر RAG

🔗 این کتابچه شما را با مفاهیم پایه‌ای و کاربردهای RAG (Retrieval-Augmented Generation) آشنا می‌کند، که یکی از تکنیک‌های جدید و موثر در حوزه مدل‌های زبانی بزرگ (LLMs) است. این راهنما به شما کمک می‌کند تا بفهمید چگونه می‌توان از RAG برای افزایش دقت و قابلیت‌های مدل‌های زبانی استفاده کرد.

📋 سرفصل‌های مهم شامل:

🔄 تعریف RAG (What is RAG)
🤖 کاربردها و موارد استفاده (Use Cases)
🛠 معماری RAG (RAG Architecture)
📈 مقایسه RAG با فاین‌تیونینگ (RAG vs Fine-tuning)
🌐 آموزش RAG چندوجهی (Multimodal RAG)

📚 #علم_داده #هوش_مصنوعی #مدل_زبانی_بزرگ #RAG



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience #دیتا‌پلاس‌ساینس
👍4🔥1🙏1
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)

💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد.

📄 محتوای فایل:

استخراج متن از PDF با استفاده از PyMuPDF
تقسیم‌بندی متن به قطعات کوچکتر (Chunking)
روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبه‌بندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API

🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند.


📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
6👍2🔥1
@DataPlusScience__Introduction to RAG.pdf
560.6 KB
📑 مقدمه‌ای بر RAG و کاربردهای آن

💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) می‌پردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدل‌های LLM (Large Language Models) توضیح می‌دهد.

📄 ساختار کلی:

محدودیت‌های LLM: چالش‌های مدل‌های زبان بزرگ، مانند توهمات (Hallucinations) و عدم به‌روزرسانی به‌موقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطاف‌پذیری، و امکان استفاده از داده‌های خارجی.
کاربردها: چت‌بات‌ها (Chatbots)، پاسخ‌دهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.


📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🔥1
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)

💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد.

📄 محتوای فایل:

استخراج متن از PDF با استفاده از PyMuPDF
تقسیم‌بندی متن به قطعات کوچکتر (Chunking)
روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبه‌بندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API

🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند.


📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍4🔥21
Transformers & LLMs Cheatsheet.pdf
1.4 MB
🚀 راهنمای جامع مدل‌های زبانی بزرگ (LLM)
‏این راهنما مفاهیم اصلی، معماری‌ها و کاربردهای عملی مدل‌های زبانی بزرگ (LLM) را پوشش می‌دهد.
💡 مفاهیم پایه شامل توکن‌ها (tokenization, BPE)، امبدینگ‌ها (embeddings) و مکانیزم توجه (Attention mechanism, Multi-Head Attention) هستند.
🗼 معماری ترنسفورمر (Transformer) و انواع آن مانند BERT (فقط انکودر)، GPT (فقط دیکودر) و T5 (انکودر-دیکودر) بررسی شده‌اند.
⚙️ در بخش مدل‌های زبانی بزرگ، تکنیک‌های Prompting (context length, Chain-of-Thought)، پیش‌آموزش (Pre-training, SFT, PEFT/LoRA)، تنظیم بر اساس ترجیحات (Preference tuning, Reward Model, Reinforcement Learning) و بهینه‌سازی‌ها (Optimizations, Mixture of Experts, Distillation, Quantization) توضیح داده شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #RAG