@DataPlusScience__Intro to RAG .pdf
45.7 MB
📚 مقدمهای بر RAG
🔗 این کتابچه شما را با مفاهیم پایهای و کاربردهای RAG (Retrieval-Augmented Generation) آشنا میکند، که یکی از تکنیکهای جدید و موثر در حوزه مدلهای زبانی بزرگ (LLMs) است. این راهنما به شما کمک میکند تا بفهمید چگونه میتوان از RAG برای افزایش دقت و قابلیتهای مدلهای زبانی استفاده کرد.
📋 سرفصلهای مهم شامل:
🔄 تعریف RAG (What is RAG)
🤖 کاربردها و موارد استفاده (Use Cases)
🛠 معماری RAG (RAG Architecture)
📈 مقایسه RAG با فاینتیونینگ (RAG vs Fine-tuning)
🌐 آموزش RAG چندوجهی (Multimodal RAG)
📚 #علم_داده #هوش_مصنوعی #مدل_زبانی_بزرگ #RAG
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science #دیتاپلاسساینس
🔗 این کتابچه شما را با مفاهیم پایهای و کاربردهای RAG (Retrieval-Augmented Generation) آشنا میکند، که یکی از تکنیکهای جدید و موثر در حوزه مدلهای زبانی بزرگ (LLMs) است. این راهنما به شما کمک میکند تا بفهمید چگونه میتوان از RAG برای افزایش دقت و قابلیتهای مدلهای زبانی استفاده کرد.
📋 سرفصلهای مهم شامل:
🔄 تعریف RAG (What is RAG)
🤖 کاربردها و موارد استفاده (Use Cases)
🛠 معماری RAG (RAG Architecture)
📈 مقایسه RAG با فاینتیونینگ (RAG vs Fine-tuning)
🌐 آموزش RAG چندوجهی (Multimodal RAG)
📚 #علم_داده #هوش_مصنوعی #مدل_زبانی_بزرگ #RAG
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science #دیتاپلاسساینس
👍4🔥1🙏1
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)
💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیمبندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح میدهد.
📄 محتوای فایل:
استخراج متن از PDF با استفاده از PyMuPDF
تقسیمبندی متن به قطعات کوچکتر (Chunking)
روشهای بازیابی اطلاعات: جستجوی کلیدواژهای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبهبندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API
🔬 این فایل همچنین محدودیتهای سیستم RAG پایه را نشان میدهد و زمینه را برای بحث در مورد تکنیکهای پیشرفتهتر در فصلهای بعدی فراهم میکند.
📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیمبندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح میدهد.
📄 محتوای فایل:
استخراج متن از PDF با استفاده از PyMuPDF
تقسیمبندی متن به قطعات کوچکتر (Chunking)
روشهای بازیابی اطلاعات: جستجوی کلیدواژهای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبهبندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API
🔬 این فایل همچنین محدودیتهای سیستم RAG پایه را نشان میدهد و زمینه را برای بحث در مورد تکنیکهای پیشرفتهتر در فصلهای بعدی فراهم میکند.
📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
❤6👍2🔥1
@DataPlusScience__Introduction to RAG.pdf
560.6 KB
📑 مقدمهای بر RAG و کاربردهای آن
💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) میپردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدلهای LLM (Large Language Models) توضیح میدهد.
📄 ساختار کلی:
محدودیتهای LLM: چالشهای مدلهای زبان بزرگ، مانند توهمات (Hallucinations) و عدم بهروزرسانی بهموقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطافپذیری، و امکان استفاده از دادههای خارجی.
کاربردها: چتباتها (Chatbots)، پاسخدهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.
📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) میپردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدلهای LLM (Large Language Models) توضیح میدهد.
📄 ساختار کلی:
محدودیتهای LLM: چالشهای مدلهای زبان بزرگ، مانند توهمات (Hallucinations) و عدم بهروزرسانی بهموقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطافپذیری، و امکان استفاده از دادههای خارجی.
کاربردها: چتباتها (Chatbots)، پاسخدهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.
📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🔥1
Forwarded from هوش مصنوعی و علم داده به فارسی
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)
💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیمبندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح میدهد.
📄 محتوای فایل:
استخراج متن از PDF با استفاده از PyMuPDF
تقسیمبندی متن به قطعات کوچکتر (Chunking)
روشهای بازیابی اطلاعات: جستجوی کلیدواژهای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبهبندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API
🔬 این فایل همچنین محدودیتهای سیستم RAG پایه را نشان میدهد و زمینه را برای بحث در مورد تکنیکهای پیشرفتهتر در فصلهای بعدی فراهم میکند.
📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیمبندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح میدهد.
📄 محتوای فایل:
استخراج متن از PDF با استفاده از PyMuPDF
تقسیمبندی متن به قطعات کوچکتر (Chunking)
روشهای بازیابی اطلاعات: جستجوی کلیدواژهای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبهبندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API
🔬 این فایل همچنین محدودیتهای سیستم RAG پایه را نشان میدهد و زمینه را برای بحث در مورد تکنیکهای پیشرفتهتر در فصلهای بعدی فراهم میکند.
📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
👍4🔥2❤1
Transformers & LLMs Cheatsheet.pdf
1.4 MB
🚀 راهنمای جامع مدلهای زبانی بزرگ (LLM)
این راهنما مفاهیم اصلی، معماریها و کاربردهای عملی مدلهای زبانی بزرگ (LLM) را پوشش میدهد.
💡 مفاهیم پایه شامل توکنها (tokenization, BPE)، امبدینگها (embeddings) و مکانیزم توجه (Attention mechanism, Multi-Head Attention) هستند.
🗼 معماری ترنسفورمر (Transformer) و انواع آن مانند BERT (فقط انکودر)، GPT (فقط دیکودر) و T5 (انکودر-دیکودر) بررسی شدهاند.
⚙️ در بخش مدلهای زبانی بزرگ، تکنیکهای Prompting (context length, Chain-of-Thought)، پیشآموزش (Pre-training, SFT, PEFT/LoRA)، تنظیم بر اساس ترجیحات (Preference tuning, Reward Model, Reinforcement Learning) و بهینهسازیها (Optimizations, Mixture of Experts, Distillation, Quantization) توضیح داده شدهاند.
#آموزش #RAG
این راهنما مفاهیم اصلی، معماریها و کاربردهای عملی مدلهای زبانی بزرگ (LLM) را پوشش میدهد.
💡 مفاهیم پایه شامل توکنها (tokenization, BPE)، امبدینگها (embeddings) و مکانیزم توجه (Attention mechanism, Multi-Head Attention) هستند.
🗼 معماری ترنسفورمر (Transformer) و انواع آن مانند BERT (فقط انکودر)، GPT (فقط دیکودر) و T5 (انکودر-دیکودر) بررسی شدهاند.
⚙️ در بخش مدلهای زبانی بزرگ، تکنیکهای Prompting (context length, Chain-of-Thought)، پیشآموزش (Pre-training, SFT, PEFT/LoRA)، تنظیم بر اساس ترجیحات (Preference tuning, Reward Model, Reinforcement Learning) و بهینهسازیها (Optimizations, Mixture of Experts, Distillation, Quantization) توضیح داده شدهاند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#آموزش #RAG