هوش مصنوعی و علم داده به فارسی

‏📚 Build a Reasoning Model From Scratch راهنمای ساخت مدل استدلال

‏این کتاب، فهرستی جامع از فصول و تمرین‌های عملی برای توسعه و ارزیابی مدل‌های استدلال ارائه می‌دهد. ابتدا مفاهیم پایه‌ای درک مدل‌های استدلال بررسی می‌شود و سپس با استفاده از یک LLM پیش‌آموزش‌داده‌شده، روش‌های تولید متن معرفی می‌گردد. در فصول بعدی، ارزیابی مدل‌های استدلال، بهبود آن‌ها با تکنیک‌های مقیاس‌گذاری در زمان استنتاج (Inference-Time Scaling) و خودبهبود (Self-Refinement) شرح داده می‌شود. همچنین بخش‌های ویژه‌ای برای آموزش با روش تقویت یادگیری (Reinforcement Learning) و بهبود الگوریتم GRPO، تقطیر مدل برای کارایی بالا، استفاده از LLMهای بزرگتر، بهینه‌سازی پردازش دسته‌ای و ارزیابی‌های متنوع ارائه شده است. در پیوست‌ها، کد منبع Qwen3، راهنمای ساخت رابط چت، و منابع مطالعاتی بیشتر گنجانده شده‌اند.

📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما

#آموزش #RLHF

❤1

198 viewsedited 13:01

About

Blog

Apps

Platform