03. Reasoning Model.pdf
8.2 MB
📚 Build a Reasoning Model From Scratch راهنمای ساخت مدل استدلال
این کتاب، فهرستی جامع از فصول و تمرینهای عملی برای توسعه و ارزیابی مدلهای استدلال ارائه میدهد. ابتدا مفاهیم پایهای درک مدلهای استدلال بررسی میشود و سپس با استفاده از یک LLM پیشآموزشدادهشده، روشهای تولید متن معرفی میگردد. در فصول بعدی، ارزیابی مدلهای استدلال، بهبود آنها با تکنیکهای مقیاسگذاری در زمان استنتاج (Inference-Time Scaling) و خودبهبود (Self-Refinement) شرح داده میشود. همچنین بخشهای ویژهای برای آموزش با روش تقویت یادگیری (Reinforcement Learning) و بهبود الگوریتم GRPO، تقطیر مدل برای کارایی بالا، استفاده از LLMهای بزرگتر، بهینهسازی پردازش دستهای و ارزیابیهای متنوع ارائه شده است. در پیوستها، کد منبع Qwen3، راهنمای ساخت رابط چت، و منابع مطالعاتی بیشتر گنجانده شدهاند.
#آموزش #RLHF
این کتاب، فهرستی جامع از فصول و تمرینهای عملی برای توسعه و ارزیابی مدلهای استدلال ارائه میدهد. ابتدا مفاهیم پایهای درک مدلهای استدلال بررسی میشود و سپس با استفاده از یک LLM پیشآموزشدادهشده، روشهای تولید متن معرفی میگردد. در فصول بعدی، ارزیابی مدلهای استدلال، بهبود آنها با تکنیکهای مقیاسگذاری در زمان استنتاج (Inference-Time Scaling) و خودبهبود (Self-Refinement) شرح داده میشود. همچنین بخشهای ویژهای برای آموزش با روش تقویت یادگیری (Reinforcement Learning) و بهبود الگوریتم GRPO، تقطیر مدل برای کارایی بالا، استفاده از LLMهای بزرگتر، بهینهسازی پردازش دستهای و ارزیابیهای متنوع ارائه شده است. در پیوستها، کد منبع Qwen3، راهنمای ساخت رابط چت، و منابع مطالعاتی بیشتر گنجانده شدهاند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#آموزش #RLHF
❤1