هوش مصنوعی و علم داده به فارسی
6.08K subscribers
981 photos
266 videos
317 files
1.06K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
هوش مصنوعی و علم داده به فارسی
🧠 تکامل مدل‌های هوش مصنوعی در عصر ANI این تصویر سه مرحله‌ی کلیدی در پیشرفت مدل‌های هوش مصنوعی محدود (Artificial Narrow Intelligence - ANI) را نشان می‌دهد: 1️⃣ مدل زبانی بزرگ (LLM): تنها به ورودی (Prompt) پاسخ می‌دهد؛ بدون حافظه یا ابزار. نمونه: ChatGPT.…
📘 ساختار عملکردی عامل هوش مصنوعی (AI Agent Concept)

این تصویر، فرایند کامل اجرای وظایف توسط یک AI Agent را به‌صورت مرحله‌به‌مرحله نمایش می‌دهد:

1️⃣ دریافت داده (Ingestion): داده‌ها از منابع مختلف جمع‌آوری و به بخش‌های کوچکتر تقسیم می‌شوند.

2️⃣ بازیابی و ذخیره‌سازی (Retrieval & Memory): داده‌ها به صورت بردار تعبیه شده، در حافظه بلندمدت ذخیره شده و در مواقع نیاز بازیابی می‌شوند.

3️⃣ ادغام ابزارها (Tool Integration): نماینده به ابزارهای خارجی مانند تقویم، سیستم رزرو، تحلیل‌گر داده و APIها متصل می‌شود.

4️⃣ تولید و اجرای پاسخ (Response & Action): مدل زبانی مرکزی (LLM) بر اساس سؤال و زمینه موجود، پاسخ را تولید کرده و در صورت نیاز اقدام مستقیم انجام می‌دهد (مانند زمان‌بندی جلسه یا رزرو پرواز).

عامل هوش مصنوعی با ترکیب حافظه، ابزار و مدل زبانی، امکان انجام وظایف پیچیده و چندمرحله‌ای را به‌صورت خودکار فراهم می‌سازد.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📌 مقایسه برترین فریم‌ورک‌های Agentic AI

🛠 فریم‌ورک ADK – ارکستراسیون منعطف، اکوسیستم ابزار غنی و پشتیبانی از معماری چندعامله. مناسب برای اتوماسیون پیچیده و سیستم‌های مکالمه‌ای.

🔗 فریم‌ورک LangGraph – معماری گراف‌محور برای پردازش حالت‌مند و چندعامله با قابلیت ردیابی پیشرفته. کاربرد در چت‌بات‌های هوشمند و سیستم‌های تصمیم‌یار.

👥 فریم‌ورک CrewAI – طراحی مبتنی بر نقش، تیم‌های عامل پویا و تصمیم‌گیری تعاملی. مناسب شبیه‌سازی، استراتژی کسب‌وکار و حوزه سلامت.

🔒 فریم‌ورک Microsoft Semantic Kernel – امنیت سازمانی، مقیاس‌پذیری بالا و پشتیبانی چندزبانه. کاربرد در چت‌بات‌ها، اتوماسیون و خدمات مشتری.

⚙️ فریم‌ورک Microsoft AutoGen هماهنگی چندعامله پیشرفته، مکالمات پیچیده و تصمیم‌گیری قدرتمند. مناسب تحقیق، کدنویسی و برنامه‌ریزی وظایف.

⚡️ فریم‌ورک Smolagents – فریم‌ورک سبک‌وزن با قابلیت نمونه‌سازی سریع و هزینه پایین. مناسب ساخت دستیارهای هوشمند و تحلیل داده.

🚀 فریم‌ورک AutoGPT – اجرای خودکار وظایف، یادگیری تطبیقی و متن‌باز بودن. کاربرد در اتوماسیون، تحقیق و تحلیل پیشرفته.


📊👨‍🏫 @DataPlusScience
📌 آشنایی با ۸ معماری RAG در هوش مصنوعی

در این تصویر، هشت معماری برتر RAG (Retrieval-Augmented Generation) معرفی شده‌اند که هر یک رویکرد متفاوتی برای ترکیب بازیابی داده‌ها و تولید محتوا توسط مدل‌های زبانی ارائه می‌دهند:

🛠 معماری Naive RAG – استفاده ساده از بردارسازی پرسش و جستجو در پایگاه داده برداری برای پاسخ‌گویی سریع.

🖼 معماری Multimodal RAG – پشتیبانی از داده‌های متنی، تصویری و صوتی برای بازیابی و تولید چندرسانه‌ای.

💡 معماری HyDE – ایجاد پاسخ فرضی اولیه برای بهبود دقت و کیفیت بازیابی اطلاعات.

🔍 معماری Corrective RAG – ارزیابی و اصلاح نتایج با جستجوی وب و منابع اضافی.

🔗 معماری Graph RAG – بهره‌گیری از پایگاه داده گرافی برای تحلیل ارتباطات معنایی داده‌ها.

⚙️ معماری Hybrid RAG – ترکیب پایگاه داده برداری و گرافی برای پوشش کامل‌تر اطلاعات.

🔄 معماری Adaptive RAG – انتخاب پویا و هوشمند مسیر بازیابی بر اساس پرسش و استدلال.

🤖 معماری Agentic RAG – استفاده از عامل‌های هوشمند چندمرحله‌ای با دسترسی به جستجو و سرویس‌های ابری.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
@DataPlusScience_Top_50_LLM_Interview_Questions_and_Answers.pdf
7.1 MB
📖 50 سوال مهم مصاحبه برای مدل‌های زبانی بزرگ (LLMs)

💡 این فایل شامل سوالات کلیدی مرتبط با مدل‌های زبانی بزرگ و پاسخ‌های تخصصی به آن‌ها است. برای افراد علاقه‌مند به یادگیری مفاهیم پایه و پیشرفته در این حوزه بسیار مفید است. این سوالات مفاهیمی مانند توکن‌سازی (Tokenization)، تکنیک‌های بهینه‌سازی مانند LoRA و QLoRA، و مفهوم توجه چندسری (Multi-head Attention) را پوشش می‌دهند.

📄 رئوس سوالات:

توکن‌سازی و اهمیت آن: چرا و چگونه مدل‌های زبانی بزرگ متن را به توکن‌ها تقسیم می‌کنند؟
بهینه‌سازی حافظه با LoRA و QLoRA: کاهش مصرف حافظه بدون افت عملکرد.
تفاوت مدل‌های اتورگرسیو و ماسک‌شده: کاربردها و نقاط قوت هر روش.
مفاهیم پیشرفته مثل زنجیره افکار (Chain-of-Thought): بهبود توانایی استدلال مدل‌ها.
حل چالش‌های رایج مدل‌های زبانی بزرگ: از فراموشی فاجعه‌بار تا مدیریت منابع.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
@DataPlusScience_Hands_On_Machine_Learning_with_Scikit_Learn_Vol1.pdf
7.5 MB
📘 ترجمه فارسی کتاب «Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3rd Edition)»
🔹 مترجم: محسن زارع

این کتاب یکی از معتبرترین و کاربردی‌ترین منابع آموزشی در حوزه‌ی یادگیری ماشین و یادگیری عمیق است که با زبانی ساده اما علمی، مفاهیم پایه تا پیشرفته را همراه با مثال‌ها و کدهای عملی در اختیار علاقه‌مندان قرار می‌دهد.
ویرایش سوم کتاب، با پوشش ابزارهای مدرن مانند Scikit-Learn، Keras و TensorFlow، مسیری منظم و پروژه‌محور برای ورود و پیشرفت در دنیای هوش مصنوعی فراهم کرده است.

📂 در این جلد (فصول ۱ تا ۹) مباحث پایه و مقدماتی یادگیری ماشین ارائه شده و ادامه مسیر (جلد دوم) به شبکه‌های عصبی و یادگیری عمیق اختصاص خواهد داشت.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
سالروز شهادت امام علی‌بن‌موسی‌الرضا علیه‌السلام تسلیت باد. 🖤

@DataPlusScience
This media is not supported in your browser
VIEW IN TELEGRAM
یک دوره خیلی خوب از کمپانی Databricks در مورد MLOps که در قالب ۱۰ تا ویدیو در یوتیوب هست:

https://www.youtube.com/playlist?list=PL_MIDuPM12MOcQQjnLDtWCCCuf1Cv-nWL

🔗 Mehdi Allahyari



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🌐 نقش‌های نوظهور در حوزه داده و تحلیل
در عصر تحول دیجیتال، نیاز به تخصص‌های متنوع در مسیر بهره‌برداری از داده‌ها بیش از پیش حس می‌شود. طبق نمودار گارتنر، نقش‌ها را می‌توان در چهار دسته اصلی جای داد:

🛠 نقش‌های فنی (Technical Roles):

🏗 Data Engineer (مهندس داده)
🤖 AI/ML Developer (توسعه‌دهنده هوش مصنوعی/یادگیری ماشین)
📊 Model Manager (مدیر مدل)

💼 نقش‌های کسب‌وکار (Business Roles):

📦 Data Product Manager (مدیر محصول داده)
⚙️ Decision Engineer (مهندس تصمیم‌گیری)
👔 CDAO – Chief Data & Analytics Officer (مدیر ارشد داده و تحلیل)

🚀 نقش‌های نوظهور (Emerging Roles):

💬 Data Translator (مترجم داده)
⚖️ Data Ethicist (مسئول اخلاق داده)
🏋️‍♂️ XOps Coach (مربی عملیات داده)

👥 نقش‌های شهروند‌محور (Citizen Roles):
این دسته شامل افرادی است که الزاماً پس‌زمینه فنی یا برنامه‌نویسی ندارند، اما با ابزارها و پلتفرم‌های خودخدمت‌محور (self-service) به تولید و مصرف تحلیلات داده می‌پردازند:

🧪 Citizen Data Scientist (دانشمند داده شهروند)
🔧 Citizen Data Engineer (مهندس داده شهروند)


📊👨‍🏫 @DataPlusScience | @DataScience
روابط میان توزیع‌های احتمالی

📊 این نمودار روابط میان توزیع‌های احتمالی را نشان می‌دهد. بسیاری از توزیع‌های شناخته‌شده از یکدیگر قابل استخراج‌اند:

🔹برنولی پایه‌ی دوجمله‌ای است، و در حالت خاص به پواسون نزدیک می‌شود.
🔹پواسون در شرایط خاص به توزیع نرمال همگرا می‌شود.
🔹نرمال استاندارد منبعی برای توزیع‌های دیگر مانند کای-دو و کاشی است.
🔹گاما، نمایی و ویبول ارتباط نزدیکی با یکدیگر دارند و برای مدل‌سازی زمان بقا یا نرخ رخدادها به‌کار می‌روند.
🔹بتا و یونیفورم در بازه‌های محدود تعریف می‌شوند و نقش مهمی در مدل‌سازی احتمالات پیوسته دارند.

این ساختار شبکه‌ای نشان می‌دهد که توزیع‌ها جزیره‌های جداگانه نیستند، بلکه خانواده‌ای به‌هم‌پیوسته‌اند که درک ارتباطشان برای تحلیل آماری و یادگیری ماشین ضروری است.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
سیر تحول از LLM تا Agentic AI

📝 مدل‌های زبانی (LLM): تنها بر پیش‌بینی توکن متکی‌اند؛ ساده و سریع، اما فاقد درک عمیق زمینه.
📚 بازیابی‌تقویت‌شده (RAG): با اتصال به پایگاه‌های دانش خارجی دقت پاسخ را افزایش می‌دهد، هرچند وابسته به کیفیت داده است.
🛠 عامل هوشمند (AI Agent): لایه‌های حافظه، استدلال، برنامه‌ریزی و ابزار را می‌افزاید و برای وظایف چندمرحله‌ای و خودکارسازی جریان‌کار مناسب است.
🌐 هوش عاملی (Agentic AI): ساختاری چندعاملی با حافظه و هماهنگی مشترک است که توانایی حل مسائل پیچیده و مقیاس‌پذیر را دارد، اما طراحی و کنترل آن دشوارتر است.

📌 این گذار به معنای جانشینی نیست، بلکه افزودن قابلیت‌های جدید بر لایه‌های پیشین است؛ با هر مرحله قدرت بیشتر و در عین حال ریسک، پیچیدگی و عدم قطعیت افزایش می‌یابد.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
هوش مصنوعی و علم داده به فارسی
📌 آشنایی با ۸ معماری RAG در هوش مصنوعی در این تصویر، هشت معماری برتر RAG (Retrieval-Augmented Generation) معرفی شده‌اند که هر یک رویکرد متفاوتی برای ترکیب بازیابی داده‌ها و تولید محتوا توسط مدل‌های زبانی ارائه می‌دهند: 🛠 معماری Naive RAG – استفاده ساده از…
📌 ۱۰ ابزار برتر هوش مصنوعی عامل‌محور (Agentic AI Tools)

🤝 ابزار n8n – اتوماسیون گردش‌کار کم‌کد (Low-code workflow automation)، مناسب برای چندعاملی.

⚙️ ابزار Make.com – اتوماسیون بدون‌کد (No-code automation)، ویژه تیم‌های غیر فنی.

🧩 ابزار LangChain – فریم‌ورک ساخت برنامه‌های LLM و ابزارهای RAG پیچیده.

🤖 ابزار AutoGen – ارکستراسیون چندعاملی (Multi-agent orchestration) و همکاری انسان–هوش مصنوعی.

🔗 ابزار LangGraph – گردش‌کار مبتنی بر گراف، مسیردهی و ارکستراسیون پیشرفته.

🪄 ابزار Flowise – ابزار کشیدن و رها کردن (Drag-and-drop) برای ساخت سریع پایپ‌لاین‌های RAG.

👥 ابزار CrewAI – تیم‌های چندعاملی تخصصی با مدیریت نقش‌ها.

🌐 ابزار OpenAI Agentic Stack – یکپارچه در اکوسیستم ChatGPT، مناسب برای استقرار سریع.

📚 ابزار LlamaIndex – اتصال LLM به داده‌های خصوصی و حافظه بلندمدت.

🧠 ابزار Semantic Kernel – SDK توسعه ایجنت با اتصال‌گرهای داخلی (Built-in connectors).



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
@DataPlusScience__The Big Book of Generative AI.pdf
5.1 MB
📌 کتابچه جامع هوش مصنوعی مولد (The Big Book of Generative AI)
🔖 منتشرشده توسط Databricks

📖 این کتابچه یک راهنمای تخصصی و مرحله‌به‌مرحله برای ساخت و استقرار برنامه‌های GenAI است و مباحث کلیدی زیر را پوشش می‌دهد:

🔹 مدل‌های پایه (Foundation Models) – معرفی و مقایسه مدل‌های متن‌باز و تجاری مانند GPT و LLaMA.
🔹 مهندسی پرامپت (Prompt Engineering) – طراحی ورودی‌های بهینه برای بهبود دقت و کارایی LLMها.
🔹 بازیابی تقویت‌شده (RAG: Retrieval-Augmented Generation) – ارتقای کیفیت پاسخ‌ها با داده‌های ساخت‌یافته و غیرساخت‌یافته.
🔹 فاین‌تیون (Fine-Tuning) – شخصی‌سازی مدل‌ها با داده‌های سازمانی، شامل تکنیک‌های LoRA و QLoRA.
🔹 پیش‌آموزش (Pretraining) – آموزش مدل‌های زبانی از صفر برای دامنه‌های خاص.
🔹 ارزیابی LLMها (LLM Evaluation) – روش‌های سنجش کیفیت، دقت و قابلیت اعتماد مدل‌ها.

💡 کتاب شامل مطالعات موردی (Use Cases) و نمونه کدهای عملی است، از جمله:

تحلیل خودکار نظرات کاربران با LLMها
بهبود عملکرد RAG با داده‌های زنده
ساخت مدل اختصاصی برای مستندسازی خودکار



آموزش علم داده: 👇

📊👨‍🏫 @DataPlusScience
@DataPlusScince__A visual Intoroduction to Deep Learning.pdf
5.3 MB
🌟آموزش بصری یادگیری عمیق

📘 این کتاب به شما کمک می‌کند تا به صورت بصری و بدون استفاده از فرمول‌های پیچیده ریاضی و کدنویسی، مفاهیم یادگیری عمیق را درک کنید.

🔍 مباحث شامل: شبکه‌های عصبی، رگرسیون خطی و غیرخطی، طبقه‌بندی دودویی و چندکلاسه، و...

👨‍💻 نویسنده: معر عامر، دانش‌آموخته‌ی امپریال کالج لندن و متخصص یادگیری عمیق.


#یادگیری_عمیق #کتاب_الکترونیک #یادگیری_ماشین #هوش_مصنوعی #آموزش


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
سرمایه‌گذاری و شراکت غول‌های مشاوره در دنیای عامل‌های هوش مصنوعی

این نقشه نشان می‌دهد که شرکت‌های بزرگ مشاوره‌ای مثل Accenture، Deloitte، KPMG، PwC، EY، McKinsey، BCG و Bain از سال ۲۰۲۳ تاکنون بیش از صد مورد شراکت، سرمایه‌گذاری و خرید در استارتاپ‌های مرتبط با AI Agents داشته‌اند.

برای آشنایی بیشتر با اینکه چگونه این موج تازه، مدل سنتی صنعت مشاوره را دگرگون می‌کند، این مطلب را بخوانید.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📊 ماتریس مهارت‌های کلیدی در نقش‌های نوین هوش مصنوعی

این ماتریس نشان می‌دهد نقش‌های مختلف در اکوسیستم AI به مجموعه‌های متفاوتی از توانمندی‌ها نیاز دارند:

🤖 مهندس یادگیری ماشین (ML Engineer) و دانشمند داده (Data Scientist) بیشترین بار مهارتی را دارند؛ از الگوریتم‌های یادگیری ماشین و تحلیل آماری تا Deep Learning و MLOps.

📝 مهندس مدل‌های زبانی (LLM Engineer) و مهندس پرامپت (Prompt Engineer) بر مهارت‌های نوظهور مانند LLMs، RAG و Prompt Engineering متمرکز هستند.

🏗 معمار هوش مصنوعی (AI Architect) و مهندس تصمیم (Decision Engineer) باید توانایی بالایی در System Design & Architecture و طراحی سامانه‌های تصمیم‌یار داشته باشند.

دیگر نقش‌ها مانند مدیر مدل‌سازی (Model Manager) یا مهندس تحلیلی (Analytics Engineer) نیز به ترکیبی از مهارت‌های داده‌ای، مدل‌سازی و رهبری نیاز دارند.

🔑 پیام اصلی این ماتریس این است که آینده شغلی در AI تنها با یک ابزار یا زبان برنامه‌نویسی ساخته نمی‌شود؛ بلکه نیازمند ترکیب چندلایه‌ای از مهارت‌های فنی، داده‌ای، معماری و اخلاقی است که هر نقش را متمایز می‌کند.

📊👨‍🏫 @DataPlusScience
هوش مصنوعی و علم داده به فارسی
📌 ۱۰ ابزار برتر هوش مصنوعی عامل‌محور (Agentic AI Tools) 🤝 ابزار n8n – اتوماسیون گردش‌کار کم‌کد (Low-code workflow automation)، مناسب برای چندعاملی. ⚙️ ابزار Make.com – اتوماسیون بدون‌کد (No-code automation)، ویژه تیم‌های غیر فنی. 🧩 ابزار LangChain – فریم‌ورک…
🧠 نقشه‌ راه توسعه عامل‌های هوشمند (AI Agents)

این اینفوگرافی، ساختار هفت‌مرحله‌ای طراحی یک AI Agent را تبیین می‌کند:

1️⃣ تعریف System Prompt – تعیین Goals، Roles و Instructions به‌منظور تعریف رفتار و محدوده تصمیم‌گیری عامل.
2️⃣ مدل زبانی (LLM) – انتخاب مدل زبانی پایه و تنظیم Parameters جهت تطبیق با نیاز مسئله.
3️⃣ ابزارها (Tools) – یکپارچه‌سازی ابزارها، APIs و MCP Servers برای دسترسی به داده‌ها و اکشن‌های محیطی.
4️⃣ حافظه (Memory) – طراحی ساختارهای حافظه (Episodic، Vector DB، SQL DB و File Store) برای نگهداری دانش و زمینه.
5️⃣ ارکستراسیون (Orchestration) – مدیریت Workflows، Triggers، Message Queues و تعامل Agent2Agent به‌صورت پویا.
6️⃣ رابط کاربری (UI) – طراحی لایه‌ی تعامل کاربر با عامل برای مشاهده، هدایت و کنترل رفتار.
7️⃣ ارزیابی هوشمند (AI Evals) – ارزیابی و بهبود مستمر از طریق Performance Metrics و تحلیل تطبیقی خروجی‌ها.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
@DataPlusScience - Hands-On Generative AI.pdf.pdf
21.8 MB
🤖 هوش‌ مصنوعی‌ مولد در عمل (Hands-On Generative AI)

📘 کتابی از انتشارات O’Reilly (۲۰۲۵) که به‌صورت کاربردی نحوه‌ی درک و پیاده‌سازی مدل‌های مولد (Generative Models) را آموزش می‌دهد. نویسندگان با تکیه بر تجربه‌های واقعی، روش استفاده از مدل‌های باز برای تولید متن، تصویر و صدا را شرح داده و ملاحظات اخلاقی را برجسته می‌کنند.

🧩 بخش نخست (Leveraging Open Models) به مفاهیم مدل‌های مولد، سازوکار ترنسفورمرها (Transformers)، فشرده‌سازی با VAE و ساخت مدل‌های Stable Diffusion و CLIP می‌پردازد.

🧠 بخش دوم (Transfer Learning) آموزش Fine-Tuning مدل‌های زبانی و تصویری را با ابزارهایی چون DreamBooth، LoRA و Quantization توضیح می‌دهد.

🎨 بخش پایانی (Going Further) کاربردهای خلاقانه‌ی Text-to-Image و Audio Generation را بررسی کرده و حوزه‌های نوینی چون 3D Vision، Video Generation و Multimodal AI را معرفی می‌کند.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🎓 دوره تخصصی Building Agentic AI Systems — with Andrew Ng

🔹 این دوره‌ی رایگان توسط Andrew Ng، از بنیان‌گذاران Google Brain و Coursera، ارائه شده و به آموزش طراحی و توسعه‌ی سامانه‌های Agentic AI می‌پردازد.

سرفصل‌های اصلی این دوره:
1️⃣ مقدمه بر هوش مصنوعی عاملی (Introduction to Agentic AI) — آشنایی با مفهوم iterative multi-step workflows و مزایای آن نسبت به مدل‌های سنتی.
2️⃣ الگوی بازتاب (Reflection Pattern) — طراحی سازوکارهایی برای self-critique و output improvement.
3️⃣ الگوی استفاده از ابزارها (Tool Use Pattern) — اتصال مدل به APIs, databases و محیط‌های code execution.
4️⃣ نکات عملی در پیاده‌سازی (Practical Implementation) — evaluation metrics, error analysis و system optimization.
5️⃣ برنامه‌ریزی و چندعاملی (Planning & Multi-Agent Systems) — ساخت autonomous agents و هماهنگی بین چند عامل هوشمند.

🧠 پروژه نهایی: توسعه‌ی یک Research Agent خودکار برای جمع‌آوری داده، تحلیل و تولید گزارش پژوهشی.

🔗 ثبت‌نام : https://zaya.io/a8r0a

برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience
@DataPlusScience -Advanced-RAG-Techniques.pdf
13.1 MB
🧠 تکنیک‌های پیشرفته‌ی RAG

📘 این کتابچه راهنمایی برای بهینه‌سازی سامانه‌های تولید مبتنی بر بازیابی (Retrieval-Augmented Generation) است؛ مدلی که دقت و واقع‌گرایی پاسخ‌های مدل‌های زبانی بزرگ (LLMs) را با اتصال به پایگاه دانش بیرونی افزایش می‌دهد.

📊 کتاب چهار مرحله‌ی اصلی RAG را پوشش می‌دهد:

🔹 نمایه‌سازی (Indexing): شامل پیش‌پردازش داده و استراتژی‌های تقسیم‌بندی (Chunking) برای بهبود ساختار و جست‌وجو
🔹 پیش‌بازیابی (Pre-Retrieval): بازنویسی و مسیردهی هوشمند پرسش‌ها با کمک مدل‌های زبانی بزرگ
🔹 بازیابی (Retrieval): استفاده از فیلتر متادیتا، جست‌وجوی ترکیبی (Hybrid Search) و فاین‌تیون مدل‌های Embedding
🔹 پس‌بازیابی (Post-Retrieval): باز‌رتبه‌بندی (Re-ranking)، فشرده‌سازی متن و مهندسی پرامپت (Prompt Engineering) برای افزایش کیفیت پاسخ

این منبع برای پژوهشگران و توسعه‌دهندگانی مناسب است که می‌خواهند عملکرد سیستم‌های RAG و Chatbot خود را بهبود دهند.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📊 نقشه مهارت‌های علم داده (Data Science Competency Map)

🧠 این نمودار چارچوب مهارتی علم داده را نشان می‌دهد؛ ترکیبی از دانش ریاضی، آماری و فنی برای تحلیل، مدل‌سازی و استقرار سامانه‌های هوشمند داده‌محور.

📐 ریاضیات: جبر خطی، بهینه‌سازی و کاهش بُعد برای پایه‌گذاری الگوریتم‌های تحلیلی

💻 برنامه‌نویسی: تسلط بر Python، R و پایگاه‌های داده (SQL، MongoDB)

🎲 احتمال و آمار: توزیع‌ها، آزمون فرض و رگرسیون برای اعتبارسنجی نتایج

⚙️ مهندسی ویژگی: انتخاب و تولید ویژگی‌های مؤثر در یادگیری مدل

🤖 یادگیری ماشین: آموزش، ارزیابی و بهینه‌سازی مدل‌ها با رویکرد داده‌محور

🧬 یادگیری عمیق: طراحی شبکه‌های عصبی با TensorFlow و PyTorch

💬پردازش زبان NLP: تحلیل متون و بردارهای معنایی واژه‌ها

📊 بصری‌سازی داده: Tableau، Power BI و Qlik برای تحلیل تصویری

☁️ استقرار مدل: Azure، Flask و Django برای پیاده‌سازی عملیاتی

تلفیق این مهارت‌ها زیربنای نقش دانشمند داده (Data Scientist) را می‌سازد.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience