🎓 دوره تخصصی Building Agentic AI Systems — with Andrew Ng
🔹 این دورهی رایگان توسط Andrew Ng، از بنیانگذاران Google Brain و Coursera، ارائه شده و به آموزش طراحی و توسعهی سامانههای Agentic AI میپردازد.
سرفصلهای اصلی این دوره:
1️⃣ مقدمه بر هوش مصنوعی عاملی (Introduction to Agentic AI) — آشنایی با مفهوم iterative multi-step workflows و مزایای آن نسبت به مدلهای سنتی.
2️⃣ الگوی بازتاب (Reflection Pattern) — طراحی سازوکارهایی برای self-critique و output improvement.
3️⃣ الگوی استفاده از ابزارها (Tool Use Pattern) — اتصال مدل به APIs, databases و محیطهای code execution.
4️⃣ نکات عملی در پیادهسازی (Practical Implementation) — evaluation metrics, error analysis و system optimization.
5️⃣ برنامهریزی و چندعاملی (Planning & Multi-Agent Systems) — ساخت autonomous agents و هماهنگی بین چند عامل هوشمند.
🧠 پروژه نهایی: توسعهی یک Research Agent خودکار برای جمعآوری داده، تحلیل و تولید گزارش پژوهشی.
🔗 ثبتنام : https://zaya.io/a8r0a
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience
🔹 این دورهی رایگان توسط Andrew Ng، از بنیانگذاران Google Brain و Coursera، ارائه شده و به آموزش طراحی و توسعهی سامانههای Agentic AI میپردازد.
سرفصلهای اصلی این دوره:
1️⃣ مقدمه بر هوش مصنوعی عاملی (Introduction to Agentic AI) — آشنایی با مفهوم iterative multi-step workflows و مزایای آن نسبت به مدلهای سنتی.
2️⃣ الگوی بازتاب (Reflection Pattern) — طراحی سازوکارهایی برای self-critique و output improvement.
3️⃣ الگوی استفاده از ابزارها (Tool Use Pattern) — اتصال مدل به APIs, databases و محیطهای code execution.
4️⃣ نکات عملی در پیادهسازی (Practical Implementation) — evaluation metrics, error analysis و system optimization.
5️⃣ برنامهریزی و چندعاملی (Planning & Multi-Agent Systems) — ساخت autonomous agents و هماهنگی بین چند عامل هوشمند.
🧠 پروژه نهایی: توسعهی یک Research Agent خودکار برای جمعآوری داده، تحلیل و تولید گزارش پژوهشی.
🔗 ثبتنام : https://zaya.io/a8r0a
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience
@DataPlusScience -Advanced-RAG-Techniques.pdf
13.1 MB
🧠 تکنیکهای پیشرفتهی RAG
📘 این کتابچه راهنمایی برای بهینهسازی سامانههای تولید مبتنی بر بازیابی (Retrieval-Augmented Generation) است؛ مدلی که دقت و واقعگرایی پاسخهای مدلهای زبانی بزرگ (LLMs) را با اتصال به پایگاه دانش بیرونی افزایش میدهد.
📊 کتاب چهار مرحلهی اصلی RAG را پوشش میدهد:
🔹 نمایهسازی (Indexing): شامل پیشپردازش داده و استراتژیهای تقسیمبندی (Chunking) برای بهبود ساختار و جستوجو
🔹 پیشبازیابی (Pre-Retrieval): بازنویسی و مسیردهی هوشمند پرسشها با کمک مدلهای زبانی بزرگ
🔹 بازیابی (Retrieval): استفاده از فیلتر متادیتا، جستوجوی ترکیبی (Hybrid Search) و فاینتیون مدلهای Embedding
🔹 پسبازیابی (Post-Retrieval): بازرتبهبندی (Re-ranking)، فشردهسازی متن و مهندسی پرامپت (Prompt Engineering) برای افزایش کیفیت پاسخ
این منبع برای پژوهشگران و توسعهدهندگانی مناسب است که میخواهند عملکرد سیستمهای RAG و Chatbot خود را بهبود دهند.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
📘 این کتابچه راهنمایی برای بهینهسازی سامانههای تولید مبتنی بر بازیابی (Retrieval-Augmented Generation) است؛ مدلی که دقت و واقعگرایی پاسخهای مدلهای زبانی بزرگ (LLMs) را با اتصال به پایگاه دانش بیرونی افزایش میدهد.
📊 کتاب چهار مرحلهی اصلی RAG را پوشش میدهد:
🔹 نمایهسازی (Indexing): شامل پیشپردازش داده و استراتژیهای تقسیمبندی (Chunking) برای بهبود ساختار و جستوجو
🔹 پیشبازیابی (Pre-Retrieval): بازنویسی و مسیردهی هوشمند پرسشها با کمک مدلهای زبانی بزرگ
🔹 بازیابی (Retrieval): استفاده از فیلتر متادیتا، جستوجوی ترکیبی (Hybrid Search) و فاینتیون مدلهای Embedding
🔹 پسبازیابی (Post-Retrieval): بازرتبهبندی (Re-ranking)، فشردهسازی متن و مهندسی پرامپت (Prompt Engineering) برای افزایش کیفیت پاسخ
این منبع برای پژوهشگران و توسعهدهندگانی مناسب است که میخواهند عملکرد سیستمهای RAG و Chatbot خود را بهبود دهند.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
📊 نقشه مهارتهای علم داده (Data Science Competency Map)
🧠 این نمودار چارچوب مهارتی علم داده را نشان میدهد؛ ترکیبی از دانش ریاضی، آماری و فنی برای تحلیل، مدلسازی و استقرار سامانههای هوشمند دادهمحور.
📐 ریاضیات: جبر خطی، بهینهسازی و کاهش بُعد برای پایهگذاری الگوریتمهای تحلیلی
💻 برنامهنویسی: تسلط بر Python، R و پایگاههای داده (SQL، MongoDB)
🎲 احتمال و آمار: توزیعها، آزمون فرض و رگرسیون برای اعتبارسنجی نتایج
⚙️ مهندسی ویژگی: انتخاب و تولید ویژگیهای مؤثر در یادگیری مدل
🤖 یادگیری ماشین: آموزش، ارزیابی و بهینهسازی مدلها با رویکرد دادهمحور
🧬 یادگیری عمیق: طراحی شبکههای عصبی با TensorFlow و PyTorch
💬پردازش زبان NLP: تحلیل متون و بردارهای معنایی واژهها
📊 بصریسازی داده: Tableau، Power BI و Qlik برای تحلیل تصویری
☁️ استقرار مدل: Azure، Flask و Django برای پیادهسازی عملیاتی
✨ تلفیق این مهارتها زیربنای نقش دانشمند داده (Data Scientist) را میسازد.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🧠 این نمودار چارچوب مهارتی علم داده را نشان میدهد؛ ترکیبی از دانش ریاضی، آماری و فنی برای تحلیل، مدلسازی و استقرار سامانههای هوشمند دادهمحور.
📐 ریاضیات: جبر خطی، بهینهسازی و کاهش بُعد برای پایهگذاری الگوریتمهای تحلیلی
💻 برنامهنویسی: تسلط بر Python، R و پایگاههای داده (SQL، MongoDB)
🎲 احتمال و آمار: توزیعها، آزمون فرض و رگرسیون برای اعتبارسنجی نتایج
⚙️ مهندسی ویژگی: انتخاب و تولید ویژگیهای مؤثر در یادگیری مدل
🤖 یادگیری ماشین: آموزش، ارزیابی و بهینهسازی مدلها با رویکرد دادهمحور
🧬 یادگیری عمیق: طراحی شبکههای عصبی با TensorFlow و PyTorch
💬پردازش زبان NLP: تحلیل متون و بردارهای معنایی واژهها
📊 بصریسازی داده: Tableau، Power BI و Qlik برای تحلیل تصویری
☁️ استقرار مدل: Azure، Flask و Django برای پیادهسازی عملیاتی
✨ تلفیق این مهارتها زیربنای نقش دانشمند داده (Data Scientist) را میسازد.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience - AI Engineering.pdf
31.9 MB
🧠 کتاب مهندسی هوش مصنوعی (AI Engineering)
📘 این کتاب تازه منتشر شده مجموعهای ساختارمند از مبانی و فناوریهای کلیدی مهندسی هوش مصنوعی است؛ مسیری از طراحی مدل تا استقرار سیستمهای هوشمند در مقیاس صنعتی.
⚙️ مهندسی داده (Data Engineering): شامل جمعآوری، یکپارچهسازی و پاکسازی دادهها برای ساخت پایگاه دانشی قابلاتکا جهت مدلهای یادگیری.
🧩 یادگیری ماشین (Machine Learning): فرآیند انتخاب الگوریتم، تنظیم ابرپارامترها، و ارزیابی عملکرد مدلها بر پایهی دادههای تجربی.
🧬 یادگیری عمیق (Deep Learning): توسعهی شبکههای عصبی پیچیده با چارچوبهای TensorFlow و PyTorch برای تحلیل دادههای غیرخطی و چندبعدی.
🧠 عملیات یادگیری ماشینی (MLOps): خودکارسازی چرخهی آموزش، ارزیابی، نسخهبندی و استقرار مدلها در مقیاس سازمانی.
☁️ استقرار و نظارت (Deployment & Monitoring): طراحی معماریهای ابری، پایش مستمر عملکرد و تضمین پایداری و اخلاق مدل در محیط تولید.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
📘 این کتاب تازه منتشر شده مجموعهای ساختارمند از مبانی و فناوریهای کلیدی مهندسی هوش مصنوعی است؛ مسیری از طراحی مدل تا استقرار سیستمهای هوشمند در مقیاس صنعتی.
⚙️ مهندسی داده (Data Engineering): شامل جمعآوری، یکپارچهسازی و پاکسازی دادهها برای ساخت پایگاه دانشی قابلاتکا جهت مدلهای یادگیری.
🧩 یادگیری ماشین (Machine Learning): فرآیند انتخاب الگوریتم، تنظیم ابرپارامترها، و ارزیابی عملکرد مدلها بر پایهی دادههای تجربی.
🧬 یادگیری عمیق (Deep Learning): توسعهی شبکههای عصبی پیچیده با چارچوبهای TensorFlow و PyTorch برای تحلیل دادههای غیرخطی و چندبعدی.
🧠 عملیات یادگیری ماشینی (MLOps): خودکارسازی چرخهی آموزش، ارزیابی، نسخهبندی و استقرار مدلها در مقیاس سازمانی.
☁️ استقرار و نظارت (Deployment & Monitoring): طراحی معماریهای ابری، پایش مستمر عملکرد و تضمین پایداری و اخلاق مدل در محیط تولید.
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
1
🎓 هفته رایگان DataCamp
از ۱۲ تا ۱۸ آبان، فرصت دارید به تمام دورههای آموزشی DataCamp بهصورت کامل و رایگان دسترسی داشته باشید.
در این بازه میتوانید مهارتهای دادهمحور مورد علاقهتان را یاد بگیرید، پروژههای عملی انجام دهید و حتی گواهی پایاندوره معتبر دریافت کنید.
🔗 لینک دسترسی: datacamp.com
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
از ۱۲ تا ۱۸ آبان، فرصت دارید به تمام دورههای آموزشی DataCamp بهصورت کامل و رایگان دسترسی داشته باشید.
در این بازه میتوانید مهارتهای دادهمحور مورد علاقهتان را یاد بگیرید، پروژههای عملی انجام دهید و حتی گواهی پایاندوره معتبر دریافت کنید.
🔗 لینک دسترسی: datacamp.com
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
1
جیپیتی (GPT) شبیه چه کسی است؟!
در پژوهشی از دانشگاه هاروارد، پاسخهای GPT به مجموعهای از شاخصهای روانشناختی و ارزشهای اجتماعی (با تکیه بر دادههای World Values Survey از ۹۴ هزار نفر) با پاسخهای مردم ۶۵ کشور مقایسه شده است. یافتهها نشان میدهند که GPT شباهت زیادی به جوامع غربی (Western)، تحصیلکرده (Educated)، صنعتی (Industrialized)، ثروتمند (Rich) و دموکراتیک (Democratic) (که با اصطلاح WEIRD شناخته میشوند) دارد و در مقابل، فاصله زیادی با جوامعی مانند اتیوپی، پاکستان یا قرقیزستان.
در واقع، GPT بیشتر شبیه ساکنان جوامع WEIRD است: فردگرا (individualistic)، و دارای سبک تفکر تحلیلی (analytic thinking). وقتی از GPT میپرسند "انسان معمولی کیست؟"، تصویری که ارائه میدهد با خودپندارهی رابطهمحور (relational self-concept) که در بسیاری از فرهنگها رایج است، فاصله دارد. این یعنی GPT نه تنها از دیدگاه خاصی به جهان نگاه میکند، بلکه تصورش از "انسان عادی" هم WEIRD است.
متن کامل مقاله را اینجا بخوانید
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
در پژوهشی از دانشگاه هاروارد، پاسخهای GPT به مجموعهای از شاخصهای روانشناختی و ارزشهای اجتماعی (با تکیه بر دادههای World Values Survey از ۹۴ هزار نفر) با پاسخهای مردم ۶۵ کشور مقایسه شده است. یافتهها نشان میدهند که GPT شباهت زیادی به جوامع غربی (Western)، تحصیلکرده (Educated)، صنعتی (Industrialized)، ثروتمند (Rich) و دموکراتیک (Democratic) (که با اصطلاح WEIRD شناخته میشوند) دارد و در مقابل، فاصله زیادی با جوامعی مانند اتیوپی، پاکستان یا قرقیزستان.
در واقع، GPT بیشتر شبیه ساکنان جوامع WEIRD است: فردگرا (individualistic)، و دارای سبک تفکر تحلیلی (analytic thinking). وقتی از GPT میپرسند "انسان معمولی کیست؟"، تصویری که ارائه میدهد با خودپندارهی رابطهمحور (relational self-concept) که در بسیاری از فرهنگها رایج است، فاصله دارد. این یعنی GPT نه تنها از دیدگاه خاصی به جهان نگاه میکند، بلکه تصورش از "انسان عادی" هم WEIRD است.
متن کامل مقاله را اینجا بخوانید
➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
1
Forwarded from هوش مصنوعی و علم داده به فارسی
@DataPlusScience_AI Agents Basics.pdf
3.9 MB
📌 آشنایی با عاملهای هوش مصنوعی (AI Agents)
🔹 یک راهنمای جامع برای درک عاملهای هوش مصنوعی و نحوه عملکرد آنها
این داکیومنت توسط گوگل منتشر شده و به بررسی مفهوم عاملهای هوش مصنوعی (AI Agents) میپردازد. عاملها میتوانند از مدلهای زبانی استفاده کنند، دادهها را پردازش کنند، ابزارهای مختلف را به کار گیرند و تصمیمگیریهای هوشمندانهای انجام دهند.
📝 سرفصل مطالب:
✅ معرفی عاملهای هوش مصنوعی و تفاوت آنها با مدلهای زبانی (Language Models)
✅ بررسی معماری شناختی (Cognitive Architecture) عاملها
✅ استفاده از ابزارها (Tools) برای تعامل با دادههای واقعی
✅ پیادهسازی عاملهای هوش مصنوعی با LangChain و Vertex AI
✅ نمونهکدهای کاربردی برای استفاده از عاملها در محیطهای تولیدی
📌 این مستند برای توسعهدهندگان، پژوهشگران و علاقهمندان به هوش مصنوعی که میخواهند با عاملهای هوش مصنوعی کار کنند، بسیار مفید است.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🔹 یک راهنمای جامع برای درک عاملهای هوش مصنوعی و نحوه عملکرد آنها
این داکیومنت توسط گوگل منتشر شده و به بررسی مفهوم عاملهای هوش مصنوعی (AI Agents) میپردازد. عاملها میتوانند از مدلهای زبانی استفاده کنند، دادهها را پردازش کنند، ابزارهای مختلف را به کار گیرند و تصمیمگیریهای هوشمندانهای انجام دهند.
📝 سرفصل مطالب:
✅ معرفی عاملهای هوش مصنوعی و تفاوت آنها با مدلهای زبانی (Language Models)
✅ بررسی معماری شناختی (Cognitive Architecture) عاملها
✅ استفاده از ابزارها (Tools) برای تعامل با دادههای واقعی
✅ پیادهسازی عاملهای هوش مصنوعی با LangChain و Vertex AI
✅ نمونهکدهای کاربردی برای استفاده از عاملها در محیطهای تولیدی
📌 این مستند برای توسعهدهندگان، پژوهشگران و علاقهمندان به هوش مصنوعی که میخواهند با عاملهای هوش مصنوعی کار کنند، بسیار مفید است.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
پایگاههای داده برداری
این تصویر، سامانههای Vector Database و پایگاههای دادهٔ پشتیبان Vector Search را در چهار رده نشان میدهد:
۱) اختصاصی متنباز: ابزارهایی مانند Chroma، Vespa، LanceDB، Marqo، Qdrant و Milvus که بهطور ویژه برای ذخیرهسازی و بازیابی برداری طراحی شدهاند.
۲) عمومی متنباز با جستجوی برداری: شامل OpenSearch، ClickHouse، PostgreSQL و Cassandra که این قابلیت را بهصورت ماژولی ارائه میکنند.
۳) اختصاصی تجاری: Weaviate و Pinecone که خدمات سازمانی و مدیریتشده فراهم میسازند.
۴) عمومی تجاری با پشتیبانی برداری: Elasticsearch، Redis، Rockset و SingleStore که امکان جستجوی برداری را در کنار دادهٔ سنتی فراهم میکنند.
مطالعه بیشتر
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
این تصویر، سامانههای Vector Database و پایگاههای دادهٔ پشتیبان Vector Search را در چهار رده نشان میدهد:
۱) اختصاصی متنباز: ابزارهایی مانند Chroma، Vespa، LanceDB، Marqo، Qdrant و Milvus که بهطور ویژه برای ذخیرهسازی و بازیابی برداری طراحی شدهاند.
۲) عمومی متنباز با جستجوی برداری: شامل OpenSearch، ClickHouse، PostgreSQL و Cassandra که این قابلیت را بهصورت ماژولی ارائه میکنند.
۳) اختصاصی تجاری: Weaviate و Pinecone که خدمات سازمانی و مدیریتشده فراهم میسازند.
۴) عمومی تجاری با پشتیبانی برداری: Elasticsearch، Redis، Rockset و SingleStore که امکان جستجوی برداری را در کنار دادهٔ سنتی فراهم میکنند.
مطالعه بیشتر
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
1
آشنایی با ترنسفومر
تولید شده توسط مدل Gemini 3 Nano Banana pro!
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
تولید شده توسط مدل Gemini 3 Nano Banana pro!
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
بر اساس نتایج مطالعه اخیر Gartner که بر مبنای نظرسنجی از گروهی از مدیران ارشد فناوری اطلاعات انجام شده است، الگوی تغییر بودجه فناوری از سال ۲۰۲۵ تا ۲۰۲۶ نسبتاً روشن است. بیشترین رشد بودجه به حوزههای هوش مصنوعی مولد، هوش مصنوعی و هوش تجاری و تحلیل دادهها اختصاص دارد؛ بهطوریکه بیش از ۸۰ درصد پاسخدهندگان در این حوزهها از افزایش بودجه خبر دادهاند و میانگین رشد بهترتیب حدود ۳۸، ۳۶ و ۲۵ درصد گزارش شده است!
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🤖🧠 شورای LLM | اجماع چندمدلی برای پاسخهای دقیقتر
رویکرد LLM Council بهجای تکیه بر یک مدل زبانی، چند LLM را همزمان وارد بازی میکند تا مثل یک «شورای کارشناسی هوش مصنوعی» روی یک سؤال فکر کنند، پاسخ بدهند و خطای همدیگر را بگیرند.
فرآیند سهمرحلهای است:
1️⃣ هر مدل بهطور مستقل پاسخ خودش را تولید میکند.
2️⃣ مدلها بهصورت ناشناس پاسخهای بقیه را از نظر دقت، انسجام و عمق تحلیل ارزیابی و رتبهبندی میکنند.
3️⃣ یک مدل بهعنوان «رئیس شورا» بهترین بخشها را ترکیب میکند و یک پاسخ نهایی منسجم و بهینه میسازد.
کاربرد این رویکرد برای سناریوهای تصمیمگیری حساس، تحلیلهای علمی و مسائل پیچیده است؛ جایی که یک خروجی واحد کافی نیست و نیاز به چند دیدگاه الگوریتمی وجود دارد.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
رویکرد LLM Council بهجای تکیه بر یک مدل زبانی، چند LLM را همزمان وارد بازی میکند تا مثل یک «شورای کارشناسی هوش مصنوعی» روی یک سؤال فکر کنند، پاسخ بدهند و خطای همدیگر را بگیرند.
فرآیند سهمرحلهای است:
1️⃣ هر مدل بهطور مستقل پاسخ خودش را تولید میکند.
2️⃣ مدلها بهصورت ناشناس پاسخهای بقیه را از نظر دقت، انسجام و عمق تحلیل ارزیابی و رتبهبندی میکنند.
3️⃣ یک مدل بهعنوان «رئیس شورا» بهترین بخشها را ترکیب میکند و یک پاسخ نهایی منسجم و بهینه میسازد.
کاربرد این رویکرد برای سناریوهای تصمیمگیری حساس، تحلیلهای علمی و مسائل پیچیده است؛ جایی که یک خروجی واحد کافی نیست و نیاز به چند دیدگاه الگوریتمی وجود دارد.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🧠 مراحل ایجاد سیستم RAG: هشت گام ضروری
تصویر بالا، ۸ گام کلیدی سیستم RAG (تولید تقویتشده با بازیابی) را نشان میدهد که دانش LLM را بهروز و تقویت میکند:
🗂 جمعآوری دادهها: دریافت دادههای متنوع (API، وب، ETL) برای ایجاد مخزن دانش اولیه.
🧹 پاکسازی و پیشپردازش: حذف PII، استانداردسازی و اجرای OCR برای افزایش کیفیت و اعتبار دادهها.
✂️ قطعهبندی و ساختاربندی: تقسیم اسناد به قطعات (Chunks) با اندازه بهینه، جهت حفظ بافت و بازیابی دقیقتر.
🧬 تولید امبدینگ: تبدیل متون به بردارهای عددی (Vector) توسط مدلهای ترنسفورمر برای درک معنایی.
🗃 پایگاه داده وکتور: ذخیره و سازماندهی بردارها در دیتابیسهای تخصصی (Pinecone) برای جستجوی سریع.
🔍 بازیابی و رتبهبندی: یافتن مرتبطترین بردارها با جستجوی هیبرید و رتبهبندی مجدد (Re-ranking) برای دقت نهایی.
📝 ارکستراسیون و پرامپتسازی: تزریق قطعات بازیابی شده به پرامپت و هدایت LLM برای تولید پاسخ دقیق.
📊 ارزیابی و نظارت: سنجش عملکرد با معیارهای کمی و بازخورد انسانی، جهت شناسایی توهم (Hallucination) و بهبود.
➖➖➖➖➖➖➖➖➖➖➖➖
📊👨🏫 @DataPlusScience | @Data➕Science
تصویر بالا، ۸ گام کلیدی سیستم RAG (تولید تقویتشده با بازیابی) را نشان میدهد که دانش LLM را بهروز و تقویت میکند:
🗂 جمعآوری دادهها: دریافت دادههای متنوع (API، وب، ETL) برای ایجاد مخزن دانش اولیه.
🧹 پاکسازی و پیشپردازش: حذف PII، استانداردسازی و اجرای OCR برای افزایش کیفیت و اعتبار دادهها.
✂️ قطعهبندی و ساختاربندی: تقسیم اسناد به قطعات (Chunks) با اندازه بهینه، جهت حفظ بافت و بازیابی دقیقتر.
🧬 تولید امبدینگ: تبدیل متون به بردارهای عددی (Vector) توسط مدلهای ترنسفورمر برای درک معنایی.
🗃 پایگاه داده وکتور: ذخیره و سازماندهی بردارها در دیتابیسهای تخصصی (Pinecone) برای جستجوی سریع.
🔍 بازیابی و رتبهبندی: یافتن مرتبطترین بردارها با جستجوی هیبرید و رتبهبندی مجدد (Re-ranking) برای دقت نهایی.
📝 ارکستراسیون و پرامپتسازی: تزریق قطعات بازیابی شده به پرامپت و هدایت LLM برای تولید پاسخ دقیق.
📊 ارزیابی و نظارت: سنجش عملکرد با معیارهای کمی و بازخورد انسانی، جهت شناسایی توهم (Hallucination) و بهبود.
➖➖➖➖➖➖➖➖➖➖➖➖
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience -Agentic AI Cheat Sheet.pdf
71.1 KB
🚀 خلاصهبرگ Agentic AI
در این فایل یک مرور بسیار خلاصه از مبانی هوش مصنوعی عاملمحور ارائه شده است.
✨ چرخه عامل: Reasoning → Action → Feedback
🧩 اجزای اصلی: مغز LLM، حافظه، ابزارها، برنامهریزی
🔬 معماریها: ReAct، Plan-and-Solve، Reflexion
🤝 سیستمهای چندعاملی (MAS) و الگوهای همکاری
🛠 فریمورکها: LangGraph، AutoGen، CrewAI
⚠️ چالشها و معیارهای ارزیابی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
در این فایل یک مرور بسیار خلاصه از مبانی هوش مصنوعی عاملمحور ارائه شده است.
✨ چرخه عامل: Reasoning → Action → Feedback
🧩 اجزای اصلی: مغز LLM، حافظه، ابزارها، برنامهریزی
🔬 معماریها: ReAct، Plan-and-Solve، Reflexion
🤝 سیستمهای چندعاملی (MAS) و الگوهای همکاری
🛠 فریمورکها: LangGraph، AutoGen، CrewAI
⚠️ چالشها و معیارهای ارزیابی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience -Gen-AI Interviews.pdf
3.3 MB
🎯 راهنمای جامع مصاحبههای شغلی هوش مصنوعی مولد (Generative AI)
💼 این فایل به عنوان یک منبع کاربردی، شما را برای موفقیت در مصاحبههای شغلی مرتبط با هوش مصنوعی مولد آماده میکند.
📋 در این راهنما، مجموعهای از سوالات فنی پرتکرار، از مفاهیم پایهای تا مباحث پیشرفته مانند معماری Transformer، مدلهای Diffusion و تکنیکهای Fine-tuning، پوشش داده شده است.
💡 مطالعه این منبع به تمام علاقهمندان و متخصصانی که قصد ورود به این حوزه را دارند، جهت کسب آمادگی و افزایش تسلط بر مفاهیم کلیدی توصیه میشود.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💼 این فایل به عنوان یک منبع کاربردی، شما را برای موفقیت در مصاحبههای شغلی مرتبط با هوش مصنوعی مولد آماده میکند.
📋 در این راهنما، مجموعهای از سوالات فنی پرتکرار، از مفاهیم پایهای تا مباحث پیشرفته مانند معماری Transformer، مدلهای Diffusion و تکنیکهای Fine-tuning، پوشش داده شده است.
💡 مطالعه این منبع به تمام علاقهمندان و متخصصانی که قصد ورود به این حوزه را دارند، جهت کسب آمادگی و افزایش تسلط بر مفاهیم کلیدی توصیه میشود.
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
معرفی کتابخانه PandasAI 🐼: آینده تحلیل داده با هوش مصنوعی
این کتابخانه پایتون به شما اجازه میدهد که با استفاده از زبان طبیعی (مثل انگلیسی) با دیتافریمهای pandas خود کار کنید. این ابزار به عنوان یک مکمل برای pandas عمل میکند و با کمک مدلهای زبانی بزرگ (LLMs)، تحلیل داده را به یک گفتگوی ساده تبدیل میکند.
ویژگیهای کلیدی:
📊 پرسش و پاسخ با زبان طبیعی
📈 رسم نمودار و مصورسازی
🔗 کار با چندین دیتافریم
این کتابخانه ابزاری قدرتمند برای تمام متخصصان داده، تحلیلگران و هر کسی است که میخواهد سریعتر و هوشمندانهتر با دادهها کار کند.
🔗 برای شروع و مشاهده مثالهای بیشتر، به مخزن گیتهاب این پروژه سر بزنید:
https://github.com/sinaptik-ai/pandas-ai
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
این کتابخانه پایتون به شما اجازه میدهد که با استفاده از زبان طبیعی (مثل انگلیسی) با دیتافریمهای pandas خود کار کنید. این ابزار به عنوان یک مکمل برای pandas عمل میکند و با کمک مدلهای زبانی بزرگ (LLMs)، تحلیل داده را به یک گفتگوی ساده تبدیل میکند.
ویژگیهای کلیدی:
📊 پرسش و پاسخ با زبان طبیعی
📈 رسم نمودار و مصورسازی
🔗 کار با چندین دیتافریم
این کتابخانه ابزاری قدرتمند برای تمام متخصصان داده، تحلیلگران و هر کسی است که میخواهد سریعتر و هوشمندانهتر با دادهها کار کند.
🔗 برای شروع و مشاهده مثالهای بیشتر، به مخزن گیتهاب این پروژه سر بزنید:
https://github.com/sinaptik-ai/pandas-ai
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
📊 آنتروپیک، رهبر جدید بازار Enterprise LLM
بازار مدلهای زبانی بزرگ در سال ۲۰۲۵ وارد فاز تازهای شد. Anthropic با تصاحب ۴۰٪ سهم بازار Enterprise، جایگاه نخست را از OpenAI گرفت.
در همین حال، سهم OpenAI از ۵۰٪ به ۲۷٪ کاهش یافت و Google با رشدی چشمگیر از ۷٪ به ۲۱٪ رسید. اکنون این سه بازیگر، ۸۸٪ بازار Enterprise را در اختیار دارند.
برتری Anthropic در حوزه Coding چشمگیر است: ۵۴٪ سهم بازار و تبدیل شدن Claude Code به یک Game Changer واقعی؛ مدلی که ۱۸ ماه متوالی صدرنشین LLM Leaderboards بوده است.
در واقع تمرکز استراتژیک بر Code Generation، عامل کلیدی موفقیت Anthropic در بازار Enterprise بوده است.
📌 Menlo Ventures, 2025
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
بازار مدلهای زبانی بزرگ در سال ۲۰۲۵ وارد فاز تازهای شد. Anthropic با تصاحب ۴۰٪ سهم بازار Enterprise، جایگاه نخست را از OpenAI گرفت.
در همین حال، سهم OpenAI از ۵۰٪ به ۲۷٪ کاهش یافت و Google با رشدی چشمگیر از ۷٪ به ۲۱٪ رسید. اکنون این سه بازیگر، ۸۸٪ بازار Enterprise را در اختیار دارند.
برتری Anthropic در حوزه Coding چشمگیر است: ۵۴٪ سهم بازار و تبدیل شدن Claude Code به یک Game Changer واقعی؛ مدلی که ۱۸ ماه متوالی صدرنشین LLM Leaderboards بوده است.
در واقع تمرکز استراتژیک بر Code Generation، عامل کلیدی موفقیت Anthropic در بازار Enterprise بوده است.
📌 Menlo Ventures, 2025
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience_Deep_Dive_to_Legendary_Self_Attention_Mechanism.pdf
16.9 MB
📘مکانیزم Self-Attention در مدلهای زبانی بزرگ
در این ارائه ابتدا محدودیتهای معماریهای بازگشتی (RNN و LSTM) و چالش وابستگیهای بلندمدت تحلیل میشود.
سپس گذار مفهومی به Transformer و منطق حذف محاسبات ترتیبی تشریح میگردد.
در ادامه بردارهای Query، Key و Value و نقش آنها در محاسبه توجه بررسی میشوند.
همچنین فرآیند ریاضی Scaled Dot-Product و Softmax بهصورت گامبهگام توضیح داده شده است.
در نهایت مفاهیم Multi-Head Attention، Positional Encoding و جریان تولید متن مرور میشوند.
این فایل برای دانشجویان و متخصصان علوم داده و یادگیری عمیق که به دنبال درک دقیق سازوکار توجه هستند، مناسب است.
🔗 Lhuqita Fazry
➖➖➖➖➖➖➖➖➖➖➖➖
📊👨🏫 @DataPlusScience | @Data➕Science
در این ارائه ابتدا محدودیتهای معماریهای بازگشتی (RNN و LSTM) و چالش وابستگیهای بلندمدت تحلیل میشود.
سپس گذار مفهومی به Transformer و منطق حذف محاسبات ترتیبی تشریح میگردد.
در ادامه بردارهای Query، Key و Value و نقش آنها در محاسبه توجه بررسی میشوند.
همچنین فرآیند ریاضی Scaled Dot-Product و Softmax بهصورت گامبهگام توضیح داده شده است.
در نهایت مفاهیم Multi-Head Attention، Positional Encoding و جریان تولید متن مرور میشوند.
این فایل برای دانشجویان و متخصصان علوم داده و یادگیری عمیق که به دنبال درک دقیق سازوکار توجه هستند، مناسب است.
🔗 Lhuqita Fazry
➖➖➖➖➖➖➖➖➖➖➖➖
📊👨🏫 @DataPlusScience | @Data➕Science
Forwarded from هوش مصنوعی و علم داده به فارسی
@DataPlusScience -Statistics Notes.pdf
4.7 MB
📘 یادداشتهای آمار: راهنمای جامع مباحث آماری
💡 این فایل شامل مفاهیم پایه و پیشرفته آماری است که به صورت ساده و کاربردی توضیح داده شدهاند. مباحث شامل انواع دادهها، آزمونهای آماری و تکنیکهای تحلیل داده است که برای دانشجویان و محققین مفید است.
📊 مفاهیم پایه: شامل آمار توصیفی (Descriptive Statistics) و استنباطی (Inferential Statistics).
📌 اندازهگیری گرایش مرکزی: میانگین (Mean)، میانه (Median) و مد (Mode).
📏 اندازهگیری پراکندگی: واریانس (Variance) و انحراف معیار (Standard Deviation).
🗂 انواع دادهها و مقیاسها: دادههای اسمی (Nominal)، ترتیبی (Ordinal)، فاصلهای (Interval) و نسبتی (Ratio).
🧪 آزمونهای آماری: آزمون Z، آزمون T، آزمون خی دو (Chi-Square)، و تحلیل واریانس (ANOVA).
📈 توزیعهای احتمالی: توزیع نرمال (Normal Distribution)، دوجملهای (Binomial) و پواسون (Poisson).
🧮 قضیه حد مرکزی (Central Limit Theorem): تحلیل توزیع نمونهها با اندازههای بزرگ.
🔗 تحلیل دادههای پراکنده: کوواریانس (Covariance) و همبستگی (Correlation).
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل شامل مفاهیم پایه و پیشرفته آماری است که به صورت ساده و کاربردی توضیح داده شدهاند. مباحث شامل انواع دادهها، آزمونهای آماری و تکنیکهای تحلیل داده است که برای دانشجویان و محققین مفید است.
📊 مفاهیم پایه: شامل آمار توصیفی (Descriptive Statistics) و استنباطی (Inferential Statistics).
📌 اندازهگیری گرایش مرکزی: میانگین (Mean)، میانه (Median) و مد (Mode).
📏 اندازهگیری پراکندگی: واریانس (Variance) و انحراف معیار (Standard Deviation).
🗂 انواع دادهها و مقیاسها: دادههای اسمی (Nominal)، ترتیبی (Ordinal)، فاصلهای (Interval) و نسبتی (Ratio).
🧪 آزمونهای آماری: آزمون Z، آزمون T، آزمون خی دو (Chi-Square)، و تحلیل واریانس (ANOVA).
📈 توزیعهای احتمالی: توزیع نرمال (Normal Distribution)، دوجملهای (Binomial) و پواسون (Poisson).
🧮 قضیه حد مرکزی (Central Limit Theorem): تحلیل توزیع نمونهها با اندازههای بزرگ.
🔗 تحلیل دادههای پراکنده: کوواریانس (Covariance) و همبستگی (Correlation).
📊👨🏫 @DataPlusScience | @Data➕Science
📊 پنج سطح بلوغ هوش مصنوعی ایجنتیک | چارچوبی کاربردی برای درک و پیادهسازی سیستمهای خودمختار
🔹 سطح ۱ | ربات وظیفهای قطعی
اجرای اقدامات از پیش تعریفشده و محدود
مثال: بازنشانی رمز عبور، فرمهای ساده
🔹 سطح ۲ | عامل آمادهساز
پیشنویس و اجرای جزئی وظایف چندمرحلهای
نیاز: بازبینی اجباری انسانی
مثال: پیشنویس قرارداد، گزارشهای هفتگی
🔹 سطح ۳ | اپراتور تخصصی
مدیریت کامل گردشکاری روتین
نظارت: بررسی نمونهای
مثال: پاسخ تیکتها، گزارشگیری خودکار
🔹 سطح ۴ | متخصص نیمهخودمختار
عملکرد صحیح در ~۹۸٪ موارد
نظارت: تأیید فقط در مواقع استثنا
مثال: مدیریت قیمت، سفارشگذاری با بودجه
🔹 سطح ۵ | حلکننده مستقل مسئله
تجزیه مسائل نوین و تولید دانش
وضعیت: فعلاً غیرقابل دسترسی برای تولید
📚 Cal Al-Dhubaib & Ivan Lee | ODSC
📊👨🏫 @DataPlusScience | @Data➕Science
🔹 سطح ۱ | ربات وظیفهای قطعی
اجرای اقدامات از پیش تعریفشده و محدود
مثال: بازنشانی رمز عبور، فرمهای ساده
🔹 سطح ۲ | عامل آمادهساز
پیشنویس و اجرای جزئی وظایف چندمرحلهای
نیاز: بازبینی اجباری انسانی
مثال: پیشنویس قرارداد، گزارشهای هفتگی
🔹 سطح ۳ | اپراتور تخصصی
مدیریت کامل گردشکاری روتین
نظارت: بررسی نمونهای
مثال: پاسخ تیکتها، گزارشگیری خودکار
🔹 سطح ۴ | متخصص نیمهخودمختار
عملکرد صحیح در ~۹۸٪ موارد
نظارت: تأیید فقط در مواقع استثنا
مثال: مدیریت قیمت، سفارشگذاری با بودجه
🔹 سطح ۵ | حلکننده مستقل مسئله
تجزیه مسائل نوین و تولید دانش
وضعیت: فعلاً غیرقابل دسترسی برای تولید
📚 Cal Al-Dhubaib & Ivan Lee | ODSC
📊👨🏫 @DataPlusScience | @Data➕Science
کیفیت، امنیت و حکمرانی؛ مقدم بر نوآوریهای داده و هوش مصنوعی
نتایج گزارش BARC Data, BI & Analytics Trend Monitor 2026 نشان میدهد که در افق ۲۰۲۶، «زیرساخت اعتماد» یعنی کیفیت داده، امنیت/حریم خصوصی و حکمرانی داده، همچنان بر موجهای نوظهور فناوری تقدم دارد. این گزارش که با حمایت MicroStrategy و بهصورت پایش روند تکرارشونده منتشر شده، بر پایه ۱,۵۷۹ پاسخ معتبر تهیه شده است.
در صدر اولویتها، کیفیت داده و امنیت با امتیاز ۷.۹ قرار دارند که بیانگر تمرکز سازمانها بر اتکاپذیری، کاهش ریسک و انطباق است. پس از آن، فرهنگ دادهمحور، حکمرانی داده و هوش مصنوعی و سواد داده اهمیت بالایی یافتهاند. در مقابل، GenAI و Agentic AI عمدتاً پس از تثبیت این بنیانها دنبال میشوند.
توضیحات بیشتر:
https://zaya.io/4972p
📊👨🏫 @DataPlusScience | @Data➕Science
نتایج گزارش BARC Data, BI & Analytics Trend Monitor 2026 نشان میدهد که در افق ۲۰۲۶، «زیرساخت اعتماد» یعنی کیفیت داده، امنیت/حریم خصوصی و حکمرانی داده، همچنان بر موجهای نوظهور فناوری تقدم دارد. این گزارش که با حمایت MicroStrategy و بهصورت پایش روند تکرارشونده منتشر شده، بر پایه ۱,۵۷۹ پاسخ معتبر تهیه شده است.
در صدر اولویتها، کیفیت داده و امنیت با امتیاز ۷.۹ قرار دارند که بیانگر تمرکز سازمانها بر اتکاپذیری، کاهش ریسک و انطباق است. پس از آن، فرهنگ دادهمحور، حکمرانی داده و هوش مصنوعی و سواد داده اهمیت بالایی یافتهاند. در مقابل، GenAI و Agentic AI عمدتاً پس از تثبیت این بنیانها دنبال میشوند.
توضیحات بیشتر:
https://zaya.io/4972p
📊👨🏫 @DataPlusScience | @Data➕Science