هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
265 videos
317 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
هوش مصنوعی و علم داده به فارسی
🚀 تکامل هوش مصنوعی: از آغاز تا آینده! این تصویر مسیر رشد هوش مصنوعی (AI) را از گذشته تا آینده نشان می‌دهد. 🔍 مهم‌ترین نقاط عطف: ۱۹۵۰: آزمون تورینگ برای سنجش هوشمندی ماشین‌ها ۱۹۹۷: پیروزی Deep Blue بر قهرمان شطرنج جهان ۲۰۱۲: انقلاب یادگیری عمیق (Deep…
شرکت دیپ‌سیک نسخه‌ی ارتقایافته‌ی مدل غیراستدلالی خود، DeepSeek V3-0324، را معرفی کرده است. بر اساس گزارش Artificial Analysis این مدل با بهبود چشمگیر در کیفیت پاسخ‌ها، در ارزیابی‌های مستقل توانسته است از مدل‌های برجسته‌ای نظیر Claude 3.7 Sonnet و Grok-3 پیشی بگیرد و به یکی از برترین مدل‌های غیراستدلالی (non-reasoning models) در حوزه‌ی هوش مصنوعی تبدیل شود!



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6
پس از انتشار آپدیت اخیر ChatGPT که امکان خلق تصاویر با الهام از استودیو Ghibli را فراهم کرد، کاربران به شکل بی‌سابقه‌ای از این ویژگی استقبال کردند. سم آلتمن، مدیرعامل OpenAI، در توییتی از کاربران خواست تا استفاده از این قابلیت را کاهش دهند!

در پاسخ، یکی از کاربران بازتعریف طنزآمیز و خلاقانه‌ای از مخفف‌های هوش مصنوعی پیشنهاد داده 😄:

GPU: Ghibli Processing Unit
GPT: Ghibli Production Tools
AGI: All Ghibli Images



📊👨‍🏫 @DataPlusScience | @DataScience
👍7🔥3
@DataPlusScience - ChatGPT for Python.pdf
9.9 MB
کاربردهای ChatGPT برای برنامه‌نویسان پایتون

این فایل راهنمایی جامع برای توسعه‌دهندگان پایتون است که می‌خواهند از قابلیت‌های ChatGPT در برنامه‌های خود بهره‌برداری کنند. با استفاده از این کتاب، شما می‌آموزید که چگونه از APIهای OpenAI و ChatGPT برای ایجاد برنامه‌های هوش مصنوعی استفاده کنید. مباحث از مفاهیم پایه‌ای مانند مدل‌های زبانی (Language Models) گرفته تا جزئیات فنی مانند توکن‌ها (Tokens) و پارامترهای تنظیمات مدل‌ها را شامل می‌شود.

🧑‍💻سر فصل موضوعات:

آشنایی با مدل‌های ChatGPT و نحوه استفاده از آنها برای پردازش زبان طبیعی (NLP)
کاربردهای طراحی الگوهای نرم‌افزاری در پایتون
نحوه تنظیم کلید API و شروع به کار با OpenAI API در پایتون
ساخت و توسعه اپلیکیشن‌های هوش مصنوعی با استفاده از مدل‌های GPT و ابزارهای دیگر


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍32🙏1
@DataPlusScience_Machine Learning Handbook.pdf
5.8 MB
📘 راهنمای جامع یادگیری ماشین (Machine Learning Handbook)

این هندبوک با هدف تسهیل درک مفاهیم و آغاز به‌کار در حوزه یادگیری ماشین (Machine Learning) تهیه شده است. در این مجموعه، از الگوریتم‌های کلاسیک نظیر رگرسیون خطی (Linear Regression) و درخت تصمیم (Decision Tree) تا مدل‌های پیشرفته‌ مانند شبکه‌های عصبی (Neural Networks) و خوشه‌بندی (Clustering) به‌صورت گام‌به‌گام، همراه با شبه‌کد (Pseudocode)، تشریح شده‌اند.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
2👍1
📌 ابزارهای کلیدی مورد استفاده در نقش‌های مختلف حوزه داده

این نمودار، مهم‌ترین ابزارها در سه نقش اصلی حوزه داده را به‌صورت مقایسه‌ای نمایش می‌دهد:

🔹 تحلیلگر داده (Data Analyst): ابزارهایی مثل (Excel)، (Power BI)، (Tableau)، (Google Analytics)، (Alteryx)، (Looker) و (Google Data Studio) برای تحلیل و مصورسازی داده‌های تجاری استفاده می‌شوند.

🔹 دانشمند داده (Data Scientist): تمرکز بر مدل‌سازی و یادگیری ماشین با ابزارهایی مانند (Python)، (R)، (Jupyter Notebook)، (Scikit-Learn)، (TensorFlow)، (PyTorch)، و (Keras) است.

🔹 مهندس داده (Data Engineer): ساخت و مدیریت زیرساخت داده با ابزارهایی مثل (Hadoop)، (Spark)، (Kafka)، (Airflow)، (Snowflake)، (Redshift)، (NiFi) و (Databricks) انجام می‌شود.

همچنین برخی ابزارها مانند (SQL)، (Python)، (Power BI) و (Git) در هر سه حوزه مشترک هستند و یادگیری آن‌ها برای ورود به هر یک از این مسیرها توصیه می‌شود.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍4
📌 مدل متن‌باز DeepCoder؛ رقیبی جدی برای مدل‌های کدنویسی OpenAI

دانشگاه UC Berkeley به‌تازگی مدل کدنویسی ۱۴ میلیارد پارامتری DeepCoder را به‌صورت متن‌باز منتشر کرده است. این مدل با بهره‌گیری از یادگیری تقویتی (Reinforcement Learning) و آموزش روی ۲۴ هزار مسئله‌ی کدنویسی با تست‌های قابل‌اعتبار، به دقت ۶۰.۶٪ در معیار LiveCodeBench دست یافته؛ رقمی برابر با عملکرد مدل‌های o3-mini و o1 از OpenAI.

🔹 هزینه آموزش این مدل معادل اجرای ۳۲ کارت H100 به‌مدت ۲.۵ هفته (حدود ۲۶,۸۸۰ دلار) بوده است.
🔹 تمام اجزای آن شامل مدل، کد منبع، داده‌ها، لاگ‌های آموزشی و ابزارهای بهینه‌سازی به‌صورت متن‌باز در دسترس هستند.
🔹 قابلیت اجرای محلی (Local) این مدل، فرصتی ارزشمند برای پژوهشگران و توسعه‌دهندگان جهت بررسی و توسعه سیستم‌های کدنویسی هوشمند فراهم می‌سازد.

📚 منبع:
DeepCoder: A Fully Open-Source 14B Coder at O3-mini Level (2025), Agentica x Together AI

https://huggingface.co/agentica-org/DeepCoder-14B-Preview

برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍2
@DataPlusScience_MCP- Model Context Protocol.pdf
5 MB
📘 آشنایی با پروتکل Model Context Protocol (MCP)

پروتکل MCP به‌عنوان یک راهکار نوین و متن‌باز برای اتصال مدل‌های زبانی (LLM) به ابزارها، فایل‌ها، APIها و منابع داده معرفی شده است. MCP مانند پورت USB-C برای مدل‌های زبانی عمل می‌کند و بستری انعطاف‌پذیر، ماژولار و دوطرفه برای ساخت عامل‌های هوشمند فراهم می‌سازد.

این سند به معرفی این پروتکل پرداخته و شامل موارد زیر است:

– معماری پایه‌ی MCP و اجزای اصلی آن (Host، Client، Server، Context Provider)
– نحوه ارتباط بلادرنگ بین مدل و ابزارها
– مقایسه با روش‌های سنتی مانند APIهای دستی و فریم‌ورک‌های Agent
– کاربردهای MCP در ساخت سیستم‌های Agentic
– مسیر آینده این پروتکل و ابزارهای در حال توسعه



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍2🙏2
Media is too big
VIEW IN TELEGRAM
پلتفرم n8n یک ابزار متن‌باز برای اتوماسیون و ساخت ایجنت‌های هوش مصنوعی بدون نیاز به کدنویسی است.

در این ویدیوی آموزشی دو ساعته، مجموعه‌ای از پروژه‌های عملی با استفاده از n8n آموزش داده می‌شود؛ از ساخت چت‌بات تلگرام و ارسال ایمیل‌های هوشمند گرفته تا تولید محتوای خودکار و اتصال به سرویس‌هایی مثل Google Sheets، Typeform، Qdrant و Claude.

اگر به دنبال یادگیری سریع و کاربردی n8n در ترکیب با ابزارهای هوش مصنوعی هستید، این دوره می‌تواند گزینه مناسبی باشد.

📺 لینک ویدیو در یوتیوب:
https://www.youtube.com/watch?v=8-nTKVnUnwM


00:33 Project 1: RSS Feeds
14:12 Project 2: Form Submissions + Email
37:11 Project 4: HTTP Nodes + Scraping
1:15:12 Project 7: Social Media Content + Subflows
1:33:15 Project 8: Telegram Chatbot
1:53:47 Project 9: Add Voice to Telegram Response
1:57:40 Project 10: MCP



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍5
🔍 مهارت‌های کلیدی در تیم‌های داده‌محور

در تیم‌های موفق داده‌محور (Data-driven)، ترکیب سه مهارت اصلی ضروری است:
💼 کسب‌وکار (Business Skills)
🧩 فناوری (Technology Skills)
📊 تحلیل داده (Analytics Skills)


📌 اعضای کلیدی تیم:
👨‍💼 رهبران کسب‌وکار: هدایت تحول داده‌ای در سازمان
📦 مدیران تحویل: انتقال بینش تحلیلی به کاربران
🧩 یکپارچه‌سازان جریان کار: ساخت ابزارهای تصمیم‌یار
📊 تحلیل‌گران بصری‌سازی: طراحی داشبورد و نمودار
🛠 مهندسان داده: ساختاردهی و تحلیل داده‌ها
🏗 معماران داده: تضمین کیفیت جریان‌های داده
🗣 مترجمان تحلیلی: پل ارتباطی بین کسب‌وکار و تحلیل
🧠 دانشمندان داده: توسعه مدل‌ها و الگوریتم‌ها

نمودار ون (Venn Diagram) نقش‌ها و هم‌پوشانی مهارت‌ها را روشن می‌سازد.
📌 هم‌افزایی این تخصص‌ها، رمز موفقیت داده‌محور است!


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🙏2
@DataPlusScience_ Mathematics for Machine Learning.pdf
3.2 MB
📘 ریاضیات برای یادگیری ماشین

این مجموعه آموزشی مفاهیم کلیدی ریاضی و ساختاری در یادگیری ماشین (Machine Learning) و یادگیری عمیق (Deep Learning) را به‌صورت گام‌به‌گام بررسی می‌کند و برای دانشجویان، پژوهشگران و علاقه‌مندان حوزه هوش مصنوعی سودمند است.

🔍 مباحث کلیدی مطرح‌شده در این ارائه:

پرسپترون (Perceptron) و ساختار اولیه نورون مصنوعی
توابع هزینه پیوسته (Continuous Cost Functions)
نرون مدرن (Modern Neuron) و توابع فعال‌سازی (Activation Functions)
شبکه‌های عصبی تک‌لایه و چندلایه (Single/Multilayer Neural Networks)
شبکه‌های عصبی عمیق (Deep Neural Networks)
شبکه‌های کانولوشنی (CNNs) و استخراج خودکار ویژگی‌ها
شبکه‌های بازگشتی (RNNs) و تحلیل داده‌های ترتیبی
مکانیزم توجه (Attention) و معماری ترنسفورمر (Transformer)
تمایز پارامترها و فراپارامترها (Hyperparameters)
مفاهیم Overfitting، Underfitting، Backpropagation و تقسیم داده

📎 مطالعه این اسلایدها درک ساختار الگوریتم‌های یادگیری ماشین و نحوه پیاده‌سازی مؤثر آن‌ها را تسهیل می‌کند.



📊👨‍🏫 @DataPlusScience | @DataScience
🙏32👍2
هوش مصنوعی و علم داده به فارسی
@DataPlusScience_AI Agents Basics.pdf
Audio
پادکست "آشنایی با عامل‌های هوش مصنوعی (AI Agents)" را بشنوید؛ این پادکست بر پایه‌ی فایل آموزشی منتشرشده در این پست و با بهره‌گیری از توانایی‌های هوش مصنوعی NotebookLM تولید شده است!



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍8
🎓 دوره رایگان تحلیل داده دیلویت استرالیا (Deloitte Australia – Data Analytics Virtual Internship)

دوره‌ای کوتاه، رایگان و خودآموز برای یادگیری مهارت‌های کلیدی مثل Data Analysis، Data Modeling و کار با Tableau. بدون نیاز به آزمون، با دریافت گواهی پایان دوره برای تقویت رزومه.

🔗 ثبت‌نام:
https://zaya.io/a21u3



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6
@DataPlusScience - n8n جزوه‌ی فارسی آموزش .pdf
1.3 MB
🛠 آموزش فارسی ابزار اتوماسیون n8n

اگر دنبال راه‌اندازی و استفاده از ابزار متن‌باز و قدرتمند n8n برای اتوماسیون گردش کار (Workflow Automation) هستید، این جزوه فارسی به‌طور کامل مراحل نصب، تنظیم، و استفاده از n8n را آموزش می‌دهد؛ چه به‌صورت Self-Hosted و چه در قالب n8n Cloud.

🔗 منبع


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6
🌐 نقش‌های نوظهور در حوزه داده و تحلیل
در عصر تحول دیجیتال، نیاز به تخصص‌های متنوع در مسیر بهره‌برداری از داده‌ها بیش از پیش حس می‌شود. طبق نمودار گارتنر، نقش‌ها را می‌توان در چهار دسته اصلی جای داد:

🛠 نقش‌های فنی (Technical Roles):

🏗 Data Engineer (مهندس داده)
🤖 AI/ML Developer (توسعه‌دهنده هوش مصنوعی/یادگیری ماشین)
📊 Model Manager (مدیر مدل)

💼 نقش‌های کسب‌وکار (Business Roles):

📦 Data Product Manager (مدیر محصول داده)
⚙️ Decision Engineer (مهندس تصمیم‌گیری)
👔 CDAO – Chief Data & Analytics Officer (مدیر ارشد داده و تحلیل)

🚀 نقش‌های نوظهور (Emerging Roles):

💬 Data Translator (مترجم داده)
⚖️ Data Ethicist (مسئول اخلاق داده)
🏋️‍♂️ XOps Coach (مربی عملیات داده)

👥 نقش‌های شهروند‌محور (Citizen Roles):
این دسته شامل افرادی است که الزاماً پس‌زمینه فنی یا برنامه‌نویسی ندارند، اما با ابزارها و پلتفرم‌های خودخدمت‌محور (self-service) به تولید و مصرف تحلیلات داده می‌پردازند:

🧪 Citizen Data Scientist (دانشمند داده شهروند)
🔧 Citizen Data Engineer (مهندس داده شهروند)


📊👨‍🏫 @DataPlusScience | @DataScience
👍7🔥2
درک لایه‌های هوش مصنوعی مدرن: از LLM تا Agentic AI

این تصویر به تحلیل و بررسی چهار لایه اصلی در معماری هوش مصنوعی مدرن می‌پردازد که هر یک نقش مهمی در بهبود عملکرد و قابلیت‌های سیستم‌های هوشمند ایفا می‌کنند. از LLM (مدل زبان بزرگ) که برای پردازش زبان طبیعی و انجام وظایف مختلف مانند تولید متن و استدلال زنجیره‌ای طراحی شده، تا RAG (تولید مبتنی بر بازیابی-افزوده) که با استفاده از داده‌های خارجی به تقویت دقت و اعتبار پاسخ‌ها می‌پردازد.

عامل هوش مصنوعی (AI Agent ) به عنوان لایه‌ای که مدل‌ها را به عامل‌های فعال تبدیل می‌کند و قادر به اجرای کد، برنامه‌ریزی و مدیریت حافظه است، و در نهایت Agentic AI (هوش مصنوعی عاملی) که با ارائه سیستم‌های چندعاملی، همکاری بین عوامل و تصمیم‌گیری خودمختار، توانمندی‌های پیشرفته‌تری را به سیستم‌های هوشمند می‌بخشد.

درک و یکپارچه‌سازی این لایه‌ها، برای طراحی و پیاده‌سازی سیستم‌های هوش مصنوعی مقیاس‌پذیر و بهینه ضروری است.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
9👍1🔥1
معماری توسعه‌دهندگان RAG

این تصویر معماری لایه‌ای سیستم‌های RAG (بازیابی و تولید پاسخ) را نمایش می‌دهد؛ سامانه‌ای که ابتدا داده‌های مرتبط را بازیابی و سپس با مدل‌های زبانی بزرگ (LLMs) پاسخ نهایی را تولید می‌کند.

🧠 مدل‌های زبانی (LLMs): هسته تولید پاسخ هستند.مدل‌های متن‌باز شامل LLaMA، Mistral، Phi-4، Qwen و Gemma و مدل‌های متن‌بسته مانند GPT، Claude، Gemini و Cohere هستند.

🧰 چارچوب‌های توسعه (Frameworks): برای سازمان‌دهی زنجیره پرسش، بازیابی و پاسخ به کار می‌روند. ابزارهای پرکاربرد شامل LangChain، LlamaIndex و Haystack هستند.

📦 پایگاه‌های داده برداری (Vector Databases): برای ذخیره Embeddingهای متنی و انجام جست‌وجوی معنایی استفاده می‌شوند. نمونه‌ها: Chroma، Pinecone، Qdrant، Weaviate و Milvus.

🔤 تعبیه متنی (Text Embeddings): متن را به بردار عددی برای جست‌وجوی مفهومی تبدیل می‌کنند. مدل‌های متن‌باز: SBERT، Nomic، Ollama. متن‌بسته: OpenAI، Cohere، Gemini.

🧪 ارزیابی عملکرد (Evaluation):
برای سنجش کیفیت پاسخ و دقت بازیابی به کار می‌رود. ابزارهای کلیدی: Ragas، Trulens، Giskard.

📊👨‍🏫 @DataPlusScience
👍42🔥1
اَلسَّلامُ عَلَى الْحُسَيْنِ
وَ عَلى عَلِىِّ بْنِ الْحُسَيْنِ
وَ عَلى اَوْلادِ الْحُسَيْنِ
وَ عَلى اَصْحابِ الْحُسَيْنِ

🏴 عاشورای حسینی تسلیت باد 🏴

@DataPlusScience
🎓 مسیر تبدیل شدن به تحلیلگر داده (Data Analyst)

برای تحلیلگر داده شدن، این مراحل کلیدی است:

🔢 ریاضیات و آمار (Math & Stats)
مبانی آمار و احتمال برای تحلیل و استنباط داده ضروری است. جبر خطی (Linear Algebra) و حساب دیفرانسیل (Calculus) نیز پایه مدل‌سازی هستند.

🐍 پایتون (Python)
یادگیری پانداس (Pandas)، نام‌پای (NumPy)، مَت‌پلات‌لیب (Matplotlib)، سی‌بورن (Seaborn)، اسکیکت‌لرن (Scikit-learn) برای تحلیل و مصورسازی داده اهمیت دارد.

🗄کوئری نویسی SQL
مهارت در SELECT, INSERT, UPDATE, DELETE و مفاهیم پیشرفته مثل توابع پنجره‌ای (Window Functions) و بهینه‌سازی پرس‌وجوها (Optimization) حیاتی است.

📊 مصورسازی داده (Data Visualization)
ابزارهایی مثل Plotly، Tableau و Power BI برای ارائه و روایت‌گری داده (Data Storytelling) استفاده می‌شوند.

🤖 یادگیری ماشین (Machine Learning)
رگرسیون (Regression)، درخت تصمیم (Decision Trees)، خوشه‌بندی (Clustering) تحلیل پیش‌بینی‌محور را ممکن می‌سازند.

💡 مهارت‌های نرم (Soft Skills)
مهارت ارتباطی، حل مسئله و تفکر انتقادی، نقش کلیدی در کار تیمی دارند.


📊👨‍🏫 @DataPlusScience
4
📌 تکامل کاربردی هوش مصنوعی از ۱۹۵۰ تا امروز

این نمودار مراحل تحول AI را از سیستم‌های قاعده‌محور (Rule-Based) تا سامانه‌های چندعاملی پیشرفته نشان می‌دهد:
از الگوریتم‌های کلاسیک (SVM, Decision Trees) و شبکه‌های عصبی (CNN, RNN)،
تا مدل‌های زبانی مدرن (LLMs: GPT-4, Claude, Gemini)
و در ادامه معماری‌های RAG، استفاده از ابزارها (Function Calling) و عامل‌های مستقل (AI Agents).
در گام نهایی، تعامل بین عامل‌ها با پروتکل MCP و ارتباط A2A تعریف شده است.

🧠 مسیر تکامل:
Rule-Based → ML → Deep Learning → Transformers → LLMs → RAG → Tool Use → Agents → Multi-Agent → MCP



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
📌 مسیر آموزش GenAI

این تصویر، مسیر مرحله‌به‌مرحله تسلط بر GenAI را از سطح پایه تا پیشرفته ترسیم می‌کند:

🔻 سطح پایه (Basic)
درک تفاوت GenAI با AI سنتی
مهندسی پرامپت (Prompt Engineering)
شناخت مدل‌های LLMs مانند GPT-4 و Claude
تولید متن با ابزارهایی چون ChatGPT
تولید تصویر با DALL·E، Midjourney و …

🟣 سطح میانی (Intermediate)
استفاده از مدل‌های چندحالته (Multimodal)
ساخت GPT اختصاصی (Custom / Fine-Tuned)
اتصال به API و توابع بیرونی (Function Calling)
ترکیب با داده‌های خصوصی (RAG، Pinecone)
آشنایی با اخلاق، خطاها و ایمنی در GenAI

🔷 سطح پیشرفته (Advanced)
ساخت عامل‌های خودکار با AutoGPT یا MetaGPT
تولید داده مصنوعی برای آموزش یا تست
تولید چندزبانه محتوا با BLOOM
تولید کد با ابزارهایی مانند Copilot
کاربرد تخصصی GenAI در پزشکی، حقوق و علم



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience