هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
264 videos
317 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
هفته رایگان DataCamp

تمامی دوره‌های DataCamp از امروز به مدت یک هفته (از ۴ تا ۱۰ نوامبر) به صورت رایگان در دسترس خواهد بود. علاقه‌مندان به حوزه داده و هوش مصنوعی می‌توانند بدون پرداخت هزینه و حتی نیاز به کارت اعتباری، به تمامی دوره‌ها و امکانات این پلتفرم دسترسی پیدا کنند.

https://www.datacamp.com/blog/datacamp-free-access-week

برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍1🔥1
@DataPlusScience___Guide to LLM.pdf
8 MB
📑 آموزش آسان مدل‌های بزرگ زبانی (Quick Guide to LLMs)

💡این فایل یک راهنمای کامل برای استفاده از مدل‌های بزرگ زبانی (LLMs)، مانند GPT و BERT، ارائه می‌دهد. با توضیح مباحثی از جمله مهندسی درخواست (Prompt Engineering) و تنظیمات تخصصی (Fine-Tuning)، این راهنما به شما کمک می‌کند تا از این مدل‌ها در برنامه‌های کاربردی خود به بهترین شکل بهره‌برداری کنید.

📄 ساختار فایل:

مقدمه‌ای بر LLMها: توضیح چیستی و کاربردهای مختلف
استراتژی‌های مهندسی درخواست: چگونگی بهینه‌سازی تعامل با مدل
تنظیمات تخصصی مدل‌ها: راه‌های بهبود عملکرد مدل‌ها برای وظایف خاص
پیاده‌سازی در ابر (Cloud Deployment): نکات کلیدی برای استقرار در فضای ابری


📢 #مدل_زبان_بزرگ #هوش_مصنوعی #مهندسی_درخواست #تنظیم_تخصصی #NLP #AI #CloudDeployment


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6🔥2
@DataPlusScience___Introduction to Building LLMs.pdf
8.4 MB
📊 ارائه مقدمه‌ای بر ساخت مدل‌های بزرگ زبانی دانشگاه استنفورد

💡 این فایل به بررسی مبانی، روش‌ها، و چالش‌های ساخت مدل‌های بزرگ زبانی (LLMs) در چارچوب دوره‌های دانشگاه استنفورد می‌پردازد. ابتدا مفاهیم کلیدی از جمله مدل‌سازی زبان (Language Modeling)، الگوریتم‌های آموزش و ارزیابی عملکرد توضیح داده شده و سپس روش‌های پردازش داده، قوانین مقیاس‌گذاری (Scaling Laws)، و استفاده از سیستم‌های سخت‌افزاری برای آموزش مدل‌های پیشرفته بیان شده‌اند. این فایل مروری بر مدل‌هایی چون GPT-3 و ChatGPT و روش‌های یادگیری تقویتی (Reinforcement Learning) ارائه می‌دهد.

📄 ساختار مطالب موجود در فایل:

مدل‌سازی زبان: معرفی مفاهیم اساسی پیش‌بینی توکن بعدی در جمله (Next-Word Prediction) و مدل‌های AR.
روش‌های آموزش و ارزیابی: ارزیابی با پرپلکسیتی (Perplexity) و استفاده از بازخورد انسانی.
قوانین مقیاس‌گذاری: تاثیر افزایش داده و مدل بر عملکرد و بهینه‌سازی منابع.
سیستم‌های پردازشی: روش‌های موازی‌سازی و فشرده‌سازی داده برای افزایش سرعت.


📢 #مدلهای_زبانی #استنفورد #پردازش_زبانی





📊👨‍🏫 @DataPlusScience | @DataScience
👍1
چهار نقش مختلف در علوم داده و تخصص‌های اصلی آن‌ها



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
5👍2
📊 کتابخانه‌های ضروری Python برای علم داده

💡 در این تصویر، مجموعه‌ای از کتابخانه‌های مهم Python که در علم داده استفاده می‌شوند، معرفی شده‌اند. این کتابخانه‌ها شامل ابزارهایی برای جمع‌آوری داده، پردازش، تحلیل، یادگیری ماشین، یادگیری عمیق، و استقرار مدل‌ها هستند.


کتابخانه Scrapy: جمع‌آوری داده و وب‌اسکرپینگ
کتابخانه pandas: دستکاری داده‌ها، پیش‌پردازش و تحلیل اکتشافی داده‌ها (EDA)
کتابخانه Matplotlib: تجسم داده‌ها
کتابخانه Statsmodels: تحلیل‌های آماری و سری زمانی
کتابخانه scikit-learn: یادگیری ماشین
کتابخانه TensorFlow: یادگیری عمیق
کتابخانه spaCy: پردازش زبان طبیعی
کتابخانه Flask: استقرار مدل
کتابخانه PySpark: داده‌های حجیم و محاسبات توزیع‌شده
کتابخانه Apache Airflow: اتوماسیون و ارکستراسیون جریان کاری


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍8
@DataPlusScience - GenAI Concepts.pdf
2.4 MB
📊 مفاهیم اساسی هوش مصنوعی مولد (GenAI Concepts)

💡 این فایل شامل توضیحاتی از جمله مدل‌های بزرگ زبان (LLMs)، مهندسی پرامپت، معماری Transformer، یادگیری تقویتی از بازخورد انسانی (RLHF)، و مسائل مربوط به حفظ حریم خصوصی است.

📄 محتویات داکیومنت:

مفاهیم فنی: توضیحاتی درباره مدل‌های بزرگ زبان (LLMs)، پرامپت و مهندسی پرامپت، معماری Transformer و یادگیری انتقالی.
مباحث عملیاتی: شامل توسعه، توزیع، و استقرار مدل‌ها و استفاده از کتابخانه‌های هوش مصنوعی.
نکات نظارتی: مسائل مرتبط با حریم خصوصی، امنیت داده، شفافیت، و استانداردهای هوش مصنوعی.

📢 #هوش_مصنوعی #هوش_مصنوعی_مولد #GenAI #حریم_خصوصی #LLM #MachineLearning #DataPrivacy


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍51
DataMining_Dr_Kaviani_@DataPlusScience.pdf
215.8 MB
🎁 جزوه دست‌نویس داده کاوی و یادگیری ماشین مقدماتی جناب دکتر کاویانی


@DataScience
🙏3
📊 معماری داده برای مدیریت و تحلیل

💡 این تصویر معماری داده را نمایش می‌دهد که شامل لایه‌های مختلفی از منابع داده، ذخیره‌سازی، تحلیل، امنیت و نمایش است. با این ساختار، سازمان‌ها می‌توانند داده‌های خود را مدیریت، تحلیل و مصورسازی کرده و استراتژی داده‌ای موثرتری ایجاد کنند:

منابع داده (Data Sources): شامل پایگاه داده‌ها، ویدئوها، تصاویر و حسگرها.
لایه ورود داده (Ingestion Layer): انتقال داده به پلتفرم.
لایه ذخیره‌سازی (Hadoop Storage Layer): HDFS و پایگاه‌های داده NoSQL.
لایه مدیریت (Hadoop Platform Management): ابزارهایی مانند Hive و MapReduce.
موتورهای تحلیل (Analytics Engines): تحلیل آماری، متنی، لحظه‌ای و موتور جستجو.
انبار داده (Data Warehouses): ذخیره و پردازش داده‌های تحلیل‌شده.
لایه امنیت (Security Layer): حفاظت از داده‌ها.
لایه نظارت (Monitoring Layer): نظارت بر عملکرد.
لایه نمایش (Visualization Layer): ابزارهای مصورسازی و تحلیل برای کاربران.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍3
📊 ابعاد رایج کیفیت داده (Common Dimensions of Data Quality)

💡 این تصویر که توسط Gartner ارائه شده است، ابعاد اصلی کیفیت داده را نمایش می‌دهد. این ابعاد برای اطمینان از قابل‌اعتماد بودن و کارآمدی داده‌ها در سازمان‌ها حیاتی هستند و شامل موارد زیر می‌شوند:

کامل بودن (Completeness): تمامی اطلاعات مورد نیاز در دسترس است.
کاربردپذیری (Usability): اطلاعات در قالبی مناسب ارائه می‌شوند.
دقت (Precision): اطلاعات به اندازه کافی جزئی و دقیق هستند.
به‌موقع بودن (Timeliness): دسترسی به اطلاعات بدون تأخیر انجام می‌شود.
صحت (Accuracy): اطلاعات واقعیت‌های دنیای واقعی را منعکس می‌کنند.
عدم تکرار (Non-duplication): داده‌ها فاقد تکرار و کپی هستند.
در دسترس بودن (Availability): اطلاعات در زمان نیاز موجود هستند.
اعتبار (Validity): داده‌ها مطابق با قوانین و قواعد تجاری هستند.
سازگاری (Consistency): داده‌ها با تعریف خود همخوانی دارند.


#کیفیت_داده #مدیریت_داده #گارتنر #DataQuality #Gartner #DataManagement #Analytics


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍21
@DataPlusScience - Gen AI tems Gloassary .pdf
3.4 MB
📊 مفاهیم اساسی هوش مصنوعی مولد (GenAI)

💡 این فایل به بررسی اصطلاحات فنی، عملیاتی و نظارتی مرتبط با هوش مصنوعی مولد (GenAI) می‌پردازد و مفاهیم پیچیده آن را با زبان ساده و قابل فهم توضیح می‌دهد. این سند به‌ویژه برای کسانی که قصد دارند از GenAI در کسب‌وکارها یا پروژه‌های تحقیقاتی خود استفاده کنند، مفید است.

📄 محتوای فایل:

هوش مصنوعی مولد (GenAI): معرفی و کاربردهای این فناوری در تولید متن، تصویر، موسیقی و ویدیو.
مدل‌های زبان بزرگ (LLMs): توضیح نحوه عملکرد مدل‌هایی چون GPT و PaLM در تولید محتوای متنی و تعامل با کاربر.
مهندسی پرامپت (Prompt Engineering): نحوه نوشتن ورودی‌های بهینه برای دستیابی به نتایج مطلوب در سیستم‌های GenAI.
چالش‌ها و مقررات: بررسی مسائل مرتبط با حریم خصوصی داده، ایمنی، شفافیت و حقوق کپی‌رایت در استفاده از هوش مصنوعی.

این فایل راهنمای جامعی برای درک عمیق‌تر هوش مصنوعی مولد و چالش‌های آن است و به شما کمک می‌کند تا درک درستی از استفاده، پیاده‌سازی و مقررات مربوط به این تکنولوژی داشته باشید.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
1
@DataPlusScience - Iran AI Index 2024.pdf
12.1 MB
📊 گزارش شاخص هوش مصنوعی ایران 2024

💡 این گزارش، وضعیت هوش مصنوعی در ایران را در سال 2024 تحلیل می‌کند و به بررسی دستاوردها، چالش‌ها و فرصت‌های این فناوری در کشور می‌پردازد. گزارش بر اساس مدل خاصی از تحلیل شاخص‌های هوش مصنوعی تهیه شده که شامل ارزیابی وضعیت فعلی، نوآوری‌ها و پیش‌بینی‌ها است.

فصل‌ها:

توسعه دانش
بررسی روندهای رشد و توسعه دانش در زمینه هوش مصنوعی.

انتشار دانش
تحلیل نحوه انتشار دانش و مقالات علمی مرتبط با هوش مصنوعی.

کسب‌وکار و فعالیت‌های کارآفرینانه
ارزیابی وضعیت استارتاپ‌ها و کسب‌وکارهای فعال در حوزه هوش مصنوعی.

جهت‌دهی به سیستم
تحلیل سیاست‌ها و استراتژی‌های حاکم بر سیستم‌های هوش مصنوعی در ایران.

شکل‌گیری بازار
بررسی بازار هوش مصنوعی در ایران و روندهای موجود در این بخش.

تأمین منابع
تحلیل منابع مالی و انسانی مورد نیاز برای پیشرفت و توسعه هوش مصنوعی.

مشروعیت‌بخشی
بررسی پروژه‌ها و اقدامات مربوط به مشروعیت‌سازی و پذیرش هوش مصنوعی در ایران.

نتیجه‌گیری و جمع‌بندی
جمع‌بندی نتایج و تحلیل نهایی وضعیت و آینده هوش مصنوعی در ایران.
👍5
🏴 شهادت بانوی دو عالم حضرت فاطمه زهرا سلام‌الله علیها را به تمامی شیعیان و محبان آن حضرت تسلیت و تعزیت عرض می‌نماییم.

@DataPlusScience | @DataScience
28🙏4👍2
@DataPlusScience_Top_50_LLM_Interview_Questions_and_Answers.pdf
7.1 MB
📖 50 سوال مهم مصاحبه برای مدل‌های زبانی بزرگ (LLMs)

💡 این فایل شامل سوالات کلیدی مرتبط با مدل‌های زبانی بزرگ و پاسخ‌های تخصصی به آن‌ها است. برای افراد علاقه‌مند به یادگیری مفاهیم پایه و پیشرفته در این حوزه بسیار مفید است. این سوالات مفاهیمی مانند توکن‌سازی (Tokenization)، تکنیک‌های بهینه‌سازی مانند LoRA و QLoRA، و مفهوم توجه چندسری (Multi-head Attention) را پوشش می‌دهند.

📄 رئوس سوالات:

توکن‌سازی و اهمیت آن: چرا و چگونه مدل‌های زبانی بزرگ متن را به توکن‌ها تقسیم می‌کنند؟
بهینه‌سازی حافظه با LoRA و QLoRA: کاهش مصرف حافظه بدون افت عملکرد.
تفاوت مدل‌های اتورگرسیو و ماسک‌شده: کاربردها و نقاط قوت هر روش.
مفاهیم پیشرفته مثل زنجیره افکار (Chain-of-Thought): بهبود توانایی استدلال مدل‌ها.
حل چالش‌های رایج مدل‌های زبانی بزرگ: از فراموشی فاجعه‌بار تا مدیریت منابع.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6
📊 نقشه ذهنی هوش مصنوعی مولد (Generative AI Mindmap)


مفاهیم اصلی: شامل شبکه‌های عصبی، خودرمزگذارها، مدل‌های انتشار، GANs، و مدل‌های زبان بزرگ.
کاربردها: تولید متن، ویدئو، تصویر، موسیقی، کد و تقویت داده‌ها.
تکنیک‌ها: یادگیری تقویتی، انتقال یادگیری، یادگیری چندنمونه‌ای، و مهندسی پرسش.
مدل‌های محبوب: GPT، Claude، DALL·E، BERT، CLIP، Mistral و Gemini.
منابع داده: دیتاست‌های متن (ویکی‌پدیا)، تصویر (COCO)، صوت (LibriSpeech)، ویدئو (YouTube).
ابزارها و چارچوب‌ها: TensorFlow، PyTorch، OpenAI API، Hugging Face، و Google Colab.
چالش‌ها: تعصب داده‌ای، نگرانی‌های اخلاقی، منابع محاسباتی، مقیاس‌پذیری و مصرف انرژی.
روندهای آینده: محتوای شخصی‌سازی‌شده، خلاقیت هوش مصنوعی، همکاری انسان-ماشین، و مدل‌های چندحالتی.
متریک‌های ارزیابی: امتیاز BLEU، ROUGE، Perplexity، و FID برای ارزیابی کیفیت مدل‌ها.


📊👨‍🏫 @DataPlusScience | @DataScience
👍2🔥1
@DataPlusScience_خلاصه_فارسی_گزارش_شاخص_هوش_مصنوعی_2024.pdf
567.4 KB
📊 خلاصه فارسی گزارش شاخص هوش مصنوعی 2024

💡 این فایل شامل نکات کلیدی گزارش بین‌المللی Artificial Intelligence Index Report 2024 است که توسط دانشگاه استنفورد منتشر شده است. این گزارش جامع به بررسی جنبه‌های مختلف پیشرفت در هوش مصنوعی، از جمله تحقیقات، عملکرد فنی، اقتصاد، مسائل اخلاقی، تنظیم مقررات، و کاربردها در علم، پزشکی و آموزش پرداخته است.

📄 ساختار کلی گزارش:

تحقیقات و توسعه: تسلط صنعت، رشد مدل‌های پایه، هزینه‌های بالا.
عملکرد فنی: پیشی‌گرفتن در برخی وظایف از انسان، چالش معیارهای سخت‌تر.
مسئولیت‌پذیری: نگرانی‌های اخلاقی، شفافیت کم.
اقتصاد: افزایش سرمایه‌گذاری، تغییر بازار کار.
علم و پزشکی: پیشرفت در کشف مواد و سیستم‌های پزشکی.
آموزش: رشد دانشجویان علوم کامپیوتر، کاهش تنوع جغرافیایی.
سیاست‌گذاری: رشد چشمگیر قوانین مرتبط با هوش مصنوعی.
افکار عمومی: نگرانی‌ها و امیدواری‌های جهانی نسبت به تأثیر هوش مصنوعی.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍41🔥1
Forwarded from Rade AI
📱 هفته پر ماجرای هوش مصنوعی

در هفته گذشته حدودا 1000 خبر در حوزه هوش مصنوعی اومد که در کانالمون منعکس کردیم. چون احتمالا وقت نمیکنید همه رو مثل ما مرور کنید، مهم‌ترین هاشو گلچین کردیم براتون.


1- عرض اولیه مدل ویدئوسازی OpenAI به نام Sora

2- رونمایی OpenAI از عامل هوش مصنوعی o1 در پاریس

3- معرفی فناوری جدید فاین تیونینگ هوش مصنوعی با RFT از OpenAI

4- طرح جدید ChatGPT Pro Premium با هزینه ۲۰۰ دلاری در ماه معرفی شد

5- نسل جدید هوش مصنوعی Google: Gemini 2.0

6- ابزار جدید گوگل برای انجام تحقیقات با استفاده از AI

7- پیشرفت جدید DeepMind در دنیای سه‌بعدی با Genie 2

8- پروژه جدید Astra و قابلیت‌های پیشرفته گوگل

9- مدل جدید Llama 3.3؛ پیشرفت در مدل‌های زبان بزرگ از Meta

10- معرفی Copilot Vision: تحولی در تعامل انسان و کامپیوتر

11- مدل جدید Aurora در xAI تصاویر فوق‌العاده واقعی تولید می‌کند

12- معرفی ابزار جدید ElevenLabs برای تولید پادکست با هوش مصنوعی

13- ابزار جدید Midjourney برای ساختن جهان‌های چندنفره

14- عرضه ویژگی دوبله خودکار YouTube برای محتواهای آموزشی

15- آینده‌ای بدون مرورگرهای سنتی به لطف هوش مصنوعی مایکروسافت

16- چالش عاشق کردن ربات AI و جایزه‌های بزرگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4
@DataPlusScience_60_Most_Asked_Data_Science_Interview_Questions.pdf
8 MB
📊 شصت پرسش‌ پرکاربرد در مصاحبه‌های علم داده


📌 این فایل شامل سوالات رایج و پاسخ‌های جامع در حوزه علم داده است. با مطالعه این مجموعه، برای مصاحبه‌های شغلی علم داده آمادگی کامل پیدا کنید. سوالات کدنویسی و سناریوهای واقعی نیز در این فایل بررسی شده‌اند.

💻 ساختار کلی فایل:
✔️ مفاهیم پایه: تفاوت یادگیری نظارت‌شده و نظارت‌نشده، اصول رگرسیون خطی و بایاس-واریانس.
🔍 سوالات متوسط: الگوریتم‌های خوشه‌بندی، جنگل تصادفی و تحلیل مؤلفه‌های اصلی (PCA).
⚡️ سوالات پیشرفته: شبکه‌های عصبی، تحلیل بقا، و مشکلات داده‌های نامتوازن.
🧑‍💻 سوالات کدنویسی: پیاده‌سازی الگوریتم‌هایی مانند K-means، درخت تصمیم و رگرسیون لجستیک.
📈 سوالات موردکاوی (Case-Based): تحلیل ریزش مشتری، پیش‌بینی فروش، و ساخت سیستم پیشنهادگر.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6
📊 انواع پایگاه‌های داده

این تصویر دسته‌بندی انواع پایگاه‌های داده را همراه با نمونه‌های مشهور نشان می‌دهد.

پایگاه‌های داده رابطه‌ای (Relational Databases):
داده‌ها در جداول با روابط مشخص ذخیره می‌شوند. نمونه‌ها: MySQL، PostgreSQL، Oracle Database.

پایگاه‌های داده NoSQL:
برای ذخیره داده‌های بدون ساختار یا نیمه‌ساختار و مدیریت حجم بالای داده‌ها با انعطاف‌پذیری بالا استفاده می‌شوند. نمونه‌ها: MongoDB، Couchbase.

پایگاه‌های داده زمانی (Time-Series Databases):
برای ذخیره و تحلیل داده‌های وابسته به زمان استفاده می‌شوند. نمونه‌ها: InfluxDB، Prometheus.

پایگاه‌های داده توزیع‌شده (Distributed Databases):
داده‌ها در چندین سرور توزیع شده و مقیاس‌پذیری بالایی دارند. نمونه‌ها: Apache Cassandra، Amazon DynamoDB.

پایگاه‌های داده در حافظه (In-Memory Databases):
داده‌ها در حافظه ذخیره می‌شوند و سرعت دسترسی بسیار بالایی دارند. نمونه‌ها: Redis، Memcached.


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍8🔥2
📦 50 کتابخانه برتر پایتون که باید در سال 2025 بشناسید

💡 این تصویر کتابخانه‌های مهم پایتون را در دسته‌بندی‌های کلیدی معرفی می‌کند که برای برنامه‌نویسان و محققان در حوزه‌های مختلف مانند علم داده، یادگیری ماشین، و توسعه وب اپلیکیشن ضروری هستند.

علم داده و پردازش داده‌ها: کتابخانه‌هایی مثل Pandas، NumPy و Polars برای مدیریت و تحلیل داده‌ها.
یادگیری ماشین: شامل Scikit-learn، XGBoost و LightGBM برای مدل‌سازی و تحلیل.
یادگیری عمیق: PyTorch، TensorFlow، و Keras برای ساخت و آموزش شبکه‌های عصبی.
پردازش زبان طبیعی (NLP): کتابخانه‌هایی مثل NLTK، Spacy، و Hugging Face برای تحلیل و پردازش متن.
بینایی کامپیوتر: OpenCV و Mahotas برای پردازش تصویر و ویدئو.
بصری‌سازی داده‌ها: Matplotlib، Seaborn و Plotly برای ایجاد نمودارهای حرفه‌ای.
هوش مصنوعی مولد: DALL-E 2، StyleGAN، و PEFT برای تولید محتوا و تصاویر.
توسعه وب اپلیکیشن: Streamlit و Dash برای ساخت برنامه‌های تعاملی وب.

مطالعه جزییات


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
7👍5
@DataPlusScience -Statistics Notes.pdf
4.7 MB
📘 یادداشت‌های آمار: راهنمای جامع مباحث آماری

💡 این فایل شامل مفاهیم پایه و پیشرفته آماری است که به صورت ساده و کاربردی توضیح داده شده‌اند. مباحث شامل انواع داده‌ها، آزمون‌های آماری و تکنیک‌های تحلیل داده است که برای دانشجویان و محققین مفید است.


📊 مفاهیم پایه: شامل آمار توصیفی (Descriptive Statistics) و استنباطی (Inferential Statistics).
📌 اندازه‌گیری گرایش مرکزی: میانگین (Mean)، میانه (Median) و مد (Mode).
📏 اندازه‌گیری پراکندگی: واریانس (Variance) و انحراف معیار (Standard Deviation).
🗂 انواع داده‌ها و مقیاس‌ها: داده‌های اسمی (Nominal)، ترتیبی (Ordinal)، فاصله‌ای (Interval) و نسبتی (Ratio).
🧪 آزمون‌های آماری: آزمون Z، آزمون T، آزمون خی دو (Chi-Square)، و تحلیل واریانس (ANOVA).
📈 توزیع‌های احتمالی: توزیع نرمال (Normal Distribution)، دوجمله‌ای (Binomial) و پواسون (Poisson).
🧮 قضیه حد مرکزی (Central Limit Theorem): تحلیل توزیع نمونه‌ها با اندازه‌های بزرگ.
🔗 تحلیل داده‌های پراکنده: کوواریانس (Covariance) و همبستگی (Correlation).


📊👨‍🏫 @DataPlusScience | @DataScience
👍4
هوش مصنوعی و علم داده به فارسی
📊 کانال DataScience در سال 2023 🌟 115 پست جدید منتشر شده 📈 967 عضو جدید 👁 152 هزار بازدید کننده 🤝 و مجموعا 6100 اشتراک محتوا توسط کاربران ان‌شاالله در سال 2024 تعداد مطالب بیشتری در کانال منتشر خواهد شد برای آموزش علم داده به جمع ما بپیوندید:…
📊 آمار کانال ما در سال 2024 📊

162 پست جدید منتشر شد.
👥 2800 عضو جدید به خانواده ما پیوستند.
👁 314,270 بازدید از مطالب منتشر شده صورت گرفت.
📤 10,932 اشتراک‌گذاری در پیام‌های خصوصی انجام شد.

امیدواریم گامی مثبت در ترویج و آموزش علوم داده برداشته باشیم و از شما بابت این همراهی صمیمانه سپاسگزاریم. 🙏🌟


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
7👍4