هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
262 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #2
از شنبه 1405/03/09 ساعت 14:00
تا یکشنبه 1405/03/10 ساعت 14:00
━━━━━━━━━━━━━━━

خلاصه دوره‌ای پست‌های هوش مصنوعی و علم داده (24 ساعت گذشته)


مدل‌های هوش مصنوعی و کاربردهای رباتیک

مدل جدید Qwen-VLA از شرکت Qwen (زیرمجموعه Alibaba) معرفی شده است که قابلیت کنترل انواع ربات‌ها را بدون نیاز به تنظیمات مجزا برای هر پلتفرم فراهم می‌کند. این مدل با دریافت تصویر و دستور متنی، قادر به انجام وظایفی مانند دستکاری اشیاء و ... است.
لینک پست


هزینه توکن‌ها در عامل‌های هوش مصنوعی (AI Agents)

عامل‌های هوش مصنوعی (AI Agents) که قابلیت برنامه‌ریزی، فراخوانی ابزارها، بررسی نتایج و اصلاح خطاها را دارند، نسبت به چت‌بات‌های ساده، به توکن‌های بسیار بیشتری (گاهی تا ۵۰-۱۰۰ برابر) نیاز دارند. گلدمن ساکس پیش‌بینی می‌کند تا سال ۲۰۳۰ مصرف توکن این عامل‌ها به شدت افزایش یابد.
لینک پست


بازدهی هوش مصنوعی در شرکت‌ها و نیاز به مهارت‌های AI

تحقیقات اخیر نشان می‌دهد که بیش از ۸۰٪ شرکت‌ها هنوز شاهد افزایش بهره‌وری ناشی از هوش مصنوعی نبوده‌اند، علی‌رغم سرمایه‌گذاری‌های کلان. در اروپا، مهارت‌های مرتبط با هوش مصنوعی به‌سرعت در بازار کار رشد کرده و حدود یک‌پنجم مشاغل به این مهارت‌ها نیاز دارند که سه برابر تعداد دو سال پیش است. «AI fluency» (توانایی تعامل موثر با مدل‌های هوش مصنوعی) پرتقاضاترین مهارت محسوب می‌شود.
لینک پست
لینک پست


ابزارها و محیط‌های شبیه‌سازی برای عامل‌های هوش مصنوعی

مجموعه قواعد Agent-Rules-Books، اصولی از کتاب‌های مرجع را برای تزریق به مدل‌های زبانی بزرگ (LLM) گردآوری کرده تا کیفیت کدهای تولیدی توسط هوش مصنوعی را ارتقا دهد. همچنین، پلتفرم Emergence World برای شبیه‌سازی دنیای واقعی راه‌اندازی شده است، تا عامل‌های هوش مصنوعی (AI agents) برای بقا، همکاری یا سقوط در محیطی با حافظه و ابزارهای متنوع تلاش کنند.
لینک پست
لینک پست


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
Media is too big
VIEW IN TELEGRAM
🤖 آینده شرکت‌ها در عصر هوش مصنوعی

‏اریک اشمیت، مدیرعامل سابق گوگل، پیش‌بینی می‌کند که با پیشرفت هوش مصنوعی، شاهد کاهش تعداد شرکت‌های متوسط و افزایش چشمگیر تعداد شرکت‌های کوچک خواهیم بود، چرا که نیاز به نیروی انسانی در سازمان‌ها به شدت کاهش می‌یابد.


🔹 پیش‌بینی اشمیت: تمرکز بر شرکت‌های بزرگ و کوچک
🔸 دلیل کاهش شرکت‌های متوسط: اتوماسیون و کاهش نیاز به نیروی انسانی


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #Google
💡 کاهش مصرف توکن با Graphify

🤖 ابزار Graphify راهکاری نوین برای بهینه‌سازی مصرف توکن در مدل‌های هوش مصنوعی ارائه می‌دهد. این ابزار با تبدیل کل کدبیس (مجموعه کدهای یک پروژه نرم‌افزاری) به یک ساختار گراف، به مدل‌ها امکان می‌دهد تا به جای بازخوانی مکرر کدها، به صورت کارآمد در ساختار کد پیمایش کنند.

🚀 این رویکرد نوآورانه منجر به کاهش قابل توجه مصرف توکن تا ۷۰ درصد می‌شود که بهره‌وری و سرعت پردازش مدل‌ها را به شکل چشمگیری بهبود می‌بخشد.

🔗 مخزن GitHub Graphify

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #Graphify
🤖 معرفی M3: مدل مولتی‌مودال متن‌باز MiniMax

‏شرکت MiniMax مدل جدید متن‌باز خود به نام M3 را معرفی کرده است که برای وظایف کدنویسی، عامل‌های هوشمند (agents) و پردازش چندوجهی (multimodal) طراحی شده است. این مدل توانایی پردازش متن طولانی تا ۱ میلیون توکن را با استفاده از مکانیزم MiniMax Sparse Attention (مکانیزم توجه پراکنده برای پردازش سریع‌تر متون طولانی) داراست و از انواع مختلف داده‌ها پشتیبانی می‌کند.

نتایج بنچمارک‌ها نشان‌دهنده عملکرد قوی M3 در وظایف مرتبط با کدنویسی و پردازش متن است، به طوری که در برخی معیارها از مدل‌هایی مانند Opus و GPT-4 پیشی گرفته است. MiniMax همچنین محیطی اختصاصی به نام MiniMax Code را بر پایه این مدل برای توسعه‌دهندگان کد عرضه کرده است.

📖 MiniMax Platform API

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #MiniMax
🤖 آموزش LLM از صفر با PyTorch

🚀 این مخزن PyTorch به نام "Train LLM From Scratch" یک راهنمای عملی برای ساخت، آموزش و استفاده از مدل زبان ترانسفورمر (Transformer Language Model) از پایه است.
💡 هدف آن تبدیل درک نظری از معماری ترانسفورمر به یک پایپ‌لاین آموزشی عملی و قابل اجرا، شامل کد مدل، اسکریپت‌های داده، پیکربندی و تولید متن است.


⚙️ ویژگی‌های کلیدی:
🔹 اجزای ترانسفورمر: پیاده‌سازی ماژول‌های PyTorch جداگانه برای MLP (شبکه چندلایه پرسپترون)، Attention و بلاک‌های ترانسفورمر از صفر.
🔸 پایپ‌لاین داده: اسکریپت‌هایی برای دانلود و پیش‌پردازش فایل‌های The Pile (مجموعه داده بزرگ متنی) به فرمت HDF5 (فرمت فایل برای ذخیره‌سازی داده‌های عددی بزرگ) توکن‌گذاری شده.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #PyTorch
🤖 نقشه جامع مهندسی هوش مصنوعی

🚀 مهندسی هوش مصنوعی شامل چهار رکن اساسی است: پایه‌های برنامه‌نویسی (Python، APIها، JSON، Git، Linux و مفاهیم ابری)؛ مفاهیم LLM (توکن‌ها، پنجره‌های زمینه، Embeddings، Attention، Fine‑Tuning و Inference)؛ مهندسی پرامپت (Zero‑Shot، Few‑Shot، Chain of Thought، خروجی‌های ساختاریافته، System Prompts و Prompt Chaining)؛ و RAG (تقسیم‌بندی متن، Embeddings، پایگاه‌های وکتور، بازیابی، Re‑ranking و استناد).

⚙️ علاوه بر این، ساختارهای پیشرفته شامل عامل‌های هوش مصنوعی (فراخوانی ابزار، حافظه، برنامه‌ریزی، سیستم‌های چندعامله، بازنگری و جریان‌های کاری) و ارائه‌دهندگان مدل (OpenAI، Anthropic، Google، Meta، Mistral و DeepSeek) را می‌توان در چارچوب‌های LangChain، LlamaIndex، CrewAI و دیگر ابزارهای متن باز به کار گرفت.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #AIEngineering
Transformers & LLMs Cheatsheet.pdf
1.4 MB
🚀 راهنمای جامع مدل‌های زبانی بزرگ (LLM)
‏این راهنما مفاهیم اصلی، معماری‌ها و کاربردهای عملی مدل‌های زبانی بزرگ (LLM) را پوشش می‌دهد.
💡 مفاهیم پایه شامل توکن‌ها (tokenization, BPE)، امبدینگ‌ها (embeddings) و مکانیزم توجه (Attention mechanism, Multi-Head Attention) هستند.
🗼 معماری ترنسفورمر (Transformer) و انواع آن مانند BERT (فقط انکودر)، GPT (فقط دیکودر) و T5 (انکودر-دیکودر) بررسی شده‌اند.
⚙️ در بخش مدل‌های زبانی بزرگ، تکنیک‌های Prompting (context length, Chain-of-Thought)، پیش‌آموزش (Pre-training, SFT, PEFT/LoRA)، تنظیم بر اساس ترجیحات (Preference tuning, Reward Model, Reinforcement Learning) و بهینه‌سازی‌ها (Optimizations, Mixture of Experts, Distillation, Quantization) توضیح داده شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #RAG
🤖 منابع رایگان آموزش هوش مصنوعی از غول‌های فناوری
‏دسترسی رایگان به دوره‌ها و منابع آموزشی هوش مصنوعی از شرکت‌های پیشرو مانند Anthropic، Google، Meta، NVIDIA، Microsoft، OpenAI، IBM، AWS، DeepLearning.AI و Hugging Face فراهم شده است. این منابع طیف وسیعی از موضوعات مرتبط با هوش مصنوعی را پوشش می‌دهند.


💡 شرکت Anthropic دوره‌هایی را از طریق skilljar.com ارائه می‌دهد.
💡 Google پلتفرم grow.google/ai را برای آموزش هوش مصنوعی معرفی کرده است.
💡 Meta منابع خود را در ai.meta.com/resources/ در دسترس قرار داده است.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #OpenAI
🤖 معماری واقعی ایجنت‌های هوش مصنوعی فراتر از LLM
‏ایده رایج که ایجنت‌های هوش مصنوعی صرفاً ترکیبی از مدل‌های زبانی بزرگ (LLM) و پرامپت‌ها هستند، اغلب منجر به شکست این ایجنت‌ها در وظایف پیچیده می‌شود. در واقعیت، LLM تنها یک لایه از معماری پیچیده‌تر است.
💡 یک ایجنت واقعی فراتر از پاسخگویی ساده به پرسش‌ها عمل می‌کند؛ بلکه قادر به درک زمینه، انتخاب ابزار مناسب، تفویض وظایف به زیرایجنت‌ها، اجرای اقدامات، مشاهده نتایج و بهبود گام‌های بعدی است. این تحول از مدل "پرسش → پاسخ" به "استدلال → عمل → مشاهده → تکرار" نشان‌دهنده آینده هوش مصنوعی است که بر ارکستراسیون (هماهنگ‌سازی) بهتر تاکید دارد.


🔹 اجزای کلیدی معماری ایجنت:
‏ - 🧠 Claude: موتور استدلال اصلی.
‏ - 📚 Skills: دانش تخصصی دامنه را به ایجنت می‌آموزد.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #AgentAI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 کامپیوترهای شخصی آینده با هوش مصنوعی همکار می‌شوند

‏NVIDIA با معرفی پلتفرم RTX Spark، نسل جدیدی از کامپیوترهای شخصی با تمرکز بر هوش مصنوعی را رونمایی کرده است. این سیستم‌ها قادرند عامل‌های هوش مصنوعی پیشرفته (AI agents) را مستقیماً روی دستگاه اجرا کنند، به جای ارسال پردازش‌ها به فضای ابری. این تحول به کامپیوترهای شخصی امکان می‌دهد تا وظایفی مانند تحقیق، تحلیل، خلق محتوا و اتوماسیون را به صورت محلی و با حفظ حریم خصوصی داده‌ها انجام دهند.

💡 مایکروسافت در حال بازطراحی بخش‌هایی از سیستم‌عامل ویندوز برای پشتیبانی از عامل‌های هوش مصنوعی است و نرم‌افزارهای خلاقانه مانند فتوشاپ و پریمیر نیز برای بهره‌مندی از هوش مصنوعی روی دستگاه، در حال به‌روزرسانی هستند.

📖 NVIDIA RTX Platform

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 سیستم چندعاملی برای تحقیقات عمیق

‏یک سیستم چندعاملی (multi-agent system) برای خودکارسازی فرآیندهای تحقیقات عمیق و گزارش‌دهی توسعه یافته است. این سیستم قادر به انجام تحقیقات پیچیده و تولید گزارش‌های جامع به صورت خودکار است.


🔹 🔗 این سیستم در مخزن deepresearch در گیت‌هاب موجود است.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #AgentAI
🚀 انویدیا و مایکروسافت کامپیوترهای شخصی را برای عصر هوش مصنوعی بازتعریف کردند

انویدیا و مایکروسافت پلتفرم جدیدی برای کامپیوترهای شخصی و لپ‌تاپ‌ها معرفی کرده‌اند که بر پایه پردازنده‌های RTX Spark Superchip (شامل GPU، CPU و حافظه یکپارچه) بنا شده است. این معماری مشابه تراشه‌های سری M اپل و مبتنی بر Arm است که به بهره‌وری انرژی بالا منجر می‌شود.

💡 هدف اصلی این نوآوری، امکان اجرای مدل‌های زبان بزرگ (LLM) با ۱۲۰ میلیارد پارامتر به صورت محلی بر روی دستگاه‌های شخصی است. این امر از طریق فراهم کردن ۱۲۸ گیگابایت حافظه در کامپیوترها و لپ‌تاپ‌های آینده محقق خواهد شد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
Media is too big
VIEW IN TELEGRAM
🚗 مدل هوش مصنوعی جدید نVIDIA برای خودروهای خودران

‏شرکت NVIDIA جدیدترین مدل باز هوش مصنوعی خود را برای خودروهای خودران معرفی کرد: Alpamayo 2 Super. این مدل با 32 میلیارد پارامتر، سه برابر بزرگتر از نسل قبلی خود است و برای مدیریت واقعیت پیچیده رانندگی در دنیای واقعی طراحی شده است.

‏این مدل می‌تواند همه چیز اطراف خودرو را در 360° ردیابی کند، موقعیت‌های پیچیده جاده را در 3D درک نماید، رفتار رانندگان دیگر را پیش‌بینی کند و تصمیمات لحظه‌ای مانند زمان اتصال، عقب‌نشینی یا ترمز بگیرد.

‏یکی از بزرگ‌ترین ارتقاء‌های این مدل، پشت فرمان نیست: این هوش مصنوعی می‌تواند حجم عظیمی از فیلم‌های رانندگی را به‌طور خودکار برچسب‌گذاری کند، فرآیندی که قبلاً ماه‌ها زمان می‌برد را به چیزی که می‌تواند در چند روز انجام شود تبدیل می‌کند.

‏مهم‌تر از همه، مدل می‌تواند دلایل منطقی پشت تصمیماتش را توضیح دهد، مرحله‌ای حیاتی برای ایجاد اعتماد در خودروهای خودران.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
📚 لیست منابع جامع هوش مصنوعی AI_Books

💡 AI_Books یک مخزن GitHub عمومی است که مجموعه‌ای از کتاب‌ها و آموزش‌های حوزه‌های هوش مصنوعی، یادگیری ماشین، یادگیری عمیق و شبکه‌های عصبی را گردآوری کرده است.
🎯 این منبع به شما کمک می‌کند تا با سازماندهی مواد آموزشی بر اساس موضوع، مسیر مطالعاتی خود را منظم کنید و از سردرگمی در میان منابع پراکنده جلوگیری نمایید.
ویژگی‌های اصلی شامل لینک به کتاب‌های آنلاین (مانند Neural Networks and Deep Learning و Deep Learning انتشارات MIT Press)، بخش مبانی ریاضی (شامل جبر خطی و Artificial Intelligence: A Modern Approach) و مسیرهای تخصصی یادگیری عمیق با تمرکز بر پایتون، R، TensorFlow/Keras و کاربردها می‌شود.


https://github.com/aridiosilva/AI_Books

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #GitHub
🚀 انویدیا با RTX Spark وارد رقابت با اپل می‌شود
🚀 انویدیا از RTX Spark رونمایی کرد، یک تراشه ARM که برای رقابت با سری M اپل در بازار لپ‌تاپ‌ها طراحی شده است. این تراشه با پشتیبانی از حداکثر ۱۲۸ گیگابایت حافظه LPDDR5X با پهنای باند ۳۰۰ گیگابایت بر ثانیه از طریق NVLink C2C، امکان اجرای مدل‌های زبانی بزرگ (LLM) و مدل‌های دیفیوژن را با حافظه یکپارچه و بدون تفکیک بین CPU و GPU فراهم می‌سازد.
💻 این پلتفرم جدید از تمام قابلیت‌های انویدیا مانند CUDA، TensorRT، DLSS و Ray Tracing پشتیبانی می‌کند و توسعه‌دهندگان CUDA می‌توانند از آن به صورت نیتیو استفاده کنند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
🤖 دسترسی رایگان هفته‌ای DataCamp

🚀 از امروز تا ۱۶ خرداد می‌توانید به تمام دوره‌های DataCamp به‌صورت کامل و رایگان دسترسی پیدا کنید و حتی گواهینامه دریافت کنید. این فرصت مناسب برای تقویت مهارت‌های داده‌محور و یادگیری مسیرهای جدید است.

📖 DataCamp Free Access Week

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#رویداد #DataScience