هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
262 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 ساخت مدل‌های زبانی بزرگ (LLM) شبیه GPT از ابتدا با PyTorch

‏این پروژه آموزشی در 10 نوت‌بوک، معماری مدل‌های زبانی بزرگ (LLM) را به بخش‌های ساده تقسیم کرده و امکان ساخت آن‌ها را از ابتدا با استفاده از فریم‌ورک PyTorch فراهم می‌کند. این مجموعه کاملاً عملی و مناسب برای افراد مبتدی است.


🔹 این مجموعه شامل ۱۰ نوت‌بوک است که توضیحات گام‌به‌گام ارائه می‌دهند.
🔸 هدف اصلی شکستن معماری پیچیده LLMها به اجزای قابل فهم است.
💡 محتوا کاملاً عملی (hands-on) است و برای شروع یادگیری LLMها توسط مبتدیان طراحی شده.


🔗 مخزن GitHub

📊 DataScience — هوش مصنوعی و علم داده به فارسی


#آموزش #GPT4o
🤖 آپدیت بزرگ Claude Opus 4.8 از Anthropic
⚡️ مدل Claude Opus 4.8 با تمرکز بر صداقت و توانایی تشخیص خطای خود، جهش قابل توجهی داشته است. این نسخه قادر است مشکلات کد خود را چهار برابر بیشتر شناسایی کند.

🔸 همچنین، ویژگی گردش‌کارهای پویا (dynamic workflows) معرفی شده است که به صدها زیر-عامل هوش مصنوعی اجازه می‌دهد به صورت موازی روی پروژه‌های بزرگ و مهاجرت‌ها کار کنند.


🔹 صداقت بیشتر: Claude Opus 4.8 در ارزیابی خروجی‌های خود و شناسایی مشکلات کد، بسیار دقیق‌تر عمل می‌کند.
💡 همکاری چندعاملی: امکان اجرای صدها عامل هوش مصنوعی به صورت همزمان برای تسریع پروژه‌های پیچیده فراهم شده است.

🚀 جزئیات بیشتر در: خبر رسمی Anthropic

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Claude
Media is too big
VIEW IN TELEGRAM
🚀 به‌روزرسانی بزرگ Google Colab با تمرکز بر AI

‏گوگل Colab را با رویکرد «AI-first» به‌طور گسترده‌ای بازطراحی کرده است. این به‌روزرسانی شامل ادغام بومی یک عامل علم داده مبتنی بر Gemini در رابط کاربری است که به کاربران امکان می‌دهد تا به کمک هوش مصنوعی، وظایف پیچیده علم داده را با سهولت بیشتری انجام دهند.



💡 اکنون ویرایشگر Colab بیشتر شبیه به Cursor شده است و عامل Gemini (نسخه به‌روزشده) به صورت داخلی در رابط کاربری تعبیه شده است.
🎯 این عامل نه تنها در سلول‌ها قابل فراخوانی است، بلکه یک نوار ابزار جدید در پایین صفحه، پنجره‌ای در سمت راست برای بحث و اجرای کامل پایپ‌لاین‌ها با مدل باز می‌کند.
عامل Gemini کل نوت‌بوک را به عنوان زمینه درک می‌کند و می‌تواند به صورت مستقل سلول‌ها را ایجاد و اجرا کند، فایل‌ها را تحلیل کند، نمودار بسازد و مدل‌ها را آموزش دهد.
🛠 علاوه بر این، پیشنهادات خودکار برای رفع خطاها به صورت تفاوت (diffs) مستقیماً درون سلول‌ها نمایش داده می‌شوند که کارایی را افزایش می‌دهد.
🔄 گوگل قول داده است که به زودی «ویژگی‌ها، ادغام‌ها و عامل‌های بیشتری» را به Colab اضافه کند.


📊 DataScience
🚀 کاهش قیمت API مدل‌های MiMo-V2.5 شیائومی

‏شیائومی قیمت API خانواده MiMo-V2.5 را به طور قابل توجهی کاهش داد. برای نسخه MiMo-V2.5-Pro، هزینه ورودی بدون کش ۷۸ درصد و هزینه تولید توکن ۸۶ درصد کاهش یافته است. همچنین، سیستم اشتراک به مدل امتیازدهی تغییر کرده که با وجود ثابت ماندن تعرفه‌های ماهانه، سقف توکن‌ها را از ۴.۱ میلیارد به ۸۲ میلیارد افزایش داده است.


🔹 هزینه: ۱ میلیون توکن ورودی کش‌شده برای MiMo-V2.5-Pro اکنون $۰.۰۰۳۶ است.
🔸 برای: نسخه پایه MiMo-V2.5، ورودی کش‌شده $۰.۰۰۲۸، ورودی بدون کش $۰.۱۴ و خروجی $۰.۲۸ به ازای ۱ میلیون توکن هزینه دارد.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #MiMo
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 پلاگین امنیتی Claude Code برای شناسایی آسیب‌پذیری کد

‏Anthropic پلاگینی جدید برای Claude Code منتشر کرده است که کد را حین ویرایش از نظر آسیب‌پذیری بررسی می‌کند. این ابزار به صورت یک security-hook عمل کرده و با شناسایی مشکلات قبل از مرحله Pull Request، تا 40% در زمان بازبینی نهایی کد صرفه‌جویی می‌کند.



🔹 شناسایی خودکار: پلاگین به طور خودکار هنگام ذخیره و ویرایش فایل‌ها فعال شده و مشکلات امنیتی را قبل از ارسال کد برای بازبینی شناسایی می‌کند.
🔸 الگوهای ناامن: علاوه بر آسیب‌پذیری‌های آشکار، این ابزار قادر به تشخیص الگوهای کد ناامن و جلوگیری از دسترسی عوامل هوش مصنوعی به فایل‌های حساس است.
💡 دسترسی رایگان: این پلاگین برای تمام کاربران Claude Code به صورت رایگان در دسترس است.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Anthropic
🤖 LLMها در پیش‌بینی اکتشافات علمی ناتوانند

‏تحقیقات جدیدی از دانشگاه آکسفورد، استنفورد و موسسه آلن نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) فعلی در پیش‌بینی اکتشافات علمی آینده عملکرد ضعیفی دارند. این مدل‌ها که بر اساس داده‌های موجود آموزش دیده‌اند، در پاسخ به سوالات درباره رویدادهای آینده، اغلب با اتکا به دانش گذشته، پاسخ‌های نادرستی ارائه می‌دهند.

⚡️ برای ارزیابی دقیق‌تر، بنچمارک CUSP (مخفف عبارت انگلیسی) طراحی شده است که مدل‌ها را مجبور می‌کند تا بر اساس اطلاعات موجود تا یک تاریخ مشخص، آینده را پیش‌بینی کنند. در این بنچمارک، مدل‌هایی مانند GPT-4.5 و Claude Sonnet 4.5 در انتخاب جهت‌گیری‌های فنی احتمالی عملکرد نسبتاً خوبی داشتند (حدود ۸۲٪ دقت)، اما در پیش‌بینی وقوع یا عدم وقوع یک دستاورد خاص، دقت آن‌ها به حد شانس (۴۵-۵۲٪) کاهش یافت.

🟡 Arxiv
📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
🚀 نقشه راه جامع مهندسی هوش مصنوعی

‏این نقشه راه ۸ مرحله‌ای، مسیر یادگیری مهندسی هوش مصنوعی را از مبانی برنامه‌نویسی تا استقرار مدل‌ها و ساخت پروژه‌های واقعی پوشش می‌دهد. مراحل شامل یادگیری زبان پایتون، ساختار داده، الگوریتم‌ها، کار با داده، یادگیری ماشین، یادگیری عمیق، هوش مصنوعی مولد (Generative AI)، اتوماسیون و عامل‌های هوشمند، و در نهایت استقرار و MLOps است.

🔹 مرحله ۱: مبانی برنامه‌نویسی با پایتون، ساختار داده، الگوریتم‌ها، APIها، JSON و مفاهیم شی‌گرایی (OOP) آغاز می‌شود. ابزارهای کلیدی شامل Visual Studio Code، Git و GitHub هستند.
🔸 مرحله ۲: پردازش و تحلیل داده شامل پاکسازی داده، بصری‌سازی، مهندسی ویژگی (Feature Engineering) و مبانی SQL است. کتابخانه‌های مهم عبارتند از Pandas، NumPy و Matplotlib.
💡 مرحله ۳: یادگیری ماشین به یادگیری نظارت‌شده (Supervised Learning)، نظارت‌نشده (Unsupervised Learning)، آموزش مدل و ارزیابی آن می‌پردازد. چارچوب‌های اصلی Scikit-learn و XGBoost هستند.
🧠 مرحله ۴: یادگیری عمیق شامل شبکه‌های عصبی، CNN، RNN، ترنسفورمرها (Transformers) و تنظیم دقیق مدل‌ها (Fine-Tuning) است. چارچوب‌های کلیدی TensorFlow، PyTorch و Keras می‌باشند.
🚀 مرحله ۵: هوش مصنوعی مولد و LLMها بر مهندسی پرامپت (Prompt Engineering)، چت‌بات‌های هوش مصنوعی، کاربردهای RAG (Retrieval-Augmented Generation) و عامل‌های هوش مصنوعی تمرکز دارد. ابزارهای مهم شامل ChatGPT، LangChain، LlamaIndex و Hugging Face Transformers هستند.
⚡️ مرحله ۶: اتوماسیون و عامل‌های هوش مصنوعی شامل اتوماسیون گردش کار، سیستم‌های هوش مصنوعی خودکار، فراخوانی ابزار (Tool Calling) و سیستم‌های چندعاملی (Multi-Agent Systems) است. پلتفرم‌های یادگیری شامل n8n، CrewAI و AutoGen هستند.
☁️ مرحله ۷: استقرار و MLOps به توسعه API، Docker، Kubernetes، مبانی CI/CD و استقرار در ابر (Cloud Deployment) می‌پردازد. پلتفرم‌های کلیدی FastAPI، Docker، Kubernetes و AWS هستند.
🎯 مرحله ۸: ساخت پروژه‌های واقعی مهندسی هوش مصنوعی برای تقویت مهارت‌ها با پروژه‌هایی مانند تحلیلگر رزومه، ربات پشتیبانی مشتری، محصول SaaS مبتنی بر هوش مصنوعی، دستیار صوتی و سیستم اتوماسیون گردش کار.


🔹 ابزارهای برنامه‌نویسی مانند Visual Studio Code برای ویرایش کد و Git/GitHub برای مدیریت نسخه ضروری هستند.
🔸 کتابخانه‌های کلیدی علم داده شامل Pandas برای دستکاری داده، NumPy برای محاسبات عددی و Matplotlib برای بصری‌سازی است.
💡 چارچوب‌های یادگیری عمیق مانند TensorFlow و PyTorch امکان ساخت و آموزش شبکه‌های عصبی پیچیده را فراهم می‌کنند.
🧠 ابزارهای هوش مصنوعی مولد مانند LangChain و LlamaIndex به توسعه برنامه‌های مبتنی بر LLM کمک می‌کنند.
🚀 پلتفرم‌های اتوماسیون مانند CrewAI و AutoGen برای ساخت سیستم‌های چندعاملی کارآمد هستند.
☁️ ابزارهای استقرار مانند Docker و Kubernetes برای بسته‌بندی و مدیریت برنامه‌های هوش مصنوعی در محیط‌های مختلف حیاتی‌اند.



📊 DataScience — هوش مصنوعی و علم داده به فارسی


#آموزش #Transformers
🤖 SkillOpt مایکروسافت: بهینه‌سازی مهارت ایجنت‌ها بدون تغییر مدل

‏مایکروسافت SkillOpt را معرفی کرده، روشی برای آموزش مهارت‌های ایجنت‌های هوش مصنوعی بدون نیاز به بازآموزی مدل پایه. این رویکرد، فایل دستورالعمل‌های ایجنت را به عنوان آرتیفکتی قابل آموزش در نظر می‌گیرد.

💡 به جای دستکاری مدل، یک مدل بهینه‌ساز مجزا تغییرات دقیقی را در سند مهارت پیشنهاد می‌دهد. این تغییرات تنها در صورت بهبود عملکرد بر روی مجموعه اعتبارسنجی پذیرفته می‌شوند.

📊 نتایج نشان داد که SkillOpt بر روی 6 بنچمارک، 7 مدل و 3 حالت کاری (direct chat, Codex, Claude Code) آزمایش شد و در تمام 52 مورد بررسی شده، بهترین یا هم‌رده بهترین عملکرد را داشت.

arxiv.org/abs/2605.23904


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#محصول #AgentAI
🤖 رشد ارجاع‌های ساختگی در مقالات علمی

بررسی ۲.۵ میلیون مقاله نشان داد که در سال ۲۰۲۵ حدود ۱۴۷,۰۰۰ ارجاع به مطالعات غیرموجود منتشر شد. این ارجاعات توسط سیستم‌های هوش مصنوعی ساخته‌شده و بدون کشف به متون علمی اضافه شده‌اند. نرخ وقوع این پدیده از یک بار در هر ۲,۸۲۸ مقاله در ۲۰۲۳ به پیش‌بینی یک بار در هر ۲۷۷ مقاله تا اوایل ۲۰۲۶ ارتقا یافته است.


🔹 آمار کل: حدود ۱۴۷,۰۰۰ ارجاع ساختگی در سال ۲۰۲۵ ثبت شد.
🔸 منشأ: تولید خودکار توسط سامانه‌های AI بدون کنترل کیفیت.
💡 روند افزایشی: از ۱/۲,۸۲۸ (۲۰۲۳) به ۱/۲۷۷ (۲۰۲۶) پیشروی کرده و شتابی افزایشی دارد.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #RLHF
🚀 دوره متن‌باز مهندسی هوش مصنوعی

🔹 دوره شامل 435 درس (پوشش کامل مبانی تا پیشرفته) و بیش از 320 ساعت محتوا است که هم‌زمان با مثال‌های عملی ارائه می‌شود.
🔸 محور یادگیری در این مسیر، استفاده از Python، TypeScript و Rust برای ساخت AI agents، سرورهای MCP، پرامپت‌ها و مهارت‌های هوش مصنوعی است.
💡 پلتفرم به‌عنوان یک نقشه راه جامع، تمام مباحث مهندسی AI را از صفر تا استقرار واقعی پوشش می‌دهد.

GitHub Repository


🔹 زبان‌ها: ترکیب Python برای علم داده، TypeScript برای برنامه‌نویسی وب، و Rust برای بهینه‌سازی سیستمی.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #AgentAI
🤖 ۱ مخزن Transformer برای Vision، Audio و Agents

🔹 این مخزن (transformers-the-definitive-guide) پیاده‌سازی‌های جامع Transformer را برای کاربردهای بینایی ماشین، پردازش صوتی و عوامل هوش مصنوعی فراهم می‌کند.
💡 شامل مثال‌ها و اسکریپت‌های آماده است که می‌توانند به‌سرعت در پروژه‌های تحقیقاتی یا تولیدی ادغام شوند.


🔸 Vision: مدل‌های Vision Transformer (ViT) برای تشخیص تصویر و طبقه‌بندی ارائه شده‌اند.
🔹 Audio: پیاده‌سازی‌های Whisper و مدل‌های توجه‌پراکنده برای پردازش گفتار موجود‌اند.
💡 Agents: چارچوب‌های RLHF (آموزش تقویتی با بازخورد انسانی) برای ساخت عوامل تعاملی تعبیه شده‌اند.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #Transformers
🤖 معماری جدید توسعه نرم‌افزار با هوش مصنوعی از نگاه اسبربانک
‏تحلیل عمیق وایت‌پیپر 337 هزار کاراکتری "AI-Disrupt PDLC" اسبربانک، معماری واقعی گذار به توسعه مبتنی بر عامل (agent-based development) را آشکار می‌کند و بر تغییر پارادایم از کدنویسی به تعریف قصد (intent) تمرکز دارد.

🔹 تغییر پارادایم: تمرکز اصلی بر گذار از نوشتن کد به تعریف قصد است، جایی که کد به یک مصنوع ثانویه تبدیل می‌شود و مشخصات اولیه اهمیت می‌یابند.
🔸 شکاف اکتشاف (Discovery Gap): صرفاً تطبیق فرآیندهای قدیمی با ابزارهای جدید، تنها رشد خطی 11 تا 25 درصدی را به همراه دارد.

📊 DataScience — هوش مصنوعی و علم داده به فارسی 🇮🇷
📩 ارتباط با ما


#مقاله #AgentAI
🤖 رشد شگفت‌انگیز Anthropic به ۹۶۵ میلیارد دلار

🔹 Anthropic در آخرین دور سرمایه‌گذاری ۶۵ میلیارد دلار جذب کرد و پس از آن ارزش کل شرکت به ۹۶۵ میلیارد دلار رسید.
🔸 این افزایش ارزش نسبت به سه ماه پیش که تنها ۳۰ میلیارد دلار با ارزش ۳۸۰ میلیارد دلاری داشت، بیش از ۲٫۵  برابر است.
💡 Claude (مدل زبانی Anthropic) نقش کلیدی در این رشد داشته و درآمد سالیانه شرکت از پلتفرم‌های هوش مصنوعی به بیش از ۴۷ میلیارد دلار رسیده است.


🔹 سرمایه‌گذاران استراتژیک: سامسونگ، SK Hynix و Micron به عنوان شرکای زیرساختی مشارکت کردند؛ این نشان می‌دهد رقابت هوش مصنوعی به فقط مدل‌ها محدود نیست بلکه به دسترسی به حافظه، GPU و دیتاسنترها هم گسترش یافته است.


📊 DataScience — هوش مصنوعی و علم داده به فارسی 🇮🇷
📩 ارتباط با ما


#خبر #Anthropic
💰 Anthropic با ارزش‌گذاری 965 میلیارد دلاری 65 میلیارد دلار جذب کرد

💡 شرکت Anthropic با جذب سرمایه 65 میلیارد دلاری و رسیدن به ارزش‌گذاری 965 میلیارد دلاری، رسماً از OpenAI پیشی گرفت. درآمد سالانه تکرارشونده (ARR) این شرکت نیز در ماه جاری از مرز 47 میلیارد دلار عبور کرده است.


🔹 ارزش‌گذاری: Anthropic اکنون با ارزش 965 میلیارد دلار، از نظر مالی بزرگتر از OpenAI محسوب می‌شود.
🔸 درآمد: درآمد سالانه تکرارشونده (ARR) این شرکت به بیش از 47 میلیارد دلار رسیده است.


📊 DataScience — هوش مصنوعی و علم داده به فارسی 🇮🇷
📩 ارتباط با ما


#خبر #Anthropic
This media is not supported in your browser
VIEW IN TELEGRAM
🛡️ دفاع سایبری هوش مصنوعی گوگل

‏گوگل از راه‌اندازی «Google AI threat defense» خبر داد، یک راه‌حل امنیت سایبری جدید مبتنی بر هوش مصنوعی که برای نظارت مستمر و توقف تهدیدات سایبری تقویت‌شده با AI، قبل از تأثیرگذاری بر کسب‌وکارها، طراحی شده است.


🔹 این سیستم با ترکیب فناوری‌هایی مانند Wiz (پلتفرم مدیریت ریسک ابری)، مدل‌های هوش مصنوعی پیشرفته Gemini و سایر مدل‌های پیشرو هوش مصنوعی (frontier AI models)، امنیت را تقویت می‌کند.
🔸 همچنین، CodeMender (ابزاری برای ترمیم خودکار کد) و ایجنت‌های امنیتی خودکار (autonomous security agents) نیز بخشی از این راه‌حل هستند.
💡 هدف اصلی این سیستم اولویت‌بندی ریسک‌ها، اسکن برنامه‌ها، شناسایی آسیب‌پذیری‌ها و تسریع فرآیند رفع اشکالات امنیتی است.


📊
DataScience
— هوش مصنوعی و علم داده به فارسی
📩
ارتباط با ما


#خبر #Google