هوش مصنوعی و علم داده به فارسی
6.08K subscribers
976 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🚀 پیشرفت Anthropic در بهبود خودکار هوش مصنوعی
‏شرکت Anthropic در مسیر دستیابی به توانایی بهبود خودکار هوش مصنوعی (recursive self-improvement) گام‌های بلندی برداشته است، به طوری که سیستم‌ها قادر به توسعه نسل‌های بعدی خود به صورت مستقل هستند. این پیشرفت‌ها منجر به افزایش چشمگیر بهره‌وری و سرعت توسعه شده است.


💡 مهندسان کدنویسی با استفاده از ابزارهای Anthropic، هشت برابر بیشتر از دوره ۲۰۲۱ تا ۲۰۲۵ کد تولید می‌کنند.
💡 زمان تکمیل وظایف توسط هوش مصنوعی هر چهار ماه دو برابر شده و از وظایف ۴ دقیقه‌ای به پروژه‌های ۱۲ ساعته گسترش یافته است.
💡 تا ماه مه ۲۰۲۶، ۸۰٪ کدهای ادغام شده توسط Claude تولید شده که کیفیت آن با کارهای انسانی برابری می‌کند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #Claude
🤖 معرفی نموترون ۳ اولترا: مدل ۵۵۰ میلیارد پارامتری انویدیا برای ایجنت‌های بلندمدت

‏انویدیا مدل Nemotron 3 Ultra را منتشر کرد؛ یک مدل باز ترکیب متخصصان (MoE) با ۵۵۰ میلیارد پارامتر (۵۵ میلیارد فعال به‌ازای هر توکن) که برای ایجنت‌های بلندمدت طراحی شده.

🏗 معماری: ترکیب هیبریدی Mamba-Attention MoE (نه ترنسفورمر خالص) با ۱۰۸ لایه، ۵۱۲ متخصص در هر لایه و مسیریابی top-22. معماری Mamba هزینه دیکد را با رشد کانتکست ثابت نگه می‌دارد و پنجره کانتکست به ۱ میلیون توکن می‌رسد.

⚡️ کارایی: توان عملیاتی ۵.۹ برابر بیشتر از GLM-5.1 و هزینه حدود ۳۰٪ کمتر تا تکمیل وظیفه. حالت تلاش متوسط با ۲.۵ برابر توکن کمتر و افت دقت تنها ۷٪.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
Media is too big
VIEW IN TELEGRAM
🤖 دستیار هوش مصنوعی در خرید روزانه
🚀 دستیار هوش مصنوعی جدیدی به نام "Go" توسط Gopuff و با همکاری SpaceXAI راه‌اندازی شده است که وظیفه خرید روزانه شما را بر عهده می‌گیرد. با بیان نیاز خود، این دستیار تمام مراحل خرید را مدیریت می‌کند.



📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #AgentAI
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #43
از پنجشنبه 1405/03/14 ساعت 14:00
تا جمعه 1405/03/15 ساعت 14:00
━━━━━━━━━━━━━━━

بهینه‌سازی و عملکرد مدل‌ها

تیم Unsloth AI مدل Gemma 4 12B را به شکلی فوق‌العاده بهینه کرده که با تنها حدود ۶ گیگابایت VRAM قابل اجراست. نسخه 2-bit GGUF این مدل فقط ۴.۶۶ گیگابایت فضای دیسک اشغال می‌کند و توانایی ارجاع همزمان به ۱۵ سایت مختلف از یک پرامپت واحد را دارد. این پیشرفت اجرای مدل‌های سنگین را روی سخت‌افزار کم‌مصرف ممکن ساخته است.
🔗 مشاهده پست

نمورتور 3 Ultra (مدل متن‌باز NVIDIA) برای زنجیره‌های طولانی عامل‌محور (agentic) طراحی شده و تمرکز بر برنامه‌ریزی چندمرحله‌ای، فراخوانی ابزارها، کدنویسی و جست‌وجوی اسناد دارد. در مقایسه با نسل قبلی، سرعت inference تا ۵ برابر بالاتر و هزینه اجرای وظایف عاملی تا ۳۰٪ کاهش یافته است.
🔗 مشاهده پست


💰 رقابت و بازار هوش مصنوعی

DeepSeek به عنوان رقیب ارزان‌تر OpenAI و Anthropic در حال رشد است. شرکت‌های آمریکایی با انتقال هوش مصنوعی از مراحل آزمایشی به فرآیندهای روزمره، به دنبال کاهش هزینه پردازش توکن هستند و مدل‌های اقتصادی‌تری مانند DeepSeek توجه فزاینده‌ای را به خود جلب کرده‌اند.
🔗 مشاهده پست


🧠 حافظه و آپدیت قابلیت‌های GPT-4

OpenAI قابلیت حافظه پویا (Dynamic Memory) را برای کاربران Plus و Pro در آمریکا فعال کرده است. سیستم جدید بر پایه مکانیزم Dreaming ساخته شده و خودش از چندین جلسه چت، جزئیات پروژه‌ها و ترجیحات کاربر استخراج می‌کند — بدون نیاز به دستور صریح.
🔗 مشاهده پست

GPT-4 قابلیت Dreaming را برای به‌روزرسانی حافظه در پس‌زمینه دریافت کرده است. این ویژگی به جای لیست ثابتی از حقایق، تاریخچه چت‌ها را بررسی کرده و وضعیت حافظه فعلی را ترکیب می‌کند تا اطلاعات به‌روز بماند.
🔗 مشاهده پست


🤖 ترافیک اینترنت و عامل‌های هوش مصنوعی

داده‌های جدید منتشر شده توسط مدیرعامل Cloudflare نشان می‌دهد که ترافیک اینترنتی تولیدشده توسط ربات‌ها و عامل‌های هوش مصنوعی (AI agents) برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشان‌دهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین و اهمیت روزافزون عامل‌های خودکار در اکوسیستم وب است.
🔗 مشاهده پست


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 مایکروسافت هفت مدل هوش مصنوعی جدید منتشر کرد

‏مایکروسافت همزمان هفت مدل AI جدید را معرفی کرد. اما مهم‌ترین نکته این اعلامیه، خود مدل‌ها نیست بلکه جهت‌گیراتری استراتژیک است. شرکت قصد دارد از یک شریک OpenAI به یک آزمایشگاه مستقل frontier-تبدیل شود و این موضوع با یک گزارش فنی ۱۰۹ صفحه‌ای تحت عنوان Building a Hill-Climbing Machine همراه شده است.

🧠 در میان مدل‌ها، MAI-Thinking-1 برجسته‌ترین است: یک مدل reasoning (استدلال) با ۳۵ میلیارد پارامتر فعال که روی بنچمارک AIME 2025 امتیاز ۹۷٪ و روی SWE-Bench Pro امتیاز ۵۳٪ کسب کرده. همراه با آن یک مدل فشرده ۵ میلیاردی برای برنامه‌نویسی و مدل‌های تولید تصویر و صدا نیز منتشر شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Microsoft
🤖 خودبهبودی مدل‌های هوش مصنوعی: گامی به سوی هوش مصنوعی پیشرفته

🚀 شرکت Anthropic مفهوم recursive self-improvement (خودبهبودی بازگشتی) را معرفی کرده است، جایی که مدل‌های هوش مصنوعی خود را بهبود می‌بخشند و آموزش می‌دهند. این پیشرفت‌ها به حدی سریع هستند که در آینده نزدیک، بخش عمده‌ای از کدنویسی و توسعه مدل‌های جدید توسط خود این مدل‌ها انجام خواهد شد، که این امر نیاز به بررسی و هماهنگی جهانی برای مدیریت توسعه مرزهای هوش مصنوعی را برجسته می‌کند.

💡 در حالی که انسان‌ها همچنان در تعیین اهداف بلندمدت و جهت‌دهی تحقیقاتی برتری دارند، مدل‌هایی مانند Claude بخش قابل توجهی از فرآیند توسعه را خودکار کرده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🎓 دوره آموزشی ترنسفورمرها و مدل‌های زبانی بزرگ

‏دوره CME295 از استنفورد با تمرکز بر Transformers (معماری پایه مدل‌های زبانی) و LLMs (مدل‌های زبانی بزرگ) در سال ۲۰۱۵ ارائه شده است.

🔗 پلی‌لیست یوتیوب دوره

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Transformers
Parallax: نوآوری در مکانیسم توجه ترنسفورمر

💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بوده‌اند.
🔄 یک مقاله جدید، Parallax را معرفی می‌کند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیری‌شده به آن می‌افزاید.
🔬 تیمی از محققان از دانشگاه‌های Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتری‌شده) توسعه داده‌اند که برای پیش‌آموزش LLMها (مدل‌های زبان بزرگ) مقیاس‌پذیر است و با Muon هم‌طراحی شده است.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 فهم گام‌به‌گام LLMها

🔎 این راهنمای تعاملی سه بعدی به‌صورت تصویری، نحوهٔ کارکرد ترکیبات اصلی مدل‌های زبانی بزرگ را از Embedding تا Softmax به‌صورت مرحله‑به‑مرحله نشان می‌دهد و به‌جای مطالعهٔ مقالات، درک بصری را فراهم می‌کند.


🔹 Embedding: تبدیل توکن‌ها به فضای برداری ثابت
🔸 Layer Norm: نرمال‌سازی مقیاس‌دار برای پایداری آموزش
🔹 Self‑Attention: وزن‌دهی پویا بین همهٔ توکن‌ها
🔸 MLP: لایه‌های پیش‌ساز کامل (Fully‑Connected) برای پردازش غیرخطی
🔹 Transformer layers: ترکیب توجه و MLP در ساختار تودرتو
🔸 Softmax: تبدیل مقیاس نهایی به توزیع احتمال خروجی


📄 LLM Interactive Guide

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
1
🤖 پیشرفت سریع AI و نقش Anthropic

🚀 Anthropic Institute با گزارشی اعلام کرد که هوش مصنوعی به‌ویژه Claude (مدل زبانی) در حال پیشرفت‌های خودکار برای تولید کد است؛ در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافه‌شده به پایه‌کد شرکت توسط Claude نوشته شد.

📈 مهندسان در همان دوره حدود ۸ برابر بیشتر نسبت به ۲۰۲۴ کد می‌نویسند. توان حل مسأله بدون دخالت انسان هر چهار ماه تقریباً دوبرابر می‌شود؛ از چند دقیقه در Opus 3 (۲۰۲۴) تا ۱۲ ساعت در Opus 4.6 (۲۰۲۵).

🏥 پیش‌بینی می‌شود این سرعت رشد بهبودهای چشمگیری در پزشکی و علم ایجاد کند، اما نیاز به ابزارهای اعتبارسنجی و نظارت دارد.

🌐 Anthropic برای جلوگیری از تسریع بی‌قید و شرط، خواستار همکاری جهانی برای توانمندسازی مکانیسم‌های توقف موقت توسعه پیشرفته مدل‌هاست.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🚀 کتابخانه FlashLib برای یادگیری ماشین روی GPU

⚙️ FlashLib پیاده‌سازی‌های سریع kmeans, PCA و DBSCAN را با استفاده از Triton و CuteDSL روی GPU فراهم می‌کند و با API واضح، عملکرد عملیات را اندازه‌گیری می‌سازد.
📊 این کتابخانه 15 primitive سطح‑بالا را برای خوشه‌بندی، رگرسیون و تجزیه‑تحلیل پشتیبانی می‌کند و می‌تواند به‌راحتی با PyTorch و sklearn ادغام شود.

🔗 FlashLib GitHub repository

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🧠 PlanningBench: ارزیابی مهارت‌های برنامه‌ریزی LLMها

‏تنسنت هونیوان (Tencent Hunyuan) با همکاری دانشکده هوش مصنوعی گائولینگ در دانشگاه رنمین چین، فریم‌ورک جدیدی به نام PlanningBench را معرفی کرده‌اند. این ابزار جامع برای ارزیابی و آموزش مهارت‌های برنامه‌ریزی در مدل‌های زبان بزرگ (LLMها) طراحی شده است.

PlanningBench با هدف پر کردن شکاف‌های موجود در ارزیابی قابلیت‌های استدلال و برنامه‌ریزی LLMها، ویژگی‌های کلیدی زیر را ارائه می‌دهد:

🔹 بیش از ۳۰ وظیفه برنامه‌ریزی متنوع برگرفته از سناریوهای واقعی را شامل می‌شود.
🔸 قابلیت بررسی خودکار راه‌حل‌های ارائه شده توسط مدل‌ها را فراهم می‌کند.
🔺 از ارزیابی عملکرد مدل‌ها و همچنین آموزش آن‌ها برای بهبود مهارت‌های برنامه‌ریزی پشتیبانی می‌کند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
📊 صفحه پیشرو Arena برای ارزیابی عامل‌های هوش مصنوعی

‏Arena یک صفحه پیشرو واقعی برای عامل‌های هوش مصنوعی راه‌اندازی کرده است که فراتر از بنچمارک‌های سنتی، عملکرد مدل‌ها را بر اساس وظایف هدایت‌شده توسط کاربر ارزیابی می‌کند. این ارزیابی شامل فعالیت‌هایی مانند کدنویسی، ساخت اپلیکیشن، تحقیق، ایجاد مستندات و تحلیل فایل در جلسات زنده با استفاده از ابزارهای وب و ترمینال است. 🚀


🔹 معیارهای ارزیابی: موفقیت در وظیفه، پاسخگویی، بازیابی خطا، بازخورد کاربر و اجتناب از ابزارهای ناموجود.
🔸 مقیاس داده: این صفحه پیشرو شامل داده‌های بیش از ۳۰۰,۰۰۰ وظیفه و ۴۰ میلیون خط کد است.
🔹 رهبران فعلی: GPT-5.5 High در حال حاضر پیشتاز است، و پس از آن Claude Opus 4.7 Thinking و GPT-5.4 High قرار دارند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#گزارش #AgentAI