هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
262 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
Media is too big
VIEW IN TELEGRAM
🖼️ Reve 2.0: سریع‌ترین مدل تولید تصویر 4K جهان

‏Reve 2.0 مدلی جدید برای تولید تصاویر با وضوح 4K (16 مگاپیکسل) است که ادعا می‌شود سریع‌ترین در جهان در این رزولوشن محسوب می‌شود. تصاویر تولید شده بلافاصله آماده چاپ هستند و نیازی به Upscaling (افزایش وضوح) ندارند. این مدل در دو مرحله عمل می‌کند: ابتدا یک مدل Autoregressive (مدل خودرگرسیو که توالی داده‌ها را پیش‌بینی می‌کند) کد توصیف‌کننده ترکیب‌بندی، اشیاء، سبک و متن را تولید می‌کند، سپس یک مدل Diffusion (مدل انتشاری که با افزودن و حذف تدریجی نویز، تصویر را می‌سازد) تصویر نهایی را رندر می‌کند.


🏆 این مدل در رقابت Image Arena با کسب 1280 امتیاز در جایگاه دوم قرار گرفت و تنها از GPT Image 2 شکست خورد و Gemini 3.1 Flash (Nano Banana 2) را پشت سر گذاشت.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #AgentAI
🚀 ظهور DeepSeek به عنوان رقیب ارزان‌تر OpenAI
‏شرکت‌های آمریکایی به طور فزاینده‌ای در حال بررسی و استفاده از مدل‌های هوش مصنوعی مانند DeepSeek هستند که جایگزین‌های مقرون‌به‌صرفه‌تری نسبت به OpenAI و Anthropic ارائه می‌دهند. با انتقال هوش مصنوعی از مراحل آزمایشی به فرآیندهای روزمره، هزینه پردازش توکن‌ها (واحدی از متن که مدل‌ها پردازش می‌کنند) به یک عامل مهم در بودجه شرکت‌ها تبدیل شده است.
💡 این روند به ویژه در وظایف مبتنی بر عامل (agentic tasks) مشهود است، جایی که یک درخواست کاربر می‌تواند منجر به ده‌ها فراخوانی مدل، جستجو، استفاده از ابزارها، و پردازش متن طولانی شود.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #DeepSeek
💡 مدل GPT-4 قابلیت "Dreaming" را دریافت کرد

‏مدل GPT-4 اکنون قابلیت "Dreaming" را برای به‌روزرسانی حافظه خود در پس‌زمینه اضافه کرده است. این ویژگی به جای لیست ثابتی از حقایق، به طور مداوم تاریخچه چت‌ها را بررسی کرده و وضعیت حافظه فعلی را ترکیب می‌کند تا اطلاعات به‌روز بماند.

🚀 این قابلیت به مدل اجازه می‌دهد تا جزئیات مربوط به تعاملات کاربر را به‌طور خودکار به‌روز کند؛ برای مثال، اگر کاربری قصد سفر به سنگاپور را داشته باشد، پس از سفر، حافظه مدل از "کاربر به سنگاپور می‌رود" به "کاربر در ژوئیه ۲۰۲۵ در سنگاپور بود" تغییر می‌کند.

💰 OpenAI این ویژگی را پس از کاهش حدود ۵ برابری هزینه‌های محاسباتی آن توسعه داده است. این قابلیت در حال حاضر برای کاربران Plus و Pro در ایالات متحده در دسترس است و به‌زودی برای سایر مناطق و سطوح اشتراک عرضه خواهد شد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #OpenAI
🤖 ربات‌های هوش مصنوعی از انسان‌ها در اینترنت پیشی گرفتند

‏داده‌های جدید منتشر شده توسط مدیرعامل Cloudflare نشان می‌دهد که ترافیک اینترنتی تولید شده توسط ربات‌ها و عوامل هوش مصنوعی برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشان‌دهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین است.


🔹 روند افزایشی: این داده‌ها حاکی از رشد چشمگیر استفاده از هوش مصنوعی در اینترنت است.
🔸 تأثیرات آتی: پیش‌بینی می‌شود این روند بر امنیت سایبری و تجربه کاربری تأثیر بگذارد.


🔗 راهنمای ربات‌ها

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #AgentAI
🚀 پیشرفت Anthropic در بهبود خودکار هوش مصنوعی
‏شرکت Anthropic در مسیر دستیابی به توانایی بهبود خودکار هوش مصنوعی (recursive self-improvement) گام‌های بلندی برداشته است، به طوری که سیستم‌ها قادر به توسعه نسل‌های بعدی خود به صورت مستقل هستند. این پیشرفت‌ها منجر به افزایش چشمگیر بهره‌وری و سرعت توسعه شده است.


💡 مهندسان کدنویسی با استفاده از ابزارهای Anthropic، هشت برابر بیشتر از دوره ۲۰۲۱ تا ۲۰۲۵ کد تولید می‌کنند.
💡 زمان تکمیل وظایف توسط هوش مصنوعی هر چهار ماه دو برابر شده و از وظایف ۴ دقیقه‌ای به پروژه‌های ۱۲ ساعته گسترش یافته است.
💡 تا ماه مه ۲۰۲۶، ۸۰٪ کدهای ادغام شده توسط Claude تولید شده که کیفیت آن با کارهای انسانی برابری می‌کند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #Claude
🤖 معرفی نموترون ۳ اولترا: مدل ۵۵۰ میلیارد پارامتری انویدیا برای ایجنت‌های بلندمدت

‏انویدیا مدل Nemotron 3 Ultra را منتشر کرد؛ یک مدل باز ترکیب متخصصان (MoE) با ۵۵۰ میلیارد پارامتر (۵۵ میلیارد فعال به‌ازای هر توکن) که برای ایجنت‌های بلندمدت طراحی شده.

🏗 معماری: ترکیب هیبریدی Mamba-Attention MoE (نه ترنسفورمر خالص) با ۱۰۸ لایه، ۵۱۲ متخصص در هر لایه و مسیریابی top-22. معماری Mamba هزینه دیکد را با رشد کانتکست ثابت نگه می‌دارد و پنجره کانتکست به ۱ میلیون توکن می‌رسد.

⚡️ کارایی: توان عملیاتی ۵.۹ برابر بیشتر از GLM-5.1 و هزینه حدود ۳۰٪ کمتر تا تکمیل وظیفه. حالت تلاش متوسط با ۲.۵ برابر توکن کمتر و افت دقت تنها ۷٪.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
Media is too big
VIEW IN TELEGRAM
🤖 دستیار هوش مصنوعی در خرید روزانه
🚀 دستیار هوش مصنوعی جدیدی به نام "Go" توسط Gopuff و با همکاری SpaceXAI راه‌اندازی شده است که وظیفه خرید روزانه شما را بر عهده می‌گیرد. با بیان نیاز خود، این دستیار تمام مراحل خرید را مدیریت می‌کند.



📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #AgentAI
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #43
از پنجشنبه 1405/03/14 ساعت 14:00
تا جمعه 1405/03/15 ساعت 14:00
━━━━━━━━━━━━━━━

بهینه‌سازی و عملکرد مدل‌ها

تیم Unsloth AI مدل Gemma 4 12B را به شکلی فوق‌العاده بهینه کرده که با تنها حدود ۶ گیگابایت VRAM قابل اجراست. نسخه 2-bit GGUF این مدل فقط ۴.۶۶ گیگابایت فضای دیسک اشغال می‌کند و توانایی ارجاع همزمان به ۱۵ سایت مختلف از یک پرامپت واحد را دارد. این پیشرفت اجرای مدل‌های سنگین را روی سخت‌افزار کم‌مصرف ممکن ساخته است.
🔗 مشاهده پست

نمورتور 3 Ultra (مدل متن‌باز NVIDIA) برای زنجیره‌های طولانی عامل‌محور (agentic) طراحی شده و تمرکز بر برنامه‌ریزی چندمرحله‌ای، فراخوانی ابزارها، کدنویسی و جست‌وجوی اسناد دارد. در مقایسه با نسل قبلی، سرعت inference تا ۵ برابر بالاتر و هزینه اجرای وظایف عاملی تا ۳۰٪ کاهش یافته است.
🔗 مشاهده پست


💰 رقابت و بازار هوش مصنوعی

DeepSeek به عنوان رقیب ارزان‌تر OpenAI و Anthropic در حال رشد است. شرکت‌های آمریکایی با انتقال هوش مصنوعی از مراحل آزمایشی به فرآیندهای روزمره، به دنبال کاهش هزینه پردازش توکن هستند و مدل‌های اقتصادی‌تری مانند DeepSeek توجه فزاینده‌ای را به خود جلب کرده‌اند.
🔗 مشاهده پست


🧠 حافظه و آپدیت قابلیت‌های GPT-4

OpenAI قابلیت حافظه پویا (Dynamic Memory) را برای کاربران Plus و Pro در آمریکا فعال کرده است. سیستم جدید بر پایه مکانیزم Dreaming ساخته شده و خودش از چندین جلسه چت، جزئیات پروژه‌ها و ترجیحات کاربر استخراج می‌کند — بدون نیاز به دستور صریح.
🔗 مشاهده پست

GPT-4 قابلیت Dreaming را برای به‌روزرسانی حافظه در پس‌زمینه دریافت کرده است. این ویژگی به جای لیست ثابتی از حقایق، تاریخچه چت‌ها را بررسی کرده و وضعیت حافظه فعلی را ترکیب می‌کند تا اطلاعات به‌روز بماند.
🔗 مشاهده پست


🤖 ترافیک اینترنت و عامل‌های هوش مصنوعی

داده‌های جدید منتشر شده توسط مدیرعامل Cloudflare نشان می‌دهد که ترافیک اینترنتی تولیدشده توسط ربات‌ها و عامل‌های هوش مصنوعی (AI agents) برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشان‌دهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین و اهمیت روزافزون عامل‌های خودکار در اکوسیستم وب است.
🔗 مشاهده پست


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 مایکروسافت هفت مدل هوش مصنوعی جدید منتشر کرد

‏مایکروسافت همزمان هفت مدل AI جدید را معرفی کرد. اما مهم‌ترین نکته این اعلامیه، خود مدل‌ها نیست بلکه جهت‌گیراتری استراتژیک است. شرکت قصد دارد از یک شریک OpenAI به یک آزمایشگاه مستقل frontier-تبدیل شود و این موضوع با یک گزارش فنی ۱۰۹ صفحه‌ای تحت عنوان Building a Hill-Climbing Machine همراه شده است.

🧠 در میان مدل‌ها، MAI-Thinking-1 برجسته‌ترین است: یک مدل reasoning (استدلال) با ۳۵ میلیارد پارامتر فعال که روی بنچمارک AIME 2025 امتیاز ۹۷٪ و روی SWE-Bench Pro امتیاز ۵۳٪ کسب کرده. همراه با آن یک مدل فشرده ۵ میلیاردی برای برنامه‌نویسی و مدل‌های تولید تصویر و صدا نیز منتشر شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Microsoft
🤖 خودبهبودی مدل‌های هوش مصنوعی: گامی به سوی هوش مصنوعی پیشرفته

🚀 شرکت Anthropic مفهوم recursive self-improvement (خودبهبودی بازگشتی) را معرفی کرده است، جایی که مدل‌های هوش مصنوعی خود را بهبود می‌بخشند و آموزش می‌دهند. این پیشرفت‌ها به حدی سریع هستند که در آینده نزدیک، بخش عمده‌ای از کدنویسی و توسعه مدل‌های جدید توسط خود این مدل‌ها انجام خواهد شد، که این امر نیاز به بررسی و هماهنگی جهانی برای مدیریت توسعه مرزهای هوش مصنوعی را برجسته می‌کند.

💡 در حالی که انسان‌ها همچنان در تعیین اهداف بلندمدت و جهت‌دهی تحقیقاتی برتری دارند، مدل‌هایی مانند Claude بخش قابل توجهی از فرآیند توسعه را خودکار کرده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🎓 دوره آموزشی ترنسفورمرها و مدل‌های زبانی بزرگ

‏دوره CME295 از استنفورد با تمرکز بر Transformers (معماری پایه مدل‌های زبانی) و LLMs (مدل‌های زبانی بزرگ) در سال ۲۰۱۵ ارائه شده است.

🔗 پلی‌لیست یوتیوب دوره

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Transformers
Parallax: نوآوری در مکانیسم توجه ترنسفورمر

💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بوده‌اند.
🔄 یک مقاله جدید، Parallax را معرفی می‌کند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیری‌شده به آن می‌افزاید.
🔬 تیمی از محققان از دانشگاه‌های Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتری‌شده) توسعه داده‌اند که برای پیش‌آموزش LLMها (مدل‌های زبان بزرگ) مقیاس‌پذیر است و با Muon هم‌طراحی شده است.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 فهم گام‌به‌گام LLMها

🔎 این راهنمای تعاملی سه بعدی به‌صورت تصویری، نحوهٔ کارکرد ترکیبات اصلی مدل‌های زبانی بزرگ را از Embedding تا Softmax به‌صورت مرحله‑به‑مرحله نشان می‌دهد و به‌جای مطالعهٔ مقالات، درک بصری را فراهم می‌کند.


🔹 Embedding: تبدیل توکن‌ها به فضای برداری ثابت
🔸 Layer Norm: نرمال‌سازی مقیاس‌دار برای پایداری آموزش
🔹 Self‑Attention: وزن‌دهی پویا بین همهٔ توکن‌ها
🔸 MLP: لایه‌های پیش‌ساز کامل (Fully‑Connected) برای پردازش غیرخطی
🔹 Transformer layers: ترکیب توجه و MLP در ساختار تودرتو
🔸 Softmax: تبدیل مقیاس نهایی به توزیع احتمال خروجی


📄 LLM Interactive Guide

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
1
🤖 پیشرفت سریع AI و نقش Anthropic

🚀 Anthropic Institute با گزارشی اعلام کرد که هوش مصنوعی به‌ویژه Claude (مدل زبانی) در حال پیشرفت‌های خودکار برای تولید کد است؛ در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافه‌شده به پایه‌کد شرکت توسط Claude نوشته شد.

📈 مهندسان در همان دوره حدود ۸ برابر بیشتر نسبت به ۲۰۲۴ کد می‌نویسند. توان حل مسأله بدون دخالت انسان هر چهار ماه تقریباً دوبرابر می‌شود؛ از چند دقیقه در Opus 3 (۲۰۲۴) تا ۱۲ ساعت در Opus 4.6 (۲۰۲۵).

🏥 پیش‌بینی می‌شود این سرعت رشد بهبودهای چشمگیری در پزشکی و علم ایجاد کند، اما نیاز به ابزارهای اعتبارسنجی و نظارت دارد.

🌐 Anthropic برای جلوگیری از تسریع بی‌قید و شرط، خواستار همکاری جهانی برای توانمندسازی مکانیسم‌های توقف موقت توسعه پیشرفته مدل‌هاست.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما