💡 مدل GPT-4 قابلیت "Dreaming" را دریافت کرد
مدل GPT-4 اکنون قابلیت "Dreaming" را برای بهروزرسانی حافظه خود در پسزمینه اضافه کرده است. این ویژگی به جای لیست ثابتی از حقایق، به طور مداوم تاریخچه چتها را بررسی کرده و وضعیت حافظه فعلی را ترکیب میکند تا اطلاعات بهروز بماند.
🚀 این قابلیت به مدل اجازه میدهد تا جزئیات مربوط به تعاملات کاربر را بهطور خودکار بهروز کند؛ برای مثال، اگر کاربری قصد سفر به سنگاپور را داشته باشد، پس از سفر، حافظه مدل از "کاربر به سنگاپور میرود" به "کاربر در ژوئیه ۲۰۲۵ در سنگاپور بود" تغییر میکند.
💰 OpenAI این ویژگی را پس از کاهش حدود ۵ برابری هزینههای محاسباتی آن توسعه داده است. این قابلیت در حال حاضر برای کاربران Plus و Pro در ایالات متحده در دسترس است و بهزودی برای سایر مناطق و سطوح اشتراک عرضه خواهد شد.
#خبر #OpenAI
مدل GPT-4 اکنون قابلیت "Dreaming" را برای بهروزرسانی حافظه خود در پسزمینه اضافه کرده است. این ویژگی به جای لیست ثابتی از حقایق، به طور مداوم تاریخچه چتها را بررسی کرده و وضعیت حافظه فعلی را ترکیب میکند تا اطلاعات بهروز بماند.
🚀 این قابلیت به مدل اجازه میدهد تا جزئیات مربوط به تعاملات کاربر را بهطور خودکار بهروز کند؛ برای مثال، اگر کاربری قصد سفر به سنگاپور را داشته باشد، پس از سفر، حافظه مدل از "کاربر به سنگاپور میرود" به "کاربر در ژوئیه ۲۰۲۵ در سنگاپور بود" تغییر میکند.
💰 OpenAI این ویژگی را پس از کاهش حدود ۵ برابری هزینههای محاسباتی آن توسعه داده است. این قابلیت در حال حاضر برای کاربران Plus و Pro در ایالات متحده در دسترس است و بهزودی برای سایر مناطق و سطوح اشتراک عرضه خواهد شد.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#خبر #OpenAI
🤖 رباتهای هوش مصنوعی از انسانها در اینترنت پیشی گرفتند
دادههای جدید منتشر شده توسط مدیرعامل Cloudflare نشان میدهد که ترافیک اینترنتی تولید شده توسط رباتها و عوامل هوش مصنوعی برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشاندهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین است.
🔗 راهنمای رباتها
#خبر #AgentAI
دادههای جدید منتشر شده توسط مدیرعامل Cloudflare نشان میدهد که ترافیک اینترنتی تولید شده توسط رباتها و عوامل هوش مصنوعی برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشاندهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین است.
🔹 روند افزایشی: این دادهها حاکی از رشد چشمگیر استفاده از هوش مصنوعی در اینترنت است.
🔸 تأثیرات آتی: پیشبینی میشود این روند بر امنیت سایبری و تجربه کاربری تأثیر بگذارد.
🔗 راهنمای رباتها
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#خبر #AgentAI
🚀 پیشرفت Anthropic در بهبود خودکار هوش مصنوعی
شرکت Anthropic در مسیر دستیابی به توانایی بهبود خودکار هوش مصنوعی (recursive self-improvement) گامهای بلندی برداشته است، به طوری که سیستمها قادر به توسعه نسلهای بعدی خود به صورت مستقل هستند. این پیشرفتها منجر به افزایش چشمگیر بهرهوری و سرعت توسعه شده است.
#مقاله #Claude
شرکت Anthropic در مسیر دستیابی به توانایی بهبود خودکار هوش مصنوعی (recursive self-improvement) گامهای بلندی برداشته است، به طوری که سیستمها قادر به توسعه نسلهای بعدی خود به صورت مستقل هستند. این پیشرفتها منجر به افزایش چشمگیر بهرهوری و سرعت توسعه شده است.
💡 مهندسان کدنویسی با استفاده از ابزارهای Anthropic، هشت برابر بیشتر از دوره ۲۰۲۱ تا ۲۰۲۵ کد تولید میکنند.
💡 زمان تکمیل وظایف توسط هوش مصنوعی هر چهار ماه دو برابر شده و از وظایف ۴ دقیقهای به پروژههای ۱۲ ساعته گسترش یافته است.
💡 تا ماه مه ۲۰۲۶، ۸۰٪ کدهای ادغام شده توسط Claude تولید شده که کیفیت آن با کارهای انسانی برابری میکند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#مقاله #Claude
🤖 معرفی نموترون ۳ اولترا: مدل ۵۵۰ میلیارد پارامتری انویدیا برای ایجنتهای بلندمدت
انویدیا مدل Nemotron 3 Ultra را منتشر کرد؛ یک مدل باز ترکیب متخصصان (MoE) با ۵۵۰ میلیارد پارامتر (۵۵ میلیارد فعال بهازای هر توکن) که برای ایجنتهای بلندمدت طراحی شده.
🏗 معماری: ترکیب هیبریدی Mamba-Attention MoE (نه ترنسفورمر خالص) با ۱۰۸ لایه، ۵۱۲ متخصص در هر لایه و مسیریابی top-22. معماری Mamba هزینه دیکد را با رشد کانتکست ثابت نگه میدارد و پنجره کانتکست به ۱ میلیون توکن میرسد.
⚡️ کارایی: توان عملیاتی ۵.۹ برابر بیشتر از GLM-5.1 و هزینه حدود ۳۰٪ کمتر تا تکمیل وظیفه. حالت تلاش متوسط با ۲.۵ برابر توکن کمتر و افت دقت تنها ۷٪.
#خبر #Nvidia
انویدیا مدل Nemotron 3 Ultra را منتشر کرد؛ یک مدل باز ترکیب متخصصان (MoE) با ۵۵۰ میلیارد پارامتر (۵۵ میلیارد فعال بهازای هر توکن) که برای ایجنتهای بلندمدت طراحی شده.
🏗 معماری: ترکیب هیبریدی Mamba-Attention MoE (نه ترنسفورمر خالص) با ۱۰۸ لایه، ۵۱۲ متخصص در هر لایه و مسیریابی top-22. معماری Mamba هزینه دیکد را با رشد کانتکست ثابت نگه میدارد و پنجره کانتکست به ۱ میلیون توکن میرسد.
⚡️ کارایی: توان عملیاتی ۵.۹ برابر بیشتر از GLM-5.1 و هزینه حدود ۳۰٪ کمتر تا تکمیل وظیفه. حالت تلاش متوسط با ۲.۵ برابر توکن کمتر و افت دقت تنها ۷٪.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#خبر #Nvidia
Media is too big
VIEW IN TELEGRAM
🤖 دستیار هوش مصنوعی در خرید روزانه
🚀 دستیار هوش مصنوعی جدیدی به نام "Go" توسط Gopuff و با همکاری SpaceXAI راهاندازی شده است که وظیفه خرید روزانه شما را بر عهده میگیرد. با بیان نیاز خود، این دستیار تمام مراحل خرید را مدیریت میکند.
#معرفی #AgentAI
🚀 دستیار هوش مصنوعی جدیدی به نام "Go" توسط Gopuff و با همکاری SpaceXAI راهاندازی شده است که وظیفه خرید روزانه شما را بر عهده میگیرد. با بیان نیاز خود، این دستیار تمام مراحل خرید را مدیریت میکند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#معرفی #AgentAI
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #43
⏰ از پنجشنبه 1405/03/14 ساعت 14:00
تا جمعه 1405/03/15 ساعت 14:00
━━━━━━━━━━━━━━━
⚡ بهینهسازی و عملکرد مدلها
💰 رقابت و بازار هوش مصنوعی
🧠 حافظه و آپدیت قابلیتهای GPT-4
🤖 ترافیک اینترنت و عاملهای هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #43
⏰ از پنجشنبه 1405/03/14 ساعت 14:00
تا جمعه 1405/03/15 ساعت 14:00
━━━━━━━━━━━━━━━
⚡ بهینهسازی و عملکرد مدلها
تیم Unsloth AI مدل Gemma 4 12B را به شکلی فوقالعاده بهینه کرده که با تنها حدود ۶ گیگابایت VRAM قابل اجراست. نسخه 2-bit GGUF این مدل فقط ۴.۶۶ گیگابایت فضای دیسک اشغال میکند و توانایی ارجاع همزمان به ۱۵ سایت مختلف از یک پرامپت واحد را دارد. این پیشرفت اجرای مدلهای سنگین را روی سختافزار کممصرف ممکن ساخته است.
🔗 مشاهده پست
نمورتور 3 Ultra (مدل متنباز NVIDIA) برای زنجیرههای طولانی عاملمحور (agentic) طراحی شده و تمرکز بر برنامهریزی چندمرحلهای، فراخوانی ابزارها، کدنویسی و جستوجوی اسناد دارد. در مقایسه با نسل قبلی، سرعت inference تا ۵ برابر بالاتر و هزینه اجرای وظایف عاملی تا ۳۰٪ کاهش یافته است.
🔗 مشاهده پست
💰 رقابت و بازار هوش مصنوعی
DeepSeek به عنوان رقیب ارزانتر OpenAI و Anthropic در حال رشد است. شرکتهای آمریکایی با انتقال هوش مصنوعی از مراحل آزمایشی به فرآیندهای روزمره، به دنبال کاهش هزینه پردازش توکن هستند و مدلهای اقتصادیتری مانند DeepSeek توجه فزایندهای را به خود جلب کردهاند.
🔗 مشاهده پست
🧠 حافظه و آپدیت قابلیتهای GPT-4
OpenAI قابلیت حافظه پویا (Dynamic Memory) را برای کاربران Plus و Pro در آمریکا فعال کرده است. سیستم جدید بر پایه مکانیزم Dreaming ساخته شده و خودش از چندین جلسه چت، جزئیات پروژهها و ترجیحات کاربر استخراج میکند — بدون نیاز به دستور صریح.
🔗 مشاهده پست
GPT-4 قابلیت Dreaming را برای بهروزرسانی حافظه در پسزمینه دریافت کرده است. این ویژگی به جای لیست ثابتی از حقایق، تاریخچه چتها را بررسی کرده و وضعیت حافظه فعلی را ترکیب میکند تا اطلاعات بهروز بماند.
🔗 مشاهده پست
🤖 ترافیک اینترنت و عاملهای هوش مصنوعی
دادههای جدید منتشر شده توسط مدیرعامل Cloudflare نشان میدهد که ترافیک اینترنتی تولیدشده توسط رباتها و عاملهای هوش مصنوعی (AI agents) برای اولین بار از ترافیک انسانی فراتر رفته است. این تحول نشاندهنده تغییر قابل توجهی در نحوه تعامل با فضای آنلاین و اهمیت روزافزون عاملهای خودکار در اکوسیستم وب است.
🔗 مشاهده پست
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 مایکروسافت هفت مدل هوش مصنوعی جدید منتشر کرد
مایکروسافت همزمان هفت مدل AI جدید را معرفی کرد. اما مهمترین نکته این اعلامیه، خود مدلها نیست بلکه جهتگیراتری استراتژیک است. شرکت قصد دارد از یک شریک OpenAI به یک آزمایشگاه مستقل frontier-تبدیل شود و این موضوع با یک گزارش فنی ۱۰۹ صفحهای تحت عنوان Building a Hill-Climbing Machine همراه شده است.
🧠 در میان مدلها، MAI-Thinking-1 برجستهترین است: یک مدل reasoning (استدلال) با ۳۵ میلیارد پارامتر فعال که روی بنچمارک AIME 2025 امتیاز ۹۷٪ و روی SWE-Bench Pro امتیاز ۵۳٪ کسب کرده. همراه با آن یک مدل فشرده ۵ میلیاردی برای برنامهنویسی و مدلهای تولید تصویر و صدا نیز منتشر شدهاند.
#خبر #Microsoft
مایکروسافت همزمان هفت مدل AI جدید را معرفی کرد. اما مهمترین نکته این اعلامیه، خود مدلها نیست بلکه جهتگیراتری استراتژیک است. شرکت قصد دارد از یک شریک OpenAI به یک آزمایشگاه مستقل frontier-تبدیل شود و این موضوع با یک گزارش فنی ۱۰۹ صفحهای تحت عنوان Building a Hill-Climbing Machine همراه شده است.
🧠 در میان مدلها، MAI-Thinking-1 برجستهترین است: یک مدل reasoning (استدلال) با ۳۵ میلیارد پارامتر فعال که روی بنچمارک AIME 2025 امتیاز ۹۷٪ و روی SWE-Bench Pro امتیاز ۵۳٪ کسب کرده. همراه با آن یک مدل فشرده ۵ میلیاردی برای برنامهنویسی و مدلهای تولید تصویر و صدا نیز منتشر شدهاند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#خبر #Microsoft
🤖 خودبهبودی مدلهای هوش مصنوعی: گامی به سوی هوش مصنوعی پیشرفته
🚀 شرکت Anthropic مفهوم recursive self-improvement (خودبهبودی بازگشتی) را معرفی کرده است، جایی که مدلهای هوش مصنوعی خود را بهبود میبخشند و آموزش میدهند. این پیشرفتها به حدی سریع هستند که در آینده نزدیک، بخش عمدهای از کدنویسی و توسعه مدلهای جدید توسط خود این مدلها انجام خواهد شد، که این امر نیاز به بررسی و هماهنگی جهانی برای مدیریت توسعه مرزهای هوش مصنوعی را برجسته میکند.
💡 در حالی که انسانها همچنان در تعیین اهداف بلندمدت و جهتدهی تحقیقاتی برتری دارند، مدلهایی مانند Claude بخش قابل توجهی از فرآیند توسعه را خودکار کردهاند.
🚀 شرکت Anthropic مفهوم recursive self-improvement (خودبهبودی بازگشتی) را معرفی کرده است، جایی که مدلهای هوش مصنوعی خود را بهبود میبخشند و آموزش میدهند. این پیشرفتها به حدی سریع هستند که در آینده نزدیک، بخش عمدهای از کدنویسی و توسعه مدلهای جدید توسط خود این مدلها انجام خواهد شد، که این امر نیاز به بررسی و هماهنگی جهانی برای مدیریت توسعه مرزهای هوش مصنوعی را برجسته میکند.
💡 در حالی که انسانها همچنان در تعیین اهداف بلندمدت و جهتدهی تحقیقاتی برتری دارند، مدلهایی مانند Claude بخش قابل توجهی از فرآیند توسعه را خودکار کردهاند.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🎓 دوره آموزشی ترنسفورمرها و مدلهای زبانی بزرگ
دوره CME295 از استنفورد با تمرکز بر Transformers (معماری پایه مدلهای زبانی) و LLMs (مدلهای زبانی بزرگ) در سال ۲۰۱۵ ارائه شده است.
🔗 پلیلیست یوتیوب دوره
#آموزش #Transformers
دوره CME295 از استنفورد با تمرکز بر Transformers (معماری پایه مدلهای زبانی) و LLMs (مدلهای زبانی بزرگ) در سال ۲۰۱۵ ارائه شده است.
🔗 پلیلیست یوتیوب دوره
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#آموزش #Transformers
✨ Parallax: نوآوری در مکانیسم توجه ترنسفورمر
💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بودهاند.
🔄 یک مقاله جدید، Parallax را معرفی میکند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیریشده به آن میافزاید.
🔬 تیمی از محققان از دانشگاههای Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتریشده) توسعه دادهاند که برای پیشآموزش LLMها (مدلهای زبان بزرگ) مقیاسپذیر است و با Muon همطراحی شده است.
#پژوهش #LLM
💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بودهاند.
🔄 یک مقاله جدید، Parallax را معرفی میکند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیریشده به آن میافزاید.
🔬 تیمی از محققان از دانشگاههای Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتریشده) توسعه دادهاند که برای پیشآموزش LLMها (مدلهای زبان بزرگ) مقیاسپذیر است و با Muon همطراحی شده است.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#پژوهش #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 فهم گامبهگام LLMها
🔎 این راهنمای تعاملی سه بعدی بهصورت تصویری، نحوهٔ کارکرد ترکیبات اصلی مدلهای زبانی بزرگ را از Embedding تا Softmax بهصورت مرحله‑به‑مرحله نشان میدهد و بهجای مطالعهٔ مقالات، درک بصری را فراهم میکند.
📄 LLM Interactive Guide
🔎 این راهنمای تعاملی سه بعدی بهصورت تصویری، نحوهٔ کارکرد ترکیبات اصلی مدلهای زبانی بزرگ را از Embedding تا Softmax بهصورت مرحله‑به‑مرحله نشان میدهد و بهجای مطالعهٔ مقالات، درک بصری را فراهم میکند.
🔹 Embedding: تبدیل توکنها به فضای برداری ثابت
🔸 Layer Norm: نرمالسازی مقیاسدار برای پایداری آموزش
🔹 Self‑Attention: وزندهی پویا بین همهٔ توکنها
🔸 MLP: لایههای پیشساز کامل (Fully‑Connected) برای پردازش غیرخطی
🔹 Transformer layers: ترکیب توجه و MLP در ساختار تودرتو
🔸 Softmax: تبدیل مقیاس نهایی به توزیع احتمال خروجی
📄 LLM Interactive Guide
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
❤1
🤖 پیشرفت سریع AI و نقش Anthropic
🚀 Anthropic Institute با گزارشی اعلام کرد که هوش مصنوعی بهویژه Claude (مدل زبانی) در حال پیشرفتهای خودکار برای تولید کد است؛ در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافهشده به پایهکد شرکت توسط Claude نوشته شد.
📈 مهندسان در همان دوره حدود ۸ برابر بیشتر نسبت به ۲۰۲۴ کد مینویسند. ⏳ توان حل مسأله بدون دخالت انسان هر چهار ماه تقریباً دوبرابر میشود؛ از چند دقیقه در Opus 3 (۲۰۲۴) تا ۱۲ ساعت در Opus 4.6 (۲۰۲۵).
🏥 پیشبینی میشود این سرعت رشد بهبودهای چشمگیری در پزشکی و علم ایجاد کند، اما نیاز به ابزارهای اعتبارسنجی و نظارت دارد.
🌐 Anthropic برای جلوگیری از تسریع بیقید و شرط، خواستار همکاری جهانی برای توانمندسازی مکانیسمهای توقف موقت توسعه پیشرفته مدلهاست.
🚀 Anthropic Institute با گزارشی اعلام کرد که هوش مصنوعی بهویژه Claude (مدل زبانی) در حال پیشرفتهای خودکار برای تولید کد است؛ در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافهشده به پایهکد شرکت توسط Claude نوشته شد.
📈 مهندسان در همان دوره حدود ۸ برابر بیشتر نسبت به ۲۰۲۴ کد مینویسند. ⏳ توان حل مسأله بدون دخالت انسان هر چهار ماه تقریباً دوبرابر میشود؛ از چند دقیقه در Opus 3 (۲۰۲۴) تا ۱۲ ساعت در Opus 4.6 (۲۰۲۵).
🏥 پیشبینی میشود این سرعت رشد بهبودهای چشمگیری در پزشکی و علم ایجاد کند، اما نیاز به ابزارهای اعتبارسنجی و نظارت دارد.
🌐 Anthropic برای جلوگیری از تسریع بیقید و شرط، خواستار همکاری جهانی برای توانمندسازی مکانیسمهای توقف موقت توسعه پیشرفته مدلهاست.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما