ارسالی همراهان کانال:
📚 میان هیاهوی شبکههای اجتماعی، هنوز هم میشود چند دقیقهای را به کتاب اختصاص داد.
در این کانال، کتابهای منتخب را با صدای خودم روایت میکنم تا بتوانید در مسیر، هنگام استراحت یا پیش از خواب، به دنیای کتابها سفر کنید.
🎙 روایت کتاب 📖 معرفی آثار ماندگار 🌱 یادگیری و لذت شنیدن
https://xn--r1a.website/MindCast1
📚 میان هیاهوی شبکههای اجتماعی، هنوز هم میشود چند دقیقهای را به کتاب اختصاص داد.
در این کانال، کتابهای منتخب را با صدای خودم روایت میکنم تا بتوانید در مسیر، هنگام استراحت یا پیش از خواب، به دنیای کتابها سفر کنید.
🎙 روایت کتاب 📖 معرفی آثار ماندگار 🌱 یادگیری و لذت شنیدن
https://xn--r1a.website/MindCast1
❤2
Forwarded from 𝒥𝒾𝓂𝓂𝒴
گر دنبال دسترسی رایگان به GPT-5.5 هستید، میتوانید از Freemodel استفاده کنید و API Key اختصاصی دریافت کنید. 👇
📌 مراحل ثبتنام:
🛠 تنظیمات نمونه:
🔥 فرصت خوبی برای تست GPT-5.5 بدون پرداخت هزینه است.
📌 مراحل ثبتنام:
1️⃣ وارد سایت freemodel شوید.
2️⃣ با حساب Gmail ثبتنام کنید.
3️⃣ پس از ورود، صفحه احراز هویت نمایش داده میشود: 🔹 بخش اول: احراز هویت با شماره تلفن 🔹 بخش دوم: احراز هویت با تلگرام
✅ گزینه احراز هویت با تلگرام را انتخاب کنید. لینک ربات تلگرام برای شما نمایش داده میشود. وارد ربات شوید و استارت را بزنید
🎉 پلن Pro برای شما فعال میشود:
هر ۵ ساعت: ۱۰ دلار اعتبار هر هفته: ۶۶ دلار اعتبار 💰
4️⃣ از منوی سایت وارد بخش API Keys
شوید و یک API Key جدید بسازید.
5️⃣ در بخش Docs میتوانید مستندات کامل استفاده از API را مطالعه کنید.
🛠 تنظیمات نمونه:
model_provider = "freemodel" model = "gpt-5.5" model_reasoning_effort = "xhigh" disable_response_storage = true preferred_auth_method = "apikey" [model_providers.freemodel] name = "freemodel" base_url = "https://api.freemodel.dev" wire_api = "responses"
🤖 حالا API Key و مشخصات بالا را به هوش مصنوعی موردنظر خود بدهید و از آن بخواهید برایتان کد تولید کند:
✅ JavaScript ✅ HTML ✅ Python ✅ PHP ✅ Node.js ✅ و بسیاری زبانهای دیگر...
💡 میتوانید با آن: 🔹 ربات تلگرام بسازید 🔹 وبسایت طراحی کنید 🔹 ابزارهای اتوماسیون ایجاد کنید 🔹 پروژههای هوش مصنوعی توسعه دهید
🔥 فرصت خوبی برای تست GPT-5.5 بدون پرداخت هزینه است.
❤7🍓3👍1
شرکت آنتروپیک (Anthropic) بهتازگی مدل هوش مصنوعی قدرتمند «کلود فیبل ۵» (Claude Fable 5) را که نسخهای عمومی از مدل پیشرفته «میتوس» (Mythos) است، عرضه کرد. این مدل در حوزههای مهندسی نرمافزار، کارهای دانشی و بینایی عملکردی ممتاز دارد. با این حال، به دلیل ملاحظات امنیتی در زمینههای حساسی مانند امنیت سایبری، زیستشناسی و شیمی، محدودیتهای سختگیرانهای اعمال شده و در صورت نیاز، مدل بهصورت خودکار به نسخه «Opus 4.8» ارجاع داده میشود. دسترسی به این فناوری اکنون از طریق API و طرحهای سازمانی فراهم شده و شرکت برای تضمین امنیت و جلوگیری از حملات «جیلبریک»، سیاستهای جدیدی برای نگهداری ۳۰ روزه ترافیک دادهها اتخاذ کرده است. طبق تستهای شخص ثالث، این مدل در کارهای تحلیلی پیچیده و کدنویسی عملکردی بینظیر دارد، اما قیمتگذاری آن (۱۰ دلار برای هر میلیون توکن ورودی و ۵۰ دلار برای خروجی) دو برابر مدلهای قبلی است. با وجود هزینههای بالا و چالشهای مدیریت بودجه، برخی سازمانها معتقدند که قابلیتهای استدلال خودمختار و دقت بالای کلود فیبل ۵، توجیهکننده هزینههای سرمایهگذاری برای آنهاست. این عرضه همزمان با آمادهسازی آنتروپیک برای ورود به بازارهای عمومی و در شرایطی صورت میگیرد که بحثهای جدی درباره توسعه خودمختار هوش مصنوعی و نیاز به مکانیسمهای نظارتی جهانی در جریان است.
#هوش_مصنوعی
✅ @AI_DeepMind
🔸 @AI_Person
#هوش_مصنوعی
✅ @AI_DeepMind
🔸 @AI_Person
❤10👍1
Forwarded from Mathematical Musings
مادرهای ایرانی سالها اعتقاد داشتند که جام جهانی رو میندازن فصل امتحانات که بچهها رو از درس خوندن بندازن.
حالا مقالهاش در اومده!
بازیهای جام جهانی فوتبال بر عملکرد درسی افراد، تاثیر معناداری داره و در بین دانشآموزهای علاقهمند به فوتبال و دارای شرایط اقتصادی اجتماعی پایینتر، بیشتر.
https://www.sciencedirect.com/science/article/abs/pii/S0047272718302330
حالا مقالهاش در اومده!
بازیهای جام جهانی فوتبال بر عملکرد درسی افراد، تاثیر معناداری داره و در بین دانشآموزهای علاقهمند به فوتبال و دارای شرایط اقتصادی اجتماعی پایینتر، بیشتر.
https://www.sciencedirect.com/science/article/abs/pii/S0047272718302330
❤6🕊2🍓1🆒1
ا API مدل Whisper (تشخیص صوت) برای استفاده پزشکان هندی در اختیار آنها قرار گرفت.
https://medium.com/@ClinicalAI/whisper-api-for-clinical-voice-notes-10-minute-setup-guide-for-indian-doctors-e114cc8483fd
#هوش_مصنوعی #الگوریتمها #مقاله
✅ @AI_DeepMind
🔸 @AI_Person
https://medium.com/@ClinicalAI/whisper-api-for-clinical-voice-notes-10-minute-setup-guide-for-indian-doctors-e114cc8483fd
#هوش_مصنوعی #الگوریتمها #مقاله
✅ @AI_DeepMind
🔸 @AI_Person
❤5
این مقاله درباره استفاده Foundation Models مانند SAM، SAM2 و MedSAM برای تحلیل خودکار MRI اسکلتی-عضلانی است و نشان میدهد که چگونه میتوان از تصاویر MRI معمولی، بیومارکرهای کمی و قابلاعتماد استخراج کرد و آنها را برای تصمیمگیری بالینی به کار برد.
استفاده از مدلهای بنیادی مانند SAM2 میتوان MRIهای اسکلتی عضلانی را بهطور خودکار به بیومارکرهای دقیق و قابلاستفاده در پزشکی شخصیسازیشده تبدیل کرد؛ بیومارکرهایی که هم به کاهش بار کاری پزشکان کمک میکنند و هم میتوانند خطر پیشرفت بیماری و نیاز به جراحی را پیشبینی کنند.
🔸 Clinical utility of foundation models in musculoskeletal MRI for biomarker fidelity and predictive outcomes
#مقاله #ایده_جذاب #هوش_مصنوعی #پردازش_تصویر #بینایی_ماشین #علوم_پزشکی #مدل_بنیادی
✅ @AI_DeepMind
🔸 @AI_Person
استفاده از مدلهای بنیادی مانند SAM2 میتوان MRIهای اسکلتی عضلانی را بهطور خودکار به بیومارکرهای دقیق و قابلاستفاده در پزشکی شخصیسازیشده تبدیل کرد؛ بیومارکرهایی که هم به کاهش بار کاری پزشکان کمک میکنند و هم میتوانند خطر پیشرفت بیماری و نیاز به جراحی را پیشبینی کنند.
🔸 Clinical utility of foundation models in musculoskeletal MRI for biomarker fidelity and predictive outcomes
#مقاله #ایده_جذاب #هوش_مصنوعی #پردازش_تصویر #بینایی_ماشین #علوم_پزشکی #مدل_بنیادی
✅ @AI_DeepMind
🔸 @AI_Person
👌8❤2👍2
کلاس آموزشی یادگیری تقویتی مدلهای زبانی بزرگ از دانشگاه لس انجلس
Reinforcement Learning of Large Language Models, Spring 2025(UCLA)
🔸 Youtube playlist
🔸 Website
Great set of new lectures on reinforcement learning of LLMs. Covers a wide range of topics related to RLxLLMs such as basics/foundations, test-time compute, RLHF, and RL with verifiable rewards(RLVR).
#هوش_مصنوعی #الگوریتمها #یادگیری_تقویتی #کلاس_آموزشی #فیلم #پردازش_زبان_طبیعی
✅ @AI_DeepMind
🔸 @AI_Person
Reinforcement Learning of Large Language Models, Spring 2025(UCLA)
🔸 Youtube playlist
🔸 Website
Great set of new lectures on reinforcement learning of LLMs. Covers a wide range of topics related to RLxLLMs such as basics/foundations, test-time compute, RLHF, and RL with verifiable rewards(RLVR).
#هوش_مصنوعی #الگوریتمها #یادگیری_تقویتی #کلاس_آموزشی #فیلم #پردازش_زبان_طبیعی
✅ @AI_DeepMind
🔸 @AI_Person
❤11
سلام سایتی رایگان میشناسید بشه فوتبالهای جامجهانی رو انلاین نگاه کرد.؟
👍4🔥1
فروش فیلترشکن قابل ارایه و پشتیبانی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
۱۰ گیگ 170
۱۵گیگ 255
۲۵گیگ 425
۴۵گیگ 765
۹۰ گیگ 1530
فروش فیلترشکن OpenVPN قابل ارایه و پشتیبانی حتی در زمان نت ملی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
مناسب همه فعالیتها قابل استفاده در زمان قطعی نت، چند کاربره و یک ماهه
ا IP ثابت آمریکا، آلمان، ترکیه موجود هست.
مناسب استفاده شخصی، شرکتها و استارت آپ ها، تریدرها و دارای IP ثابت
حداکثر سرعت قابل ارایه 16 مگابایت
@Farzadh1h
۱۰ گیگ
۱۵گیگ 255
۲۵گیگ 425
۴۵گیگ 765
۹۰ گیگ 1530
فروش فیلترشکن OpenVPN قابل ارایه و پشتیبانی حتی در زمان نت ملی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
مناسب همه فعالیتها قابل استفاده در زمان قطعی نت، چند کاربره و یک ماهه
۱۱۰ گیگ تعداد کاربر نامحدود 3700
55 گیگ تعداد کاربر نامحدود 2700
حجم و تعداد کاربر نامحدود ۷ میلیون
ا IP ثابت آمریکا، آلمان، ترکیه موجود هست.
مناسب استفاده شخصی، شرکتها و استارت آپ ها، تریدرها و دارای IP ثابت
حداکثر سرعت قابل ارایه 16 مگابایت
@Farzadh1h
❤2
DeepMind AI Expert
کلاس آموزشی یادگیری تقویتی مدلهای زبانی بزرگ از دانشگاه لس انجلس Reinforcement Learning of Large Language Models, Spring 2025(UCLA) 🔸 Youtube playlist 🔸 Website Great set of new lectures on reinforcement learning of LLMs. Covers a wide range of topics related…
این مقاله یک مدل هوش مصنوعی به نام Topo-Omni معرفی میکند که سعی دارد سازماندهی فضایی مغز انسان را تقلید کند. در مغز، نورونهای نزدیک به هم معمولاً وظایف مشابهی دارند و نواحی تخصصی (مثل #تشخیص_چهره، صدا یا زبان) را تشکیل میدهند. پژوهشگران نشان دادند که اگر به یک مدل چندوجهی (تصویر، صدا و زبان) محدودیت Spatial Smoothness بدهند، این نواحی تخصصی بهطور خودکار در مدل ظاهر میشوند.
🔸 Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model
#نروساینس #هوش_مصنوعی #مولتی_مدل #مقاله #علوم_پزشکی
✅ @AI_DeepMind
🔸 @AI_Person
🔸 Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model
#نروساینس #هوش_مصنوعی #مولتی_مدل #مقاله #علوم_پزشکی
✅ @AI_DeepMind
🔸 @AI_Person
❤8
مقاله زیر مدل Arbor تلاش میکند #هوش_مصنوعی را از یک «عامل تکپاسخی» به یک پژوهشگر خودمختار که فرضیه میسازد، آزمایش میکند، از شکستها یاد میگیرد و دانش را انباشته میکند تبدیل کند. این مقاله یکی از جدیترین گامها به سمت Generalist Autonomous Research Agents محسوب میشود.
🔸 Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
#مقاله #هوش_عمومی #یادگیری_تقویتی
✅ @AI_DeepMind
🔸 @AI_Person
🔸 Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
#مقاله #هوش_عمومی #یادگیری_تقویتی
✅ @AI_DeepMind
🔸 @AI_Person
❤3👍2👌2
کانالم به ۲۷ تا boost نیاز داره کیه که ا boost کانالمو به حد برسونه؟! قبلا خیلی بهتر زود استار و boost میزدید خیلی به کانالم بی مهری میکنید🚶♂
https://xn--r1a.website/boost/AI_DeepMind
https://xn--r1a.website/boost/AI_DeepMind
❤4🍓1
"High-Dimensional Data Analysis with Low-Dimensional Models" by Wright & Ma PDF: book-wright-ma.github.io
#کتاب #آمار #منابع
✅ @AI_DeepMind
🔸 @AI_Person
#کتاب #آمار #منابع
✅ @AI_DeepMind
🔸 @AI_Person
❤9
Forwarded from Download IT | YouTube, Instagram, TikTok, VK, Twitter, Facebook
Media is too big
VIEW IN TELEGRAM
Ex-Amazon VP: Lessons from Working with Jeff Bezos that Changed My Life | Ethan Evans
[1:34:10] · 43.2K views · Jun 3, 2026 · 1.2K likes · 50 comments · BigDeal by Codie Sanchez 623K subscribers · mp4 360p [262 MB]
You work harder than half your team. You deliver results. But somehow, the person who talks a good game in meetings just got promoted ahead of you. Here's the truth: hard work doesn't get you promoted. Visibility, advocacy, and understanding the game do.
Ethan Evans is a retired Amazon VP who spent over 15 years building billion dollar businesses inside one of the most demanding companies on earth. He went from getting fired twice early in his career to running Prime Video, Twitch sponsorships, the Amazon Appstore, and a t-shirt printing business that now does over a billion dollars a year. He worked directly with Jeff Bezos, survived public failures, learned how to navigate corporate politics without losing his soul, and retired early to teach…
saved by @download_it_bot
[1:34:10] · 43.2K views · Jun 3, 2026 · 1.2K likes · 50 comments · BigDeal by Codie Sanchez 623K subscribers · mp4 360p [262 MB]
You work harder than half your team. You deliver results. But somehow, the person who talks a good game in meetings just got promoted ahead of you. Here's the truth: hard work doesn't get you promoted. Visibility, advocacy, and understanding the game do.
Ethan Evans is a retired Amazon VP who spent over 15 years building billion dollar businesses inside one of the most demanding companies on earth. He went from getting fired twice early in his career to running Prime Video, Twitch sponsorships, the Amazon Appstore, and a t-shirt printing business that now does over a billion dollars a year. He worked directly with Jeff Bezos, survived public failures, learned how to navigate corporate politics without losing his soul, and retired early to teach…
saved by @download_it_bot
❤1
تیم Google DeepMind بررسی میکند که اگر AGI، یعنی #هوش_مصنوعی_عمومی در سطح انسان، ساخته شود، مسیرهای فنی محتمل برای رسیدن از آن به ASI یا #ابرهوش_مصنوعی چه خواهند بود. مقاله AGI را بهطور غیررسمی سیستمی میداند که در بیشتر وظایف شناختی در سطح انسان میانه عمل میکند؛ ASI را سیستمی میداند که در تقریباً همه حوزههای مهم، از توانایی گروههای بزرگ متخصصان انسانی فراتر میرود
پیام اصلی مقاله این است که بحث نباید فقط روی «چه زمانی AGI میرسد؟» متوقف شود. پرسش مهمتر این است که بعد از AGI چه سازوکارهایی میتوانند AI را از سطح انسان به سطح فراتر از سازمانهای انسانی ببرند، و چه چیزهایی ممکن است این مسیر را کند یا متوقف کند. مقاله پیشبینی قطعی نمیدهد؛ بلکه یک نقشه پژوهشی ارائه میکند و میگوید ممکن است تحول AI نه یک جهش واحد، بلکه زنجیرهای از تغییرات بزرگ ناشی از پیشرفتهای AI در علم، فناوری و اقتصاد باشد.
🔸 From AGI to ASI
#مقاله #هوش_مصنوعی
✅ @AI_DeepMind
🔸 @AI_Person
رسیدن به AGI لزوماً نقطه پایان پیشرفت AI نیست. حتی اگر یک مدل منفرد در نزدیکی سطح انسان متوقف شود، افزایش compute، بهبود الگوریتمها، خودکارسازی پژوهش AI، و تشکیل جمعیتهای عظیم عاملهای AI میتواند قابلیتهای جمعی را به سطحی فراتر از انسان ببرد. نویسندگان تأکید میکنند این چهار مسیر رقیب هم نیستند و ممکن است همزمان رخ دهند و اثرشان ترکیبی باشد.
پیام اصلی مقاله این است که بحث نباید فقط روی «چه زمانی AGI میرسد؟» متوقف شود. پرسش مهمتر این است که بعد از AGI چه سازوکارهایی میتوانند AI را از سطح انسان به سطح فراتر از سازمانهای انسانی ببرند، و چه چیزهایی ممکن است این مسیر را کند یا متوقف کند. مقاله پیشبینی قطعی نمیدهد؛ بلکه یک نقشه پژوهشی ارائه میکند و میگوید ممکن است تحول AI نه یک جهش واحد، بلکه زنجیرهای از تغییرات بزرگ ناشی از پیشرفتهای AI در علم، فناوری و اقتصاد باشد.
🔸 From AGI to ASI
#مقاله #هوش_مصنوعی
✅ @AI_DeepMind
🔸 @AI_Person
❤6👍3👌1
این #مقاله یک روش برای generative future video modeling معرفی میکند؛ یعنی مدلی که با دیدن چند فریم گذشته، چند آینده محتمل را پیشبینی کند. ایده اصلی این است که بهجای نمایش هر فریم با تعداد زیادی توکن فضایی، تغییر بین دو فریم پیاپی را فقط با یک توکن دلتا نمایش بدهیم. این توکنساز DeltaTok نام دارد و مدل نهایی DeltaWorld است.
مدلهای پیشبینی آینده معمولاً دو مشکل دارند: یا discriminative هستند و فقط یک آینده میانگینشده تولید میکنند، یا اگر مولد باشند، مثل diffusion یا autoregressive video models، بسیار پرهزینهاند و برای هر نمونه آینده به چندین forward pass نیاز دارند. مقاله میگوید در کاربردهایی مثل خودرو خودران، یک پیشبینی واحد کافی نیست، چون آینده چندین حالت ممکن دارد.
ایده DeltaTok بهجای فشردهکردن کل فریم، فقط تفاوت ویژگیهای دو فریم پیاپی را فشرده میکند. فریمها ابتدا با یک Vision Foundation Model مثل DINOv3 به فضای feature تبدیل میشوند؛ سپس DeltaTok از ویژگیهای فریم قبلی و فعلی، یک delta token میسازد که نشان میدهد چگونه باید ویژگیهای فریم قبلی به فریم فعلی تبدیل شوند. دیکودر هم با گرفتن فریم قبلی و همین توکن، ویژگیهای فریم جدید را بازسازی میکند.
اگر پیشبینی در فضای feature انجام شود و فقط تغییر بین فریمها مدل شود، یک توکن برای هر فریم میتواند کافی باشد. نتیجه، مدلی است که چند آینده محتمل تولید میکند، اما بسیار سبکتر و سریعتر از world modelهای مولد رایج است.
🔸 A Frame is Worth One Token: Efficient Generative World Modeling with Delta Tokens
#مدلهای_بنیادی #مدل_مولد #هوش_مصنوعی #بینایی_مدل_بنیادی #پردازش_تصویر #پردازش_فیلم
✅ @AI_DeepMind
🔸 @AI_Person
مدلهای پیشبینی آینده معمولاً دو مشکل دارند: یا discriminative هستند و فقط یک آینده میانگینشده تولید میکنند، یا اگر مولد باشند، مثل diffusion یا autoregressive video models، بسیار پرهزینهاند و برای هر نمونه آینده به چندین forward pass نیاز دارند. مقاله میگوید در کاربردهایی مثل خودرو خودران، یک پیشبینی واحد کافی نیست، چون آینده چندین حالت ممکن دارد.
ایده DeltaTok بهجای فشردهکردن کل فریم، فقط تفاوت ویژگیهای دو فریم پیاپی را فشرده میکند. فریمها ابتدا با یک Vision Foundation Model مثل DINOv3 به فضای feature تبدیل میشوند؛ سپس DeltaTok از ویژگیهای فریم قبلی و فعلی، یک delta token میسازد که نشان میدهد چگونه باید ویژگیهای فریم قبلی به فریم فعلی تبدیل شوند. دیکودر هم با گرفتن فریم قبلی و همین توکن، ویژگیهای فریم جدید را بازسازی میکند.
اگر پیشبینی در فضای feature انجام شود و فقط تغییر بین فریمها مدل شود، یک توکن برای هر فریم میتواند کافی باشد. نتیجه، مدلی است که چند آینده محتمل تولید میکند، اما بسیار سبکتر و سریعتر از world modelهای مولد رایج است.
🔸 A Frame is Worth One Token: Efficient Generative World Modeling with Delta Tokens
#مدلهای_بنیادی #مدل_مولد #هوش_مصنوعی #بینایی_مدل_بنیادی #پردازش_تصویر #پردازش_فیلم
✅ @AI_DeepMind
🔸 @AI_Person
❤6👌1
Forwarded from DeepMind AI Expert
فروش فیلترشکن قابل ارایه و پشتیبانی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
۱۰ گیگ 170
۱۵گیگ 255
۲۵گیگ 425
۴۵گیگ 765
۹۰ گیگ 1530
فروش فیلترشکن OpenVPN قابل ارایه و پشتیبانی حتی در زمان نت ملی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
مناسب همه فعالیتها قابل استفاده در زمان قطعی نت، چند کاربره و یک ماهه
ا IP ثابت آمریکا، آلمان، ترکیه موجود هست.
مناسب استفاده شخصی، شرکتها و استارت آپ ها، تریدرها و دارای IP ثابت
حداکثر سرعت قابل ارایه 16 مگابایت
@Farzadh1h
۱۰ گیگ
۱۵گیگ 255
۲۵گیگ 425
۴۵گیگ 765
۹۰ گیگ 1530
فروش فیلترشکن OpenVPN قابل ارایه و پشتیبانی حتی در زمان نت ملی برای تمام پلتفرمهای هوش مصنوعی و ... بدون ضریب
مناسب همه فعالیتها قابل استفاده در زمان قطعی نت، چند کاربره و یک ماهه
۱۱۰ گیگ تعداد کاربر نامحدود 3700
55 گیگ تعداد کاربر نامحدود 2700
حجم و تعداد کاربر نامحدود ۷ میلیون
ا IP ثابت آمریکا، آلمان، ترکیه موجود هست.
مناسب استفاده شخصی، شرکتها و استارت آپ ها، تریدرها و دارای IP ثابت
حداکثر سرعت قابل ارایه 16 مگابایت
@Farzadh1h
در مدلهای Transformer، برای هر توکن تولیدشده، بردارهای Key و Value ذخیره میشوند تا مدل برای توکنهای بعدی دوباره همه چیز را محاسبه نکند. این همان روش KV cache در این #مقاله است. اما هرچه خروجی طولانیتر شود، این cache بزرگتر میشود و ممکن است GPU از حافظه خالی شود؛ مثال مقاله میگوید Qwen3-32B با وزنهای ۴ بیتی روی GPU 24GB حدوداً بعد از ۲۴ هزار توکن به OOM میرسد.
روشهایی مثل StreamingLLM، H2O و SnapKV سعی میکنند فقط توکنهای مهم را نگه دارند: توکنهای ابتدایی موسوم به attention sinks، توکنهای اخیر، و توکنهایی که attention زیادی گرفتهاند یا «heavy hitters» هستند. این روشها در بنچمارکها مفیدند، اما اغلب فرض میکنند میتوانند امتیازهای attention را ببینند.
پیشنهاد مقاله حاضر استفاده از TriAttention بهجای نگاه کردن به attention scoreهای runtime، از هندسه بردارهای Q/K قبل از RoPE استفاده میکند تا پیشبینی کند کدام KV entry مهم است. چون به attention score نیاز ندارد، با FlashAttention تعارض ندارد. سپس با تکنیکهایی مثل forward-packing compaction یا hole-filling توکنهای باقیمانده را فشرده و کنار هم میچیند تا blockهای کامل واقعاً آزاد شوند.
دلیل اینکه این مقاله خوب است چون که فشردهسازی KV cache فقط یک مسئله الگوریتمی نیست؛ باید با kernelها، allocatorها و نحوه مدیریت واقعی حافظه GPU سازگار باشد. TriAttention موفقتر است چون هم نیاز به attention scoreهای غیرقابلدسترسی را حذف میکند، هم بعد از eviction حافظه را واقعاً compact میکند تا blockهای GPU آزاد شوند.
🔸 KV Cache Compression and Its Infra Problems
#هوش_مصنوعی #پردازش_زبان_طبیعی
✅ @AI_DeepMind
🔸 @AI_Person
روشهایی مثل StreamingLLM، H2O و SnapKV سعی میکنند فقط توکنهای مهم را نگه دارند: توکنهای ابتدایی موسوم به attention sinks، توکنهای اخیر، و توکنهایی که attention زیادی گرفتهاند یا «heavy hitters» هستند. این روشها در بنچمارکها مفیدند، اما اغلب فرض میکنند میتوانند امتیازهای attention را ببینند.
پیشنهاد مقاله حاضر استفاده از TriAttention بهجای نگاه کردن به attention scoreهای runtime، از هندسه بردارهای Q/K قبل از RoPE استفاده میکند تا پیشبینی کند کدام KV entry مهم است. چون به attention score نیاز ندارد، با FlashAttention تعارض ندارد. سپس با تکنیکهایی مثل forward-packing compaction یا hole-filling توکنهای باقیمانده را فشرده و کنار هم میچیند تا blockهای کامل واقعاً آزاد شوند.
دلیل اینکه این مقاله خوب است چون که فشردهسازی KV cache فقط یک مسئله الگوریتمی نیست؛ باید با kernelها، allocatorها و نحوه مدیریت واقعی حافظه GPU سازگار باشد. TriAttention موفقتر است چون هم نیاز به attention scoreهای غیرقابلدسترسی را حذف میکند، هم بعد از eviction حافظه را واقعاً compact میکند تا blockهای GPU آزاد شوند.
🔸 KV Cache Compression and Its Infra Problems
#هوش_مصنوعی #پردازش_زبان_طبیعی
✅ @AI_DeepMind
🔸 @AI_Person
❤6👍1👌1
اگر طلا دارین نفروشید درگیر جو حاضر نشید. خواستید بخرید ولی نفروشید. اگر میخواین بخرید طلا، مس، نفت بخرید البته روی پلتفرم های خارنجی
👍20