DeepMind AI Expert
15K subscribers
1.31K photos
390 videos
122 files
2.34K links
مقالات کاربردی هوش مصنوعی در پایتون، علوم پزشکی، علوم انسانی، علوم اعصاب و...
دوره های آموزشی از دانشگاه های بزرگ و موسسات انلاین
پژوهشگران هوش مصنوعی ایران
http://xn--r1a.website/AI_DeepMind?direct
تبادلات پیام بدید
Download Telegram
مقاله BreastGPT را معرفی می‌کند: یک مدل زبانی-بینایی چندوجهی برای کل زنجیره‌ی بالینی سرطان پستان، از غربالگری تا تشخیص و برنامه‌ریزی درمان. ایده‌ی اصلی مقاله این است که مدل‌های فعلی پزشکی معمولاً روی یک modality یا یک وظیفه‌ی محدود ارزیابی می‌شوند، در حالی‌که کار واقعی سرطان پستان نیازمند استدلال روی ماموگرافی، سونوگرافی، CT، MRI و اسلایدهای پاتولوژی با مقیاس گیگاپیکسلی است.
مدل‌های عمومی قدرتمند الزاما در workflow تخصصی سرطان پستان خوب نیستند. مقاله نشان می‌دهد حتی مدل‌های frontier در دانشی مثل BI-RADS، subtype مولکولی، تفسیر MRI چندپارامتری و grounding سه‌بعدی کمبود دارند.
در pretraining پزشکی عمومی کافی نیست. مدل‌های medical-specific موجود در این بنچمارک مزیت واضحی نسبت به مدل‌های عمومی هم‌اندازه نشان نداده‌اند، بنابراین داده‌ی تخصصی و هم‌راستا با workflow بسیار مهم است.
روش token compression برای WSIها حیاتی است. انتخاب‌گر concept-preserving کمک می‌کند مدل بدون از دست دادن شواهد مهم پاتولوژیک، اسلایدهای عظیم را در بودجه‌ی توکنی محدود پردازش کند. در ablationها هم LongNet، پوشش بصری و هم‌راستایی متن-تصویر هرکدام بهبود افزایشی ایجاد کرده‌اند.
🔸 BreastGPT: A Multimodal Large Language Model for the Full Spectrum of Breast Cancer Clinical Routine

#پزشکی #زیست_شناسی #ژنتیک #ایده_جذاب #پردازش_تصویر #پردازش_فیلم #مقاله #علوم_پزشکی #دیتاست


@AI_DeepMind
🔸 @AI_Person
6👍1🔥1👌1
در هفته گذشته این مقالات به نظرم خیلی جالب بودند.

🔸 DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation
🔸 A Bitter Lesson for Data Filtering
🔸 Neural Weight Norm = Kolmogorov Complexity
🔸 When Does LeJEPA Learn a World Model?
🔸 Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference
🔸 Parallax: Parameterized Local Linear Attention for Language Modeling
🔸 Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini
🔸 Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments
🔸 The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence
🔸 Looped Diffusion Language Models
🔸 LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding
اگرمدلهای anything رو دنبال کرده باشید اونجا بعضی مقالات دنبال این بودند که بتوانند همه چی ببینن و بگن موقعیتش چیه و کجاست؟! وایده‌ی اصلی آن ساده ولی مؤثر است: مختصات جعبه را مثل متن عادی تولید نکن؛ جعبه را به‌عنوان یک واحد هندسی کامل پیش‌بینی کن. این طراحی باعث می‌شود مدل در taskهای متنوعی مثل object detection، GUI grounding، OCR، layout parsing و referring expression هم سریع‌تر و هم دقیق‌تر باشد. اگر نتایج در پیاده‌سازی‌های مستقل تأیید شود، PBD می‌تواند به یک الگوی مهم برای نسل بعدی مدل‌های vision-language grounding تبدیل شود.
🔸 Learn from your own latents and not from tokens: A sample-complexity theory

#مقاله #ایده_جذاب #هوش_مصنوعی #پردازش_تصویر #بینایی_ماشین


@AI_DeepMind
🔸 @AI_Person
13👌2
از خارج کشور کی اینجا gpt تیمی داره منم عضو کنه 🚶‍♂
3👍2
در این مقاله بررسی کردند که چگونه یادگیری پایدارتر و دقیق تر را با RL ایجاد کنیم؟!

🔸 Long-Horizon Q-Learning: Accurate Value Learning via n-Step Inequalities

#یادگیری_تقویتی #الگوریتمها #مقاله


@AI_DeepMind
🔸 @AI_Person
4
https://jobinja.ir/companies/mohaymen/jobs/trY2/%D8%A7%D8%B3%D8%AA%D8%AE%D8%AF%D8%A7%D9%85-data-engineer-%D8%AF%D8%B1-%D9%85%D9%87%DB%8C%D9%85%D9%86?_ref=16&_t=352e3131332e33312e323333

دوستان در شرکت مهیمن دنبال مهندس داده هستند امکان ریفر مستقیم به hr این مجموعه رو دارم اگه میخاین رزومتون رو برام بفرستید

#استخدام
4🍓1
DeepMind AI Expert
از خارج کشور کی اینجا gpt تیمی داره منم عضو کنه 🚶‍♂
این پیام تبلیغ نیست❤️
این مدتی که دنبال chatgpt بودم این آقا با قیمت خوب و خیلی خیلی پایین و قانونی بهم تحویل داد
از طرف من برید بهتون تخفیف خوبی میدن
Gemini 6 months: 850T
Chatgpt go: 1.200T
Chatgpt plus: 3T

البته سرویس های مختلف دیگه مثل‌گیمینگ یا اسپاتیفای و .. هم موجود داره خواستید ازش بپرسید
لینک کانالش
@rexgame_ir
و پیویش
@amoo_rexi
🔥75
Forwarded from Twitter (X) Media Downloader
Media is too big
VIEW IN TELEGRAM
🚨 Anthropic just showed a 27-minute workshop on how to actually do prompts for Claude.

Taught by the people who built it.

Free. No registration. No paywall.

I've seen $300 courses that don't cover what they teach in the first 8 minutes.

Watch it and bookmark it now.

🔗 Rohit (@ai_rohitt)
👍52
Forwarded from Twitter (X) Media Downloader
Media is too big
VIEW IN TELEGRAM
Andrej Karpathy:

“Vibe coding is incredible. But agentic engineering is the next level.

90% of my coding routine is automated by AI agents.”

In this 30-minute talk, Andrej Karpathy explains how to build an AI agent workflow from scratch.

Worth more than 500$ agentic engineering course on the internet.

Watch it today, then read the article below.

🔗 Movez (@0xMovez)


🔗 Algomizer | LLM Optimization (@algomizercom):

👍51
انویدیا دسترسی رایگان و بدون محدودیت به API بیش از ۷۰ مدل زبانی را فراهم کرده است؛ امکانی که قبلاً هزینه‌بر بود. فرصت تست، ساخت و آزمایش بدون نگرانی مالی پیش رو است. تا فرصت هست استفاده کنید. این مدلها دسته بندی برای همه کارها انجام گرفته است در هر رشته ای که هستید به دسته بندی خودتون مراجعه کنید و مناسب نیازتون دسترسی بگیرید.

https://build.nvidia.com/models

#هوش_مصنوعی #الگوریتمها #داروسازی #علوم_پزشکی #مقاله

@AI_DeepMind
🔸 @AI_Person
23
DeepMind AI Expert
در هفته گذشته این مقالات به نظرم خیلی جالب بودند. 🔸 DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation 🔸 A Bitter Lesson for Data Filtering 🔸 Neural Weight Norm = Kolmogorov Complexity 🔸 When Does LeJEPA Learn a World Model?…
ایده های جذابی که در حیطه علوم پزشکی در #هوش_مصنوعی مطالعه کردم برای پیشنهاد مطالعه و تحقیق به شما پیشنهاده میشود.

🔸 Better with Experience: Self-Evolving LLM Agents for Evidence-Grounded Health Community Notes
🔸 FiLM-Based Speaker Conditioning of a SpeechLLM for Pathological Speech Recognition
🔸 Three-Dimensional Retinal Microvasculature Restoration in OCT Angiography
🔸 Modeling and Interpreting Teamwork Dynamics in Cancer Care Outcome Prediction
🔸 L-TGVN: Leveraging Longitudinal Priors for Personalized Rapid MRI
🔸 Towards World Models in Biomedical Research
🔸 Computation-Aware Kalman Filtering with Model Selection for Neural Dynamics
🔸 PAMF: Prior-Aware Multimodal Fusion for Incomplete Time Series Data
🔸 AlloGen: Conformation-Selective Binder Generation with Differential State Scoring
🔸 Boosting Brain-to-Image Decoding with TRIBE v2 Data Augmentation
🔸 EasyLens: A Training-Free Plug-and-Play Subtle-Lesion Representation Amplifier for Medical Vision-Language Models
🔸 GLINT: Sparsely Gated Vision-Language Alignment for Fine-Grained Radiology Representations
🔸 Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases
🔸 scTranslation: A Comprehensive Benchmark for Single-Cell Multi-Omics Modality Translation
🔸 Benchmarking Counterfactual Prediction in Epidemic Time Series with Time-Varying Interventions
🔸 ClinicalMC: A Benchmark for Multi-Course Clinical Decision-Making with Large Language Models
🔸 A Vision-language Framework for Comparative Reasoning in Radiology
🔸 An Infectious Disease Spread Simulation Based on Large Language Model Decision Making
🔸 Multi-Camera AR Guidance System for Surgical Instrument Handling and Assembly: Investigating Workload and Efficiency
🔸 Multi-Camera AR Guidance System for Surgical Instrument Handling and Assembly: Investigating Workload and Efficiency
🔸 p-adic Bi-Filtrations for Topological Machine Learning on Genomic Sequences


#مقاله #ایده_جذاب #هوش_مصنوعی #پردازش_تصویر #بینایی_ماشین #علوم_پزشکی #ژنتیک #زیست_شناسی


@AI_DeepMind
🔸 @AI_Person
🔥53
ارسالی همراهان کانال:

📚 میان هیاهوی شبکه‌های اجتماعی، هنوز هم می‌شود چند دقیقه‌ای را به کتاب اختصاص داد.
در این کانال، کتاب‌های منتخب را با صدای خودم روایت می‌کنم تا بتوانید در مسیر، هنگام استراحت یا پیش از خواب، به دنیای کتاب‌ها سفر کنید.
🎙 روایت کتاب 📖 معرفی آثار ماندگار 🌱 یادگیری و لذت شنیدن

https://xn--r1a.website/MindCast1
2
Forwarded from 𝒥𝒾𝓂𝓂𝒴
گر دنبال دسترسی رایگان به GPT-5.5 هستید، می‌توانید از Freemodel استفاده کنید و API Key اختصاصی دریافت کنید. 👇

📌 مراحل ثبت‌نام:

1️⃣ وارد سایت freemodel شوید.
2️⃣ با حساب Gmail ثبت‌نام کنید.
3️⃣ پس از ورود، صفحه احراز هویت نمایش داده می‌شود: 🔹 بخش اول: احراز هویت با شماره تلفن 🔹 بخش دوم: احراز هویت با تلگرام

گزینه احراز هویت با تلگرام را انتخاب کنید.  لینک ربات تلگرام برای شما نمایش داده می‌شود. وارد ربات شوید و استارت را بزنید

🎉 پلن Pro برای شما فعال می‌شود:
هر ۵ ساعت: ۱۰ دلار اعتبار  هر هفته: ۶۶ دلار اعتبار 💰

4️⃣ از منوی سایت وارد بخش API Keys
شوید و یک API Key جدید بسازید.
5️⃣ در بخش Docs می‌توانید مستندات کامل استفاده از API را مطالعه کنید.

🛠 تنظیمات نمونه:
model_provider = "freemodel" model = "gpt-5.5" model_reasoning_effort = "xhigh" disable_response_storage = true preferred_auth_method = "apikey" [model_providers.freemodel] name = "freemodel" base_url = "https://api.freemodel.dev" wire_api = "responses"

🤖 حالا API Key و مشخصات بالا را به هوش مصنوعی موردنظر خود بدهید و از آن بخواهید برایتان کد تولید کند:

JavaScript HTML Python PHP Node.js و بسیاری زبان‌های دیگر...

💡  می‌توانید با آن: 🔹 ربات تلگرام بسازید 🔹 وب‌سایت طراحی کنید 🔹 ابزارهای اتوماسیون ایجاد کنید 🔹 پروژه‌های هوش مصنوعی توسعه دهید

🔥 فرصت خوبی برای تست GPT-5.5 بدون پرداخت هزینه است.
7🍓3👍1
شرکت آنتروپیک (Anthropic) به‌تازگی مدل هوش مصنوعی قدرتمند «کلود فیبل ۵» (Claude Fable 5) را که نسخه‌ای عمومی از مدل پیشرفته «میتوس» (Mythos) است، عرضه کرد. این مدل در حوزه‌های مهندسی نرم‌افزار، کارهای دانشی و بینایی عملکردی ممتاز دارد. با این حال، به دلیل ملاحظات امنیتی در زمینه‌های حساسی مانند امنیت سایبری، زیست‌شناسی و شیمی، محدودیت‌های سخت‌گیرانه‌ای اعمال شده و در صورت نیاز، مدل به‌صورت خودکار به نسخه «Opus 4.8» ارجاع داده می‌شود. دسترسی به این فناوری اکنون از طریق API و طرح‌های سازمانی فراهم شده و شرکت برای تضمین امنیت و جلوگیری از حملات «جیلبریک»، سیاست‌های جدیدی برای نگهداری ۳۰ روزه ترافیک داده‌ها اتخاذ کرده است. طبق تست‌های شخص ثالث، این مدل در کارهای تحلیلی پیچیده و کدنویسی عملکردی بی‌نظیر دارد، اما قیمت‌گذاری آن (۱۰ دلار برای هر میلیون توکن ورودی و ۵۰ دلار برای خروجی) دو برابر مدل‌های قبلی است. با وجود هزینه‌های بالا و چالش‌های مدیریت بودجه، برخی سازمان‌ها معتقدند که قابلیت‌های استدلال خودمختار و دقت بالای کلود فیبل ۵، توجیه‌کننده هزینه‌های سرمایه‌گذاری برای آن‌هاست. این عرضه هم‌زمان با آماده‌سازی آنتروپیک برای ورود به بازارهای عمومی و در شرایطی صورت می‌گیرد که بحث‌های جدی درباره توسعه خودمختار هوش مصنوعی و نیاز به مکانیسم‌های نظارتی جهانی در جریان است.

#هوش_مصنوعی


@AI_DeepMind
🔸 @AI_Person
10👍1
Forwarded from Mathematical Musings
مادرهای ایرانی سال‌ها اعتقاد داشتند که جام جهانی رو می‌ندازن فصل امتحانات که بچه‌ها رو از درس خوندن بندازن.
حالا مقاله‌اش در اومده!
بازی‌های جام جهانی فوتبال بر عملکرد درسی افراد، تاثیر معناداری داره و در بین دانش‌آموزهای علاقه‌مند به فوتبال و دارای شرایط اقتصادی اجتماعی پایین‌تر، بیشتر.
https://www.sciencedirect.com/science/article/abs/pii/S0047272718302330
6🕊2🍓1🆒1
ا API مدل Whisper (تشخیص صوت) برای استفاده پزشکان هندی در اختیار آنها قرار گرفت.

https://medium.com/@ClinicalAI/whisper-api-for-clinical-voice-notes-10-minute-setup-guide-for-indian-doctors-e114cc8483fd

#هوش_مصنوعی #الگوریتمها #مقاله

@AI_DeepMind
🔸 @AI_Person
5
این مقاله درباره استفاده Foundation Models مانند SAM، SAM2 و MedSAM برای تحلیل خودکار MRI اسکلتی-عضلانی است و نشان می‌دهد که چگونه می‌توان از تصاویر MRI معمولی، بیومارکرهای کمی و قابل‌اعتماد استخراج کرد و آن‌ها را برای تصمیم‌گیری بالینی به کار برد.
استفاده از مدل‌های بنیادی مانند SAM2 می‌توان MRIهای اسکلتی عضلانی را به‌طور خودکار به بیومارکرهای دقیق و قابل‌استفاده در پزشکی شخصی‌سازی‌شده تبدیل کرد؛ بیومارکرهایی که هم به کاهش بار کاری پزشکان کمک می‌کنند و هم می‌توانند خطر پیشرفت بیماری و نیاز به جراحی را پیش‌بینی کنند.

🔸 Clinical utility of foundation models in musculoskeletal MRI for biomarker fidelity and predictive outcomes


#مقاله #ایده_جذاب #هوش_مصنوعی #پردازش_تصویر #بینایی_ماشین #علوم_پزشکی #مدل_بنیادی


@AI_DeepMind
🔸 @AI_Person
👌83👍2
کلاس آموزشی یادگیری تقویتی مدلهای زبانی بزرگ از دانشگاه لس انجلس
Reinforcement Learning of Large Language Models, Spring 2025(UCLA)

🔸 Youtube playlist
🔸 Website

Great set of new lectures on reinforcement learning of LLMs. Covers a wide range of topics related to RLxLLMs such as basics/foundations, test-time compute, RLHF, and RL with verifiable rewards(RLVR).

#هوش_مصنوعی #الگوریتمها #یادگیری_تقویتی #کلاس_آموزشی #فیلم #پردازش_زبان_طبیعی

@AI_DeepMind
🔸 @AI_Person
11