Silicon Brain | جامعه هوش مصنوعی
7.07K subscribers
1.06K photos
120 videos
60 files
524 links
مغز سیلیکونی|جامعه هوش مصنوعی و یادگیری ماشین

گروه بحث و تبادل نظر:
https://xn--r1a.website/+SWbgmMZt0XU0MGY0

مطالب و بحث های بیشتر در اینستاگرام:
https://www.instagram.com/silicon_brain/

ارتباط با ادمین:
@silicon_brain_admin
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
لیست مدل‌های در دسترس در پلتفرم هوش مصنوعی ژرف
میتونین مدل‌های متنی و تصویری شرکت‌های مختلف رو فیلتر و مقایسه کنین
chat.zharph.com
5👍2👎1😍1
برای AI Engineering یه عالمه اصطلاح هست که شبیه هم به نظر میان، ولی معنی کاملاً متفاوتی دارن.
مثل:

Authentication vs Authorization

Authentication
مثلاً login کردن با password یا JWT token
Authorization
یعنی: به چی اجازه دسترسی داری؟
مثلاً یه user عادی نمی‌تونه به admin panel دسترسی داشته باشه.

Latency vs Throughput Latency

Latency
یعنی سرعت پاسخ‌دهی به یه request مثلاً API تو توی ۲۰۰ms جواب می‌ده.

Throughput
یعنی سیستم در کل چند request رو می‌تونه هندل کنه.
مثلاً ۱۰هزار request در ثانیه.

ممکنه latency خوب باشه ولی throughput ضعیف؛ یعنی هر request سریع جواب بگیره، ولی سیستم زیر load سنگین crash کنه.

Rate Limiting vs Throttling

Rate Limiting
یعنی محدود کردن تعداد requestها.
مثلاً هر user فقط ۱۰۰ request در دقیقه.
Throttling
یعنی وقتی سیستم تحت فشار رفت، requestها رو آهسته یا محدود کنیم تا server نابود نشه

Tool vs MCP

Tool
یعنی یه قابلیت که AI می‌تونه صداش کنه.
مثلاً search، database query یا اجرای کد
MCP
یه protocol استاندارده که AI رو به toolها و data sourceها وصل می‌کنه.

Memory vs Context Engineering

Memory چیزیه که AI در طول زمان نگه
می‌داره.
مثلاً اینکه اسم user چیه یا پروژه قبلیش چی بوده.
Context Engineering
یعنی ما تصمیم بگیریم همین الان چه اطلاعاتی به مدل نشون داده بشه.

توی AI appها، context engineering خیلی مهم‌تر از prompt engineering هست
Load Balancer vs API Gateway

Load Balancer
ترافیک رو بین چند server پخش می‌کنه تا overload نشه.
API Gateway
ورودی همه APIها رو مدیریت می‌کنه؛ مثل authentication، rate limiting، logging و routing.

@silicon_brain I از هوش مصنوعی عقب نمانید
👍104🔥3❤‍🔥1
مدل جدید ‏Google DeepMind به اسم Gemini Embedding 2 (GE 2) می‌تونه هم‌زمان متن، تصویر، صدا و ویدیو رو داخل یه فضای مشترک بفهمه

مدل‌های embedding معمولاً هر ورودی رو تبدیل به یه بردار عددی می‌کنن تا AI بتونه معنی و شباهت بین دیتاها رو بفهمه. پشت‌صحنه تقریباً همه سیستم‌های semantic search، recommendation system و RAG همین embeddingها کار می‌کنن.

این مدل با استفاده از contrastive learning روی benchmarkهای مهم مثل MSCOCO، Vatex، MTEB multilingual و MTEB Code عملکرد state-of-the-art داشته
گوگل می‌گه این مدل می‌تونه برای RAG، semantic search، recommendation system و AI assistantهای multimodal خیلی کاربردی باشه

لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
7👍5
سوالات مهم در مصاحبه پوزیشن
GenAl / Agentic Al Engineer

Round 1 - Technical Questions

🔹️ What is Generative Al?
🔹️ Explain Retrieval-Augmented Generation (RAG)
🔹️What are embeddings in Al svstems?
🔹️Explain chunking in RAG pipelines.
🔹️Difference between fine-tuning and prompt engineering?
🔹️What is AWS Bedrock?
🔹️Explain Claude and Titan models in AWS Bedrock.
🔹️What are guardrails in GenAl systems
🔹️Explain LangChain architecture.
🔹️What is LangGraph used for?
🔹Explain agentic Al workflows.
🔹Difference between single-step and multi-step agents?
🔹️What are vector databases?
🔹️Explain API integration in GenAl applications
🔹️What is grounding in RAG systems
🔹️Explain token usage optimization
🔹What are hallucinations in LLMs
🔹How do you reduce hallucinations
🔹Explain prompt engineering techniques
🔹️What is asynchronous programmina in Pvthon?
🔹️Explain OOP concepts in Python
🔹️What are pytest fixtures?
🔹️ Explain Docker basics.
🔹️What is CI/CD pipeline?
🔹️Explain model latency optimization
🔹️ What is retrieval intearation in Bedrock?
🔹️Explain LLM evaluation methods
🔹️What is Git branching strategy?
🔹️How do you secure GenAl applications?
🔹Explain production deployment of Al systems
13👍4🔥1
انودیا یه روش جدید به اسم X-Token معرفی کرده که یه مشکل مهم توی Knowledge Distillation (KD) رو حل می‌کنه. معمولاً برای انتقال دانش از یه teacher model بزرگ به یه student model کوچیک، هر دو مدل باید از یه tokenizer استفاده کنن.

اما مدل‌هایی مثل Llama، Qwen و Phi tokenizerهای متفاوتی دارن و همین باعث می‌شه نتونن به‌خوبی از هم یاد بگیرن.
روش‌های قبلی مثل ULD و GOLD سعی کرده بودن این مشکل رو حل کنن، ولی وقتی دو tokenizer متن رو به شکل متفاوتی تکه‌تکه می‌کردن (مثلاً یک عدد را یک مدل در یک token و مدل دیگر در چند token ذخیره می‌کرد)، کیفیت distillation به‌شدت افت می‌کرد.

اما X-Token این محدودیت رو برطرف می‌کنه. مزیتش اینه که بدون تغییر معماری مدل و بدون اضافه کردن component جدید، به‌عنوان جایگزین مستقیم KD loss قابل استفاده است.
نتیجه

انودیا گزارش داده X-Token به‌طور میانگین 3.82 امتیاز بهتر از GOLD هست و به مدل‌های کوچیک اجازه می‌ده از teacherهای قوی‌تری مثل Qwen3-4B یا Phi-4-mini یاد بگیرن حتی اگر tokenizerهای کاملاً متفاوتی داشته باشن.

@silicon_brain I از هوش مصنوعی عقب نمانید
9👍5🔥3
پارامتر‌های مهم برای یک مدل دیپلوی شده که باید مورد توجه باشه

Scalability

افزایش ناگهانی ترافیک و تعداد درخواست‌ها

Latency

مدل‌های بزرگ سرعت پاسخ‌دهی پایینی دارن

Cost

منابع GPU هزینه‌بر هستن

Monitoring

🔹️ارزیبای کیفیت پاسخ ها
🔹️خطاها (Errors)
🔹️توهم مدل(Hallucinations)

Security

محافظت از داده‌های حساس (Sensitive Data)

Versioning

نیاز به Model Version Control برای مدیریت نسخه‌های مختلف مدل

تنظیم و بررسی این پارامتر‌ها کیفیت نهایی مدل ساخته شده برای end-user رو تعیین میکنه


@silicon_brain I از هوش مصنوعی عقب نمانید
5👍2🙏1
شرکت Anthropic داره خودش رو برای ورود به بازار بورس آماده می‌کنه

ارزش Anthropic حدود 965 میلیارد دلار گزارش شده که از OpenAI (852 میلیارد دلار) هم بیشتره. همچنین revenue run-rate شرکت از 9 میلیارد دلار آخر سال قبل به 47 میلیارد دلار رسیده؛ رشد بزرگی که بیشتر به خاطر استفاده enterprise از Claude برای coding و workflow automation بوده.

البته هنوز قیمت سهم یا زمان دقیق عرضه مشخص نیست. ولی این حرکت نشون می‌ده Anthropic داره خودش رو برای ورود به فضای public market و شفافیت مالی بیشتر آماده می‌کنه
اتفاقی که می‌تونه روی آینده ابزارهایی مثل Claude و Claude Code هم تأثیر زیادی داشته باشه

@silicon_brain I از هوش مصنوعی عقب نمانید
7👍21
اخیرا OpenAI یه پلتفرم جدید به اسم Rosalind Biodefense معرفی کرده که مدل هوش مصنوعی تخصصی خودش در حوزه زیست‌شناسی یعنی GPT-Rosalind رو در اختیار تیم‌هایی قرار می‌ده که روی مقابله با همه‌گیری‌ها و امنیت زیستی کار می‌کنن.

این مدل برای کارهای علمی و زیستی ساخته شده و می‌تونه روی مولکول‌ها، پروتئین‌ها، ژن‌ها و داده‌های مربوط به بیماری‌ها تحلیل و استدلال انجام بده. کاربردش توی جمع‌بندی تحقیقات (evidence synthesis)، ساخت فرضیه (hypothesis generation)، طراحی آزمایش (experiment design) و تحلیل داده‌هاست؛

یعنی مثل یه دستیار هوشمند برای آزمایشگاه‌های تحقیقاتی عمل می‌کنه.

از این پلتفرم می‌شه برای مدل‌سازی شیوع بیماری (epidemiological modeling)، سیستم‌های هشدار زودهنگام (early-warning systems)، برنامه‌ریزی برای مقابله با شیوع، توسعه روش‌های تشخیص (diagnostics) و حتی طراحی واکسن و مهندسی پروتئین استفاده کرد.

نکته مهم اینه که دسترسی به GPT-Rosalind برای تیم‌های تأییدشده رایگانه و هزینه استفاده رو OpenAI پرداخت می‌کنه


@silicon_brain I از هوش مصنوعی عقب نمانید
13👍2
🔴 طبق گزارش WSJ، شرکت Anthropic خواستار یه توقف جهانی (global pause) در توسعه AI شده و هشدار داده که مدل‌های فعلی دارن به نقطه‌ای نزدیک می‌شن که بتونن بدون human oversight (نظارت انسانی) خودشون رو بهبود بدن.

این شرکت های AI هم خودشونو مسخره کردن، همین Anthropic مدام در حال رقابت با OpenAI، گوگل و Alibaba و .... برای تولید مدل های خفنه. هشدارشو به ما میده که اگه فرداروزی یه مشکلی پیش اومد بگه من قبلا گفتم مدل ها دارن از کنترل خارج میشن 😐

@silicon_brain | از هوش مصنوعی عقب نمانید
👍13🔥6👎2🌚1
حقیقتا دلم برای روزایی که Transformer تازه معرفی شده بود تنگ شده.
انگار همه‌چی تازه شروع شده بود. مدل‌ها، مقالات و ایده‌ها برای همه در دسترس بودن. Hugging Face تازه داشت رشد می‌کرد و یه حس قشنگ از دموکراسی توی AI شکل گرفته بود.
همه داشتن تحقیق می‌کردن، مدل آموزش میدادن...

الان ولی همه‌چی افتاده دست چند تا شرکت غول. از R&D گرفته تا سرو مدل‌ها، APIها، سرویس‌دهی و کل بیزینس AI رو گرفتن دستشون.

ما هم تهش هنر کنیم یه RAG روی مدل‌های خودشون می‌سازیم، چند تا tool وصل می‌کنیم، اسمشو می‌ذاریم محصول AI و خوشحال می‌شیم :)
👍81👎75
تویی که کلا سه ساله وارد فیلد AI شدی، دیسلایک نده 😂
تو درک نمیکنی، چون ظهور ChatGPT باعث شد تازه بفهمی AI چیه و علاقه مند شی بهش
🤣31👍19👎7👌1
بعد پست‌های بالا، رفتم اینستا اولین پستی که اومد این بود
لاشیا دارن همه چیو رصد میکنن😂
🤣34👍81
آنتروپیک یه گزارش جدید منتشر کرده که می‌گه مدل جدیدش یعنی Mythos Preview داره به سطحی می‌رسه که شاید تو آینده بتونه به ساخت نسخه‌های بعدی AI کمک کنه

هر نسخه از Claude رو با یه تست ثابت می‌سنجن: به مدل یه کد آموزش AI می‌دن و ازش می‌خوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic می‌شن، توسط خود Claude نوشته می‌شن، نه انسان‌ها.

توی آزمایش‌های تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسان‌ها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI می‌تونه مستقل کار کنه هم داره سریع زیاد می‌شه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام می‌داد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار می‌کنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍143🔥1😱1
میتونین با انواع مدل های قدرتمند متنی و تصویری
🔹 OpenAI
🔹 Anthropic
🔹 Google
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
👍42👎1
دستورات Claude
اگه به Claude دسترسی ندارین میتونین از طریق پلتفرم ژرف باهاش کار کنین

chat.zharph.com
🤣13👍7
جدیدا OpenAI راهنمای prompting برای GPT-5.5 رو منتشر کرده و پیام اصلیش اینه که کمتر توضیح بده، نتیجه بهتر بگیر

برخلاف نسل‌های قبلی، توی GPT-5.5 معمولاً پرامپت‌های کوتاه‌تر و outcome-first بهتر جواب می‌دن. یعنی به‌جای اینکه مرحله‌به‌مرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیت‌هایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینه‌تر شده و خیلی وقت‌ها بدون مصرف محاسبات بیشتر هم نتیجه خوب می‌ده.

برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.

همچنین OpenAI پیشنهاد می‌کنه برای ساخت تجربه بهتر توی agentic UX و محصول‌های کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.

خلاصه اینکه توی GPT-5.5 به‌جای اینکه مسیر حل مسئله رو کامل دیکته کنی، بهتره فقط هدف، محدودیت‌ها و خروجی موردنظر رو مشخص کنی و اجازه بدی مدل خودش مسیر بهینه رو پیدا کنه
این می‌تونه کم‌کم آغازی برای پایان مفاهیمی مثل prompt engineering باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
👍72
همونطور که در پست قبلی مطرح شد مفهوم Prompt Engineering دیگه داره به پایانش می‌رسه و بعضی ها معتقد هستند که جای خودش رو به Loop Engineering میده.
حالا Loop Engineering چیه؟

به جای اینکه دستی برای ایجنت پرامپت بنویسید، خروجی بگیرید و ارورها رو دوباره به خورد مدل بدید، یک سیستم طراحی می‌کنید که خودش کار رو پیدا کنه، انجام بده، با ابزارهای واقعی تست کنه و در صورت خطا خودش رو اصلاح کنه. این تغییر پارادایم، باتل‌نک توسعه رو از سرعت تایپ انسان به طراحی سیستم‌های خودکار و مستقل منتقل کرده.
چالش های اصلی Loop Engineering

پیاده‌سازی لوپ‌ها روی کاغذ جذابه اما تو واقعیت به شدت پرهزینه است. یک لوپ ساده برای یک تسک برنامه‌نویسی می‌تونه به راحتی بین ۵۰ تا ۲۰۰ هزار توکن مصرف کنه.
اگه محدودیت نذارید و از مدل‌های گرون‌قیمت استفاده کنید، تو چند روز کل بودجه API شما نابود میشه. دلیل اینکه این روزها پیاده‌سازی لوپ منطقی شده، ظهور مدل‌های ارزون‌قیمت با کانتکست بالا (مثل سری DeepSeek V4) هست که اجازه میدن ایجنت‌ها بدون نگرانی از هزینه، بارها خطا کنن و خودشون رو دیباگ کنن.

@silicon_brain | از هوش مصنوعی عقب نمانید
👍63🔥1
گفتم حالا که جام جهانی شروع میشه و فرصت خوبی هست عملکرد AI رو در مورد پیش بینی نتایج فوتبال مورد بررسی قرار بدیم.
یه کانال ساختم و پیش بینی نتایج بازی ها رو قبل از شروع بازی میذارم تو این کانال:
@preaiball
اگه فرصت کنم یه بنچمارک تعریف میکنم تا خطای هر بخش از پیش بینی رو اعلام کنه و آخر جام جهانی یه بنچمارک استاندارد از عملکرد AI تو این رقابت ها داشته باشیم.
لطفا عضو شین و حمایت کنین ببینیم چی میشه. مرسی ❤️
@preaiball
👍9🔥2