شیر یا خط اومدن در پرتاب سکه واقعا تصادفی است؟ آیا کامپیوتر میتونه اعداد تصادفی واقعی تولید میکنه؟
Anonymous Quiz
21%
بله، بله
39%
بله، خیر
8%
خیر، بله
32%
خیر، خیر
👍3❤1👎1
یه تحقیق جدید روی بیشتر از ۲۰۰۰ training run انجام شده تا بفهمن راز ساخت Mixture of Experts (MoE) بهتر چیه
مدلهای MoE اینجوری کار میکنن که همه بخشهای مدل همزمان فعال نیستن. یعنی بیشتر model «خوابه» و فقط یه بخش کوچیک (expert) برای هر input فعال میشه.
🔹هرچی تعداد expertها بیشتر باشه، عملکرد بهتر میشه؛ حتی وقتی تعداد parameterهای غیرفعال خیلی بیشتر از activeها باشه
🔹اندازه expertها باید بر اساس active parameter budget تنظیم بشه، بعدش میتونی expert بیشتری اضافه کنی
🔹چیزهایی مثل shared experts یا اندازههای ترکیبی فقط complexity اضافه میکنن و سود خاصی ندارن
🔹مهمترین نکته اینه که موقع routing، token dropping اتفاق نیفته؛ بقیه موارد تاثیر خیلی کمی دارن
خلاصه تحقیق:
@silicon_brain I از هوش مصنوعی عقب نمانید
مدلهای MoE اینجوری کار میکنن که همه بخشهای مدل همزمان فعال نیستن. یعنی بیشتر model «خوابه» و فقط یه بخش کوچیک (expert) برای هر input فعال میشه.
مثل بیمارستانی که بهجای اینکه همه دکترها همه مریضها رو ببینن، هر مریض میره پیش متخصص خودش. نتیجه؟ سریعتر، ارزونتر و بهینهتر.مشکل این بود که کسی دقیق نمیدونست توی طراحی MoE چه چیزهایی واقعاً مهمن. برای همین تیم تحقیقاتی بیش از ۲۰۰۰ مدل مختلف آموزش داده تا جوابشو پیدا کنه.
نتایج
🔹هرچی تعداد expertها بیشتر باشه، عملکرد بهتر میشه؛ حتی وقتی تعداد parameterهای غیرفعال خیلی بیشتر از activeها باشه
🔹اندازه expertها باید بر اساس active parameter budget تنظیم بشه، بعدش میتونی expert بیشتری اضافه کنی
🔹چیزهایی مثل shared experts یا اندازههای ترکیبی فقط complexity اضافه میکنن و سود خاصی ندارن
🔹مهمترین نکته اینه که موقع routing، token dropping اتفاق نیفته؛ بقیه موارد تاثیر خیلی کمی دارن
خلاصه تحقیق:
برای ساخت MoE لازم نیست بیشازحد معمای رو پیچیده کنی؛ فقط تعداد expertها و اندازهشون رو درست تنظیم کن، بقیه چیزها اهمیت زیادی ندارنلینک مقاله
@silicon_brain I از هوش مصنوعی عقب نمانید
👍7❤4⚡1
Forwarded from Silicon Brain | جامعه هوش مصنوعی
This media is not supported in your browser
VIEW IN TELEGRAM
لیست مدلهای در دسترس در پلتفرم هوش مصنوعی ژرف
میتونین مدلهای متنی و تصویری شرکتهای مختلف رو فیلتر و مقایسه کنین
chat.zharph.com
میتونین مدلهای متنی و تصویری شرکتهای مختلف رو فیلتر و مقایسه کنین
chat.zharph.com
❤5👍2👎1😍1
برای AI Engineering یه عالمه اصطلاح هست که شبیه هم به نظر میان، ولی معنی کاملاً متفاوتی دارن.
مثل:
Authentication
مثلاً login کردن با password یا JWT token
Authorization
یعنی: به چی اجازه دسترسی داری؟
مثلاً یه user عادی نمیتونه به admin panel دسترسی داشته باشه.
Latency
یعنی سرعت پاسخدهی به یه request مثلاً API تو توی ۲۰۰ms جواب میده.
Throughput
یعنی سیستم در کل چند request رو میتونه هندل کنه.
مثلاً ۱۰هزار request در ثانیه.
ممکنه latency خوب باشه ولی throughput ضعیف؛ یعنی هر request سریع جواب بگیره، ولی سیستم زیر load سنگین crash کنه.
Rate Limiting
یعنی محدود کردن تعداد requestها.
مثلاً هر user فقط ۱۰۰ request در دقیقه.
Throttling
یعنی وقتی سیستم تحت فشار رفت، requestها رو آهسته یا محدود کنیم تا server نابود نشه
Tool
یعنی یه قابلیت که AI میتونه صداش کنه.
مثلاً search، database query یا اجرای کد
MCP
یه protocol استاندارده که AI رو به toolها و data sourceها وصل میکنه.
Memory چیزیه که AI در طول زمان نگه
میداره.
مثلاً اینکه اسم user چیه یا پروژه قبلیش چی بوده.
Context Engineering
یعنی ما تصمیم بگیریم همین الان چه اطلاعاتی به مدل نشون داده بشه.
توی AI appها، context engineering خیلی مهمتر از prompt engineering هست
Load Balancer
ترافیک رو بین چند server پخش میکنه تا overload نشه.
API Gateway
ورودی همه APIها رو مدیریت میکنه؛ مثل authentication، rate limiting، logging و routing.
@silicon_brain I از هوش مصنوعی عقب نمانید
مثل:
Authentication vs Authorization
Authentication
مثلاً login کردن با password یا JWT token
Authorization
یعنی: به چی اجازه دسترسی داری؟
مثلاً یه user عادی نمیتونه به admin panel دسترسی داشته باشه.
Latency vs Throughput Latency
Latency
یعنی سرعت پاسخدهی به یه request مثلاً API تو توی ۲۰۰ms جواب میده.
Throughput
یعنی سیستم در کل چند request رو میتونه هندل کنه.
مثلاً ۱۰هزار request در ثانیه.
ممکنه latency خوب باشه ولی throughput ضعیف؛ یعنی هر request سریع جواب بگیره، ولی سیستم زیر load سنگین crash کنه.
Rate Limiting vs Throttling
Rate Limiting
یعنی محدود کردن تعداد requestها.
مثلاً هر user فقط ۱۰۰ request در دقیقه.
Throttling
یعنی وقتی سیستم تحت فشار رفت، requestها رو آهسته یا محدود کنیم تا server نابود نشه
Tool vs MCP
Tool
یعنی یه قابلیت که AI میتونه صداش کنه.
مثلاً search، database query یا اجرای کد
MCP
یه protocol استاندارده که AI رو به toolها و data sourceها وصل میکنه.
Memory vs Context Engineering
Memory چیزیه که AI در طول زمان نگه
میداره.
مثلاً اینکه اسم user چیه یا پروژه قبلیش چی بوده.
Context Engineering
یعنی ما تصمیم بگیریم همین الان چه اطلاعاتی به مدل نشون داده بشه.
توی AI appها، context engineering خیلی مهمتر از prompt engineering هست
Load Balancer vs API Gateway
Load Balancer
ترافیک رو بین چند server پخش میکنه تا overload نشه.
API Gateway
ورودی همه APIها رو مدیریت میکنه؛ مثل authentication، rate limiting، logging و routing.
@silicon_brain I از هوش مصنوعی عقب نمانید
👍10❤4🔥3❤🔥1
مدل جدید Google DeepMind به اسم Gemini Embedding 2 (GE 2) میتونه همزمان متن، تصویر، صدا و ویدیو رو داخل یه فضای مشترک بفهمه
مدلهای embedding معمولاً هر ورودی رو تبدیل به یه بردار عددی میکنن تا AI بتونه معنی و شباهت بین دیتاها رو بفهمه. پشتصحنه تقریباً همه سیستمهای semantic search، recommendation system و RAG همین embeddingها کار میکنن.
این مدل با استفاده از contrastive learning روی benchmarkهای مهم مثل MSCOCO، Vatex، MTEB multilingual و MTEB Code عملکرد state-of-the-art داشته
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
مدلهای embedding معمولاً هر ورودی رو تبدیل به یه بردار عددی میکنن تا AI بتونه معنی و شباهت بین دیتاها رو بفهمه. پشتصحنه تقریباً همه سیستمهای semantic search، recommendation system و RAG همین embeddingها کار میکنن.
این مدل با استفاده از contrastive learning روی benchmarkهای مهم مثل MSCOCO، Vatex، MTEB multilingual و MTEB Code عملکرد state-of-the-art داشته
گوگل میگه این مدل میتونه برای RAG، semantic search، recommendation system و AI assistantهای multimodal خیلی کاربردی باشه
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
❤7👍5
سوالات مهم در مصاحبه پوزیشن
GenAl / Agentic Al Engineer
🔹️ What is Generative Al?
🔹️ Explain Retrieval-Augmented Generation (RAG)
🔹️What are embeddings in Al svstems?
🔹️Explain chunking in RAG pipelines.
🔹️Difference between fine-tuning and prompt engineering?
🔹️What is AWS Bedrock?
🔹️Explain Claude and Titan models in AWS Bedrock.
🔹️What are guardrails in GenAl systems
🔹️Explain LangChain architecture.
🔹️What is LangGraph used for?
🔹Explain agentic Al workflows.
🔹Difference between single-step and multi-step agents?
🔹️What are vector databases?
🔹️Explain API integration in GenAl applications
🔹️What is grounding in RAG systems
🔹️Explain token usage optimization
🔹What are hallucinations in LLMs
🔹How do you reduce hallucinations
🔹Explain prompt engineering techniques
🔹️What is asynchronous programmina in Pvthon?
🔹️Explain OOP concepts in Python
🔹️What are pytest fixtures?
🔹️ Explain Docker basics.
🔹️What is CI/CD pipeline?
🔹️Explain model latency optimization
🔹️ What is retrieval intearation in Bedrock?
🔹️Explain LLM evaluation methods
🔹️What is Git branching strategy?
🔹️How do you secure GenAl applications?
🔹Explain production deployment of Al systems
GenAl / Agentic Al Engineer
Round 1 - Technical Questions
🔹️ What is Generative Al?
🔹️ Explain Retrieval-Augmented Generation (RAG)
🔹️What are embeddings in Al svstems?
🔹️Explain chunking in RAG pipelines.
🔹️Difference between fine-tuning and prompt engineering?
🔹️What is AWS Bedrock?
🔹️Explain Claude and Titan models in AWS Bedrock.
🔹️What are guardrails in GenAl systems
🔹️Explain LangChain architecture.
🔹️What is LangGraph used for?
🔹Explain agentic Al workflows.
🔹Difference between single-step and multi-step agents?
🔹️What are vector databases?
🔹️Explain API integration in GenAl applications
🔹️What is grounding in RAG systems
🔹️Explain token usage optimization
🔹What are hallucinations in LLMs
🔹How do you reduce hallucinations
🔹Explain prompt engineering techniques
🔹️What is asynchronous programmina in Pvthon?
🔹️Explain OOP concepts in Python
🔹️What are pytest fixtures?
🔹️ Explain Docker basics.
🔹️What is CI/CD pipeline?
🔹️Explain model latency optimization
🔹️ What is retrieval intearation in Bedrock?
🔹️Explain LLM evaluation methods
🔹️What is Git branching strategy?
🔹️How do you secure GenAl applications?
🔹Explain production deployment of Al systems
❤13👍4🔥1
انودیا یه روش جدید به اسم X-Token معرفی کرده که یه مشکل مهم توی Knowledge Distillation (KD) رو حل میکنه. معمولاً برای انتقال دانش از یه teacher model بزرگ به یه student model کوچیک، هر دو مدل باید از یه tokenizer استفاده کنن.
اما مدلهایی مثل Llama، Qwen و Phi tokenizerهای متفاوتی دارن و همین باعث میشه نتونن بهخوبی از هم یاد بگیرن.
روشهای قبلی مثل ULD و GOLD سعی کرده بودن این مشکل رو حل کنن، ولی وقتی دو tokenizer متن رو به شکل متفاوتی تکهتکه میکردن (مثلاً یک عدد را یک مدل در یک token و مدل دیگر در چند token ذخیره میکرد)، کیفیت distillation بهشدت افت میکرد.
اما X-Token این محدودیت رو برطرف میکنه. مزیتش اینه که بدون تغییر معماری مدل و بدون اضافه کردن component جدید، بهعنوان جایگزین مستقیم KD loss قابل استفاده است.
انودیا گزارش داده X-Token بهطور میانگین 3.82 امتیاز بهتر از GOLD هست و به مدلهای کوچیک اجازه میده از teacherهای قویتری مثل Qwen3-4B یا Phi-4-mini یاد بگیرن حتی اگر tokenizerهای کاملاً متفاوتی داشته باشن.
@silicon_brain I از هوش مصنوعی عقب نمانید
اما مدلهایی مثل Llama، Qwen و Phi tokenizerهای متفاوتی دارن و همین باعث میشه نتونن بهخوبی از هم یاد بگیرن.
روشهای قبلی مثل ULD و GOLD سعی کرده بودن این مشکل رو حل کنن، ولی وقتی دو tokenizer متن رو به شکل متفاوتی تکهتکه میکردن (مثلاً یک عدد را یک مدل در یک token و مدل دیگر در چند token ذخیره میکرد)، کیفیت distillation بهشدت افت میکرد.
اما X-Token این محدودیت رو برطرف میکنه. مزیتش اینه که بدون تغییر معماری مدل و بدون اضافه کردن component جدید، بهعنوان جایگزین مستقیم KD loss قابل استفاده است.
نتیجه
انودیا گزارش داده X-Token بهطور میانگین 3.82 امتیاز بهتر از GOLD هست و به مدلهای کوچیک اجازه میده از teacherهای قویتری مثل Qwen3-4B یا Phi-4-mini یاد بگیرن حتی اگر tokenizerهای کاملاً متفاوتی داشته باشن.
@silicon_brain I از هوش مصنوعی عقب نمانید
❤9👍5🔥3
پارامترهای مهم برای یک مدل دیپلوی شده که باید مورد توجه باشه
افزایش ناگهانی ترافیک و تعداد درخواستها
مدلهای بزرگ سرعت پاسخدهی پایینی دارن
منابع GPU هزینهبر هستن
🔹️ارزیبای کیفیت پاسخ ها
🔹️خطاها (Errors)
🔹️توهم مدل(Hallucinations)
محافظت از دادههای حساس (Sensitive Data)
نیاز به Model Version Control برای مدیریت نسخههای مختلف مدل
@silicon_brain I از هوش مصنوعی عقب نمانید
Scalability
افزایش ناگهانی ترافیک و تعداد درخواستها
Latency
مدلهای بزرگ سرعت پاسخدهی پایینی دارن
Cost
منابع GPU هزینهبر هستن
Monitoring
🔹️ارزیبای کیفیت پاسخ ها
🔹️خطاها (Errors)
🔹️توهم مدل(Hallucinations)
Security
محافظت از دادههای حساس (Sensitive Data)
Versioning
نیاز به Model Version Control برای مدیریت نسخههای مختلف مدل
تنظیم و بررسی این پارامترها کیفیت نهایی مدل ساخته شده برای end-user رو تعیین میکنه
@silicon_brain I از هوش مصنوعی عقب نمانید
❤5👍2🙏1
شرکت Anthropic داره خودش رو برای ورود به بازار بورس آماده میکنه
ارزش
البته هنوز قیمت سهم یا زمان دقیق عرضه مشخص نیست. ولی این حرکت نشون میده Anthropic داره خودش رو برای ورود به فضای public market و شفافیت مالی بیشتر آماده میکنه
@silicon_brain I از هوش مصنوعی عقب نمانید
ارزش
Anthropic حدود 965 میلیارد دلار گزارش شده که از OpenAI (852 میلیارد دلار) هم بیشتره. همچنین revenue run-rate شرکت از 9 میلیارد دلار آخر سال قبل به 47 میلیارد دلار رسیده؛ رشد بزرگی که بیشتر به خاطر استفاده enterprise از Claude برای coding و workflow automation بوده.البته هنوز قیمت سهم یا زمان دقیق عرضه مشخص نیست. ولی این حرکت نشون میده Anthropic داره خودش رو برای ورود به فضای public market و شفافیت مالی بیشتر آماده میکنه
اتفاقی که میتونه روی آینده ابزارهایی مثل Claude و Claude Code هم تأثیر زیادی داشته باشه
@silicon_brain I از هوش مصنوعی عقب نمانید
❤7👍2⚡1
اخیرا OpenAI یه پلتفرم جدید به اسم Rosalind Biodefense معرفی کرده که مدل هوش مصنوعی تخصصی خودش در حوزه زیستشناسی یعنی GPT-Rosalind رو در اختیار تیمهایی قرار میده که روی مقابله با همهگیریها و امنیت زیستی کار میکنن.
این مدل برای کارهای علمی و زیستی ساخته شده و میتونه روی مولکولها، پروتئینها، ژنها و دادههای مربوط به بیماریها تحلیل و استدلال انجام بده. کاربردش توی جمعبندی تحقیقات (evidence synthesis)، ساخت فرضیه (hypothesis generation)، طراحی آزمایش (experiment design) و تحلیل دادههاست؛
از این پلتفرم میشه برای مدلسازی شیوع بیماری (epidemiological modeling)، سیستمهای هشدار زودهنگام (early-warning systems)، برنامهریزی برای مقابله با شیوع، توسعه روشهای تشخیص (diagnostics) و حتی طراحی واکسن و مهندسی پروتئین استفاده کرد.
نکته مهم اینه که دسترسی به GPT-Rosalind برای تیمهای تأییدشده رایگانه و هزینه استفاده رو OpenAI پرداخت میکنه
@silicon_brain I از هوش مصنوعی عقب نمانید
این مدل برای کارهای علمی و زیستی ساخته شده و میتونه روی مولکولها، پروتئینها، ژنها و دادههای مربوط به بیماریها تحلیل و استدلال انجام بده. کاربردش توی جمعبندی تحقیقات (evidence synthesis)، ساخت فرضیه (hypothesis generation)، طراحی آزمایش (experiment design) و تحلیل دادههاست؛
یعنی مثل یه دستیار هوشمند برای آزمایشگاههای تحقیقاتی عمل میکنه.
از این پلتفرم میشه برای مدلسازی شیوع بیماری (epidemiological modeling)، سیستمهای هشدار زودهنگام (early-warning systems)، برنامهریزی برای مقابله با شیوع، توسعه روشهای تشخیص (diagnostics) و حتی طراحی واکسن و مهندسی پروتئین استفاده کرد.
نکته مهم اینه که دسترسی به GPT-Rosalind برای تیمهای تأییدشده رایگانه و هزینه استفاده رو OpenAI پرداخت میکنه
@silicon_brain I از هوش مصنوعی عقب نمانید
❤13👍2
🔴 طبق گزارش WSJ، شرکت Anthropic خواستار یه توقف جهانی (global pause) در توسعه AI شده و هشدار داده که مدلهای فعلی دارن به نقطهای نزدیک میشن که بتونن بدون human oversight (نظارت انسانی) خودشون رو بهبود بدن.
@silicon_brain | از هوش مصنوعی عقب نمانید
این شرکت های AI هم خودشونو مسخره کردن، همین Anthropic مدام در حال رقابت با OpenAI، گوگل و Alibaba و .... برای تولید مدل های خفنه. هشدارشو به ما میده که اگه فرداروزی یه مشکلی پیش اومد بگه من قبلا گفتم مدل ها دارن از کنترل خارج میشن 😐
@silicon_brain | از هوش مصنوعی عقب نمانید
👍13🔥6👎2🌚1
حقیقتا دلم برای روزایی که Transformer تازه معرفی شده بود تنگ شده.
انگار همهچی تازه شروع شده بود. مدلها، مقالات و ایدهها برای همه در دسترس بودن. Hugging Face تازه داشت رشد میکرد و یه حس قشنگ از دموکراسی توی AI شکل گرفته بود.
همه داشتن تحقیق میکردن، مدل آموزش میدادن...
الان ولی همهچی افتاده دست چند تا شرکت غول. از R&D گرفته تا سرو مدلها، APIها، سرویسدهی و کل بیزینس AI رو گرفتن دستشون.
ما هم تهش هنر کنیم یه RAG روی مدلهای خودشون میسازیم، چند تا tool وصل میکنیم، اسمشو میذاریم محصول AI و خوشحال میشیم :)
انگار همهچی تازه شروع شده بود. مدلها، مقالات و ایدهها برای همه در دسترس بودن. Hugging Face تازه داشت رشد میکرد و یه حس قشنگ از دموکراسی توی AI شکل گرفته بود.
همه داشتن تحقیق میکردن، مدل آموزش میدادن...
الان ولی همهچی افتاده دست چند تا شرکت غول. از R&D گرفته تا سرو مدلها، APIها، سرویسدهی و کل بیزینس AI رو گرفتن دستشون.
ما هم تهش هنر کنیم یه RAG روی مدلهای خودشون میسازیم، چند تا tool وصل میکنیم، اسمشو میذاریم محصول AI و خوشحال میشیم :)
👍81👎7❤5
تویی که کلا سه ساله وارد فیلد AI شدی، دیسلایک نده 😂
تو درک نمیکنی، چون ظهور ChatGPT باعث شد تازه بفهمی AI چیه و علاقه مند شی بهش
تو درک نمیکنی، چون ظهور ChatGPT باعث شد تازه بفهمی AI چیه و علاقه مند شی بهش
🤣31👍19👎7👌1
آنتروپیک یه گزارش جدید منتشر کرده که میگه مدل جدیدش یعنی Mythos Preview داره به سطحی میرسه که شاید تو آینده بتونه به ساخت نسخههای بعدی AI کمک کنه
هر نسخه از Claude رو با یه تست ثابت میسنجن: به مدل یه کد آموزش AI میدن و ازش میخوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic میشن، توسط خود Claude نوشته میشن، نه انسانها.
توی آزمایشهای تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسانها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI میتونه مستقل کار کنه هم داره سریع زیاد میشه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام میداد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار میکنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
هر نسخه از Claude رو با یه تست ثابت میسنجن: به مدل یه کد آموزش AI میدن و ازش میخوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic میشن، توسط خود Claude نوشته میشن، نه انسانها.
توی آزمایشهای تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسانها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI میتونه مستقل کار کنه هم داره سریع زیاد میشه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام میداد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار میکنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍14❤3🔥1😱1
میتونین با انواع مدل های قدرتمند متنی و تصویری
🔹 OpenAI
🔹 Anthropic
🔹 Google
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
🔹 OpenAI
🔹 Anthropic
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
👍4❤2👎1
دستورات Claude
chat.zharph.com
اگه به Claude دسترسی ندارین میتونین از طریق پلتفرم ژرف باهاش کار کنین
chat.zharph.com
🤣13👍7
جدیدا OpenAI راهنمای prompting برای GPT-5.5 رو منتشر کرده و پیام اصلیش اینه که کمتر توضیح بده، نتیجه بهتر بگیر
برخلاف نسلهای قبلی، توی GPT-5.5 معمولاً پرامپتهای کوتاهتر و outcome-first بهتر جواب میدن. یعنی بهجای اینکه مرحلهبهمرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیتهایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینهتر شده و خیلی وقتها بدون مصرف محاسبات بیشتر هم نتیجه خوب میده.
برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.
همچنین OpenAI پیشنهاد میکنه برای ساخت تجربه بهتر توی agentic UX و محصولهای کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
برخلاف نسلهای قبلی، توی GPT-5.5 معمولاً پرامپتهای کوتاهتر و outcome-first بهتر جواب میدن. یعنی بهجای اینکه مرحلهبهمرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیتهایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینهتر شده و خیلی وقتها بدون مصرف محاسبات بیشتر هم نتیجه خوب میده.
برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.
همچنین OpenAI پیشنهاد میکنه برای ساخت تجربه بهتر توی agentic UX و محصولهای کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.
خلاصه اینکه توی GPT-5.5 بهجای اینکه مسیر حل مسئله رو کامل دیکته کنی، بهتره فقط هدف، محدودیتها و خروجی موردنظر رو مشخص کنی و اجازه بدی مدل خودش مسیر بهینه رو پیدا کنهاین میتونه کمکم آغازی برای پایان مفاهیمی مثل prompt engineering باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
👍7❤2