This media is not supported in your browser
VIEW IN TELEGRAM
اجرای LLM ها به روی دسکتاپ
پلتفرم lmstudio.ai یه ابزار رایگانه که اجازه میده تا مدلهای بزرگ زبانی (#LLM) رو روی دسکتاپتون اجرا کنید. آپشنایی که این پلتفرم ارائه میده خیلی کاربردیه:
🤖 - اجرای آفلاین LLM ها رو کامپیوتر لوکال
👾 - اتصال به سرور #openai و استفاده کردن از مدل هاش
📂 - اتصال به مدل های #HuggingFace 🤗
🔭 - اطلاع از مدل های LLM جدید
سخت افزار مورد نیازشم به این صورته:
16GB+ of RAM is recommended.
For PCs, 6GB+ of VRAM is recommended
NVIDIA/AMD GPUs supported
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
پلتفرم lmstudio.ai یه ابزار رایگانه که اجازه میده تا مدلهای بزرگ زبانی (#LLM) رو روی دسکتاپتون اجرا کنید. آپشنایی که این پلتفرم ارائه میده خیلی کاربردیه:
🤖 - اجرای آفلاین LLM ها رو کامپیوتر لوکال
👾 - اتصال به سرور #openai و استفاده کردن از مدل هاش
📂 - اتصال به مدل های #HuggingFace 🤗
🔭 - اطلاع از مدل های LLM جدید
سخت افزار مورد نیازشم به این صورته:
16GB+ of RAM is recommended.
For PCs, 6GB+ of VRAM is recommended
NVIDIA/AMD GPUs supported
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍8❤1🤩1
کتابی با رویکردی عملی در مورد RAG
سیستم های Retrieval Augmented Generation (#RAG) به عنوان ابزار قدرتمند و همه کاره ظاهر شدن که نقاط قوت #بازیابی اطلاعات و تولید #زبان_طبیعی رو با هم ترکیب میکنن. پتانسیل ایجاد انقلابی در نحوه دسترسی، درک و تعامل ما با حجم وسیعی از دادهها رو دارن (تو این پست در مورد RAG بخون)
دکتر اللهیاری تو این #کتاب آنلاین مسائل مربوط به RAG رو بصورت گسترده پوشش دادن.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
سیستم های Retrieval Augmented Generation (#RAG) به عنوان ابزار قدرتمند و همه کاره ظاهر شدن که نقاط قوت #بازیابی اطلاعات و تولید #زبان_طبیعی رو با هم ترکیب میکنن. پتانسیل ایجاد انقلابی در نحوه دسترسی، درک و تعامل ما با حجم وسیعی از دادهها رو دارن (تو این پست در مورد RAG بخون)
دکتر اللهیاری تو این #کتاب آنلاین مسائل مربوط به RAG رو بصورت گسترده پوشش دادن.
این کتاب گواهی است بر اوج دانش، بینش و تجربیات متخصصان و علاقه مندان در زمینه RAG. ما پیچیدگیهای ترکیب تکنیکهای بازیابی و تولید را بررسی میکنیم، تفاوتهای ظریف مدیریت منابع دادههای متنوع را درک میکنیم، و شاهد تأثیر تغییردهنده مسیریابی پرس و جو، حافظه و ابزارهای مشاهدهپذیری خواهیم بود...
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
mallahyari.github.io
A Practical Approach to Retrieval Augmented Generation Systems
👍2❤1💯1
مدل زبانی بزرگ فاین تیوین شده برای زبان فارسی
این مقاله در مورد #LLM فارسی به نام #PersianLLaMA هستش. این مدل روی مجموعه ای از متنها و دیتاستهای فارسی آموزش داده شده و با دو نسخه با 7 و 13 میلیارد پارامتر ارائه شده است که بر روی متون رسمی و محاوره ای فارسی با دو رویکرد متفاوت آموزش داده شده.
PersianLLaMA: Towards Building First Persian Large Language Model
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
این مقاله در مورد #LLM فارسی به نام #PersianLLaMA هستش. این مدل روی مجموعه ای از متنها و دیتاستهای فارسی آموزش داده شده و با دو نسخه با 7 و 13 میلیارد پارامتر ارائه شده است که بر روی متون رسمی و محاوره ای فارسی با دو رویکرد متفاوت آموزش داده شده.
PersianLLaMA: Towards Building First Persian Large Language Model
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
arXiv.org
PersianLLaMA: Towards Building First Persian Large Language Model
Despite the widespread use of the Persian language by millions globally, limited efforts have been made in natural language processing for this language. The use of large language models as...
👍12❤2😁1
whats embeddings.pdf
5.8 MB
👍5❤1😁1🍌1
و باز هم NVIDIA و معرفی تراشه جدید
پلتفرم NVIDIA Blackwell یه پلتفرم پردازشی جدید و با کارایی بالاست که توسط #NVIDIA معرفی شد. (بخاطر قدرت پردزشی بالا، این پلتفرم به عنوان "جاهطلبانهترین پروژه در سیلیکونولی" توسط تحلیلگران شناخته شده).
عملکرد بینظیر: معماری GPU Blackwell از 6 فناوری پیشرفته برای افزایش کارایی در پردازش داده
پشتیبانی از هوش مصنوعی نسل جدید: Blackwell برای پشتیبانی از #LLM با تعداد پارامترهای بسیار زیاد طراحی شده.
مصرف انرژی کم: Blackwell میتونه وظایف پردازش هوش مصنوعی را به صورت Real-Time روی مدلهای LLM بزرگ با 25 درصد مصرف انرژی کمتر از نسل های قبلی اجرا کنه.
به طور خلاصه، NVIDIA Blackwell Platform گامی بزرگ و نقطه عطفی برای هوش مصنوعی هستش.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
پلتفرم NVIDIA Blackwell یه پلتفرم پردازشی جدید و با کارایی بالاست که توسط #NVIDIA معرفی شد. (بخاطر قدرت پردزشی بالا، این پلتفرم به عنوان "جاهطلبانهترین پروژه در سیلیکونولی" توسط تحلیلگران شناخته شده).
عملکرد بینظیر: معماری GPU Blackwell از 6 فناوری پیشرفته برای افزایش کارایی در پردازش داده
پشتیبانی از هوش مصنوعی نسل جدید: Blackwell برای پشتیبانی از #LLM با تعداد پارامترهای بسیار زیاد طراحی شده.
مصرف انرژی کم: Blackwell میتونه وظایف پردازش هوش مصنوعی را به صورت Real-Time روی مدلهای LLM بزرگ با 25 درصد مصرف انرژی کمتر از نسل های قبلی اجرا کنه.
به طور خلاصه، NVIDIA Blackwell Platform گامی بزرگ و نقطه عطفی برای هوش مصنوعی هستش.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
🔥6👍5
ربات خلاصه کننده صوتی یوتیوب تلگرام
یه ربات تلگرامی که میتونه صدا رو از ویدیوهای مختلفی که تو #YouTube هستش، دانلود کنه و با استفاده از موتور GPT-3 OpenAI محتوا رو خلاصه بکنه.
یه ابزار مفید برای استخراج سریع اطلاعات از محتوای YouTube هستش که میتونین برای تسکها و کاربردهای مختلف ازش استفاده کنین.
گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
یه ربات تلگرامی که میتونه صدا رو از ویدیوهای مختلفی که تو #YouTube هستش، دانلود کنه و با استفاده از موتور GPT-3 OpenAI محتوا رو خلاصه بکنه.
یه ابزار مفید برای استخراج سریع اطلاعات از محتوای YouTube هستش که میتونین برای تسکها و کاربردهای مختلف ازش استفاده کنین.
گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
👍4👏1
پدیده گروکینک چیست؟
گاهاً مدلهای هوش مصنوعی از خود رفتارهایی نشون میدن که خیلی عجیبه. دو سال پیش، (Yuri Burda) و (Harri Edwards)،محققان شرکت #openai میخواستن بفهمن برای دستیابی به یک مدل بزرگ زبانی جهت انجام محاسبات پایه چه چیزای لازمه. در واقع میخواستن ببیننکه آیا این مدل میتونه محاسبات اولیه رو انجام بده یا نه.
اولش ،مدلها، اعدادی رو که میدیدن حفظ میکردن، اما نمیتونستن موارد جدیدو حل کنن.
بوردا و ادواردز برای این آزمایشها، زمان خیلی طولانیتری صرف کردن، روزها به جای ساعتها و بارها محاسبات نمونه رو به مدل نشون دادن تا زمانی که از موفقیتآمیز بودن آزمایش مطمئن شدن. اونا یک مدل بزرگ زبانی آموزش داده بودن تا دو عدد رو جمع کنه که خیلی بیشتر از اون چیزی که فکرش رو میکردن زمان برده بود.
این دو محقق و همکارانشان در مورد پدیدهای جالب تحقیق کردند. اونل متوجه شدن که بعضی اوقات، مدلها یک کار را اصلاً یاد نمیگیرن و بعد از مدتی ناگهان در یک لحظه شروع به یادگیری میکنن و اسم ین پدیده را «گروکینگ» (#Grokking) گذاشتن.
@silicon_brain | از هوش مصنوعی عقب نمانید
گاهاً مدلهای هوش مصنوعی از خود رفتارهایی نشون میدن که خیلی عجیبه. دو سال پیش، (Yuri Burda) و (Harri Edwards)،محققان شرکت #openai میخواستن بفهمن برای دستیابی به یک مدل بزرگ زبانی جهت انجام محاسبات پایه چه چیزای لازمه. در واقع میخواستن ببیننکه آیا این مدل میتونه محاسبات اولیه رو انجام بده یا نه.
اولش ،مدلها، اعدادی رو که میدیدن حفظ میکردن، اما نمیتونستن موارد جدیدو حل کنن.
بوردا و ادواردز برای این آزمایشها، زمان خیلی طولانیتری صرف کردن، روزها به جای ساعتها و بارها محاسبات نمونه رو به مدل نشون دادن تا زمانی که از موفقیتآمیز بودن آزمایش مطمئن شدن. اونا یک مدل بزرگ زبانی آموزش داده بودن تا دو عدد رو جمع کنه که خیلی بیشتر از اون چیزی که فکرش رو میکردن زمان برده بود.
این دو محقق و همکارانشان در مورد پدیدهای جالب تحقیق کردند. اونل متوجه شدن که بعضی اوقات، مدلها یک کار را اصلاً یاد نمیگیرن و بعد از مدتی ناگهان در یک لحظه شروع به یادگیری میکنن و اسم ین پدیده را «گروکینگ» (#Grokking) گذاشتن.
@silicon_brain | از هوش مصنوعی عقب نمانید
❤17👍7🥴7
مدل TacticAI برای تحلیل و پیشبینی ضربات کرنر
این مدل توسط باشگاه لیورپول توسعه یافته، یه دستیار هوش مصنوعی برای ارائه تحلیل به کارشناسان #فوتبال در مورد ضربات کرنر هستش
تو شکل نحوه عملکرد این مدل تا حدودی به نمایش در اومده:
(شکل A) چگونگی تبدیل موقعیتهای ضربه کرنر به #گراف ؟ هر بازیکن به عنوان یک گره گراف در نظر گرفته میشه و یک شبکه عصبی گراف روی این گراف عمل میکنه و نمایش هر گره رو با استفاده از ارسال پیام به روز میکنه.
(شکل B) چگونه TacticAI یک ضربه کرنر رو پردازش می کند؟ هر چهار ترکیب ممکن از بازتاب ها در گوشه اعمال میشن و به مدل اصلی TacticAI تغذیه میشه. و این موضوع برای محاسبه شانس های بازیکن نهایی که می تونه برای پیش بینی نتایج استفاده شود، کاربرد داره.
@silicon_brain | از هوش مصنوعی عقب نمانید
این مدل توسط باشگاه لیورپول توسعه یافته، یه دستیار هوش مصنوعی برای ارائه تحلیل به کارشناسان #فوتبال در مورد ضربات کرنر هستش
تو شکل نحوه عملکرد این مدل تا حدودی به نمایش در اومده:
(شکل A) چگونگی تبدیل موقعیتهای ضربه کرنر به #گراف ؟ هر بازیکن به عنوان یک گره گراف در نظر گرفته میشه و یک شبکه عصبی گراف روی این گراف عمل میکنه و نمایش هر گره رو با استفاده از ارسال پیام به روز میکنه.
(شکل B) چگونه TacticAI یک ضربه کرنر رو پردازش می کند؟ هر چهار ترکیب ممکن از بازتاب ها در گوشه اعمال میشن و به مدل اصلی TacticAI تغذیه میشه. و این موضوع برای محاسبه شانس های بازیکن نهایی که می تونه برای پیش بینی نتایج استفاده شود، کاربرد داره.
@silicon_brain | از هوش مصنوعی عقب نمانید
👍8❤2
این ریپو و مدل هاگینگ فیس آینده خرید لباس آنلاین رو نشون میده
گیتهاب | هاگینگفیس
#outfit
@silicon_brain | از هوش مصنوعی عقب نمانید
گیتهاب | هاگینگفیس
#outfit
@silicon_brain | از هوش مصنوعی عقب نمانید
🤩6👎3❤1😁1
نظر #Andrew_NG در مورد آینده LLM ها:
معتقدم امسال این 4 زمینه در دارتباط با #LLM پیشرفت قابلتوجهی خواهند داشت:
#Reflection,
Tool use, Planning , Multi-agent collaboration
در روش Reflection به جای اینکه یک LLM خروجی نهایی خود را مستقیماً تولید کند، چندین بار از LLM درخواست می کند و به آن فرصت می دهد تا گام به گام خروجی با کیفیت بالاتر ایجاد کند. دیده ام که این روش منجر به افزایش کارایی مدل میشود.
گاهی اوقات این روش باعث می شود که LLM مشکلات را تشخیص دهد و پیشنهادهای سازنده ارائه دهد. این فرآیند خود انعکاس به LLM اجازه می دهد تا شکاف ها را شناسایی کند و خروجی خود را در کارهای مختلف از جمله تولید کد، نوشتن متن و پاسخ به سؤالات بهبود بخشد.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
معتقدم امسال این 4 زمینه در دارتباط با #LLM پیشرفت قابلتوجهی خواهند داشت:
#Reflection,
Tool use, Planning , Multi-agent collaboration
در روش Reflection به جای اینکه یک LLM خروجی نهایی خود را مستقیماً تولید کند، چندین بار از LLM درخواست می کند و به آن فرصت می دهد تا گام به گام خروجی با کیفیت بالاتر ایجاد کند. دیده ام که این روش منجر به افزایش کارایی مدل میشود.
گاهی اوقات این روش باعث می شود که LLM مشکلات را تشخیص دهد و پیشنهادهای سازنده ارائه دهد. این فرآیند خود انعکاس به LLM اجازه می دهد تا شکاف ها را شناسایی کند و خروجی خود را در کارهای مختلف از جمله تولید کد، نوشتن متن و پاسخ به سؤالات بهبود بخشد.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
❤10👍5
نیازمندی های عناوین شغلی مهندس یادگیری ماشین و دانشمند داده نسبت به گذشته تغییر کرده. ما تو این پست اینستاگرام نکاتی رو بیان کردیم که شانس شما برای پیدا کردن موقعیت شغلی رو افزایش میده:
https://www.instagram.com/p/C5V969QCEgG/?igsh=MTNjb2pjczJmZzRibw==
https://www.instagram.com/p/C5V969QCEgG/?igsh=MTNjb2pjczJmZzRibw==
❤4👍2
تحلیل سریهای زمانی با استفاده از مدل TimeGPT-1
مدل TimeGPT-1 توسط کمپانی نیکستلا ارائه شده که میتونه با دقت بالایی به پیشبینی سریهای زمانی (مانند پیشبینی قیمت) با استفاده از GPT بپردازه.
ادعا دارن که:
استفاده رایگان از این ابزار در دسترسه
لینک
#time_series
@silicon_brain | از هوش مصنوعی عقب نمانید
مدل TimeGPT-1 توسط کمپانی نیکستلا ارائه شده که میتونه با دقت بالایی به پیشبینی سریهای زمانی (مانند پیشبینی قیمت) با استفاده از GPT بپردازه.
ادعا دارن که:
چه بانکی باشید که روند بازار را پیشبینی میکند یا یک استارتآپ که تقاضای محصول را پیشبینی میکند، TimeGPT دسترسی به بینشهای پیشبینی پیشرفته را دموکراتیزه میکند و نیاز به تیم اختصاصی مهندسین یادگیری ماشین را از بین میبرد.
استفاده رایگان از این ابزار در دسترسه
لینک
#time_series
@silicon_brain | از هوش مصنوعی عقب نمانید
👍6🔥6
طبق گزارش پلتفرم جاب ویژن میانگین #حقوق درخواستی برای سال 1403برای عنوان شغلی علوم داده / هوش مصنوعی در شهر تهران برای سه سطح به این صورته:
کارشناس: 21.6 MT
کارشناس ارشد: 36.0 MT
مدیر: 53.3 MT
برای عنوان شغلی Python Developer در شهر تهران برای سه سطح:
Junior: 16.9 MT
Mid-Level: 26.4 MT
Senior: 39.0 MT
نظرتون در مورد این اعداد چیه؟
@silicon_brain | از هوش مصنوعی عقب نمانید
کارشناس: 21.6 MT
کارشناس ارشد: 36.0 MT
مدیر: 53.3 MT
برای عنوان شغلی Python Developer در شهر تهران برای سه سطح:
Junior: 16.9 MT
Mid-Level: 26.4 MT
Senior: 39.0 MT
نظرتون در مورد این اعداد چیه؟
@silicon_brain | از هوش مصنوعی عقب نمانید
👍9👎7😱3🔥2