فاین توین مدلهای
Llama-3.1-8B with Llama-3.1-405B synthetic data
https://github.com/adamcohenhillel/LLMs-Cheatsheet/blob/main/fine-tune-llama3-8b-with-llama3-405b-data.ipynb
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Llama-3.1-8B with Llama-3.1-405B synthetic data
https://github.com/adamcohenhillel/LLMs-Cheatsheet/blob/main/fine-tune-llama3-8b-with-llama3-405b-data.ipynb
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍7
در ماه جولای چه مدلهای متن بازی منتشر شد:
- Mistral: Mathstral, Mamba Codestral, 12B, 123B, Mistral Nemo
- Google: Gemma 2 2B, Gemma Scope, ShieldGemma
- Meta: Chamaleon, Llama 3.1
- NVIDIA: Audio Flamingo, BigVGAN, Minitron, MambaVision
- Apple: DCLM models and datasets
- Microsoft: Phi 3 Mini
- Aarce: Aarce-Agent, Arcee-Nova
- lmsys: RouteLLM
- SnapChat: weights2weights
- StabilityAI: Stable Video 4D
- Salesforce: function calling dataset, xLAM, Mint-1T
- InternLM: LM2.5, VL 2.0, XComposer-2.5, VL2-Llama3-76B, Reward, Step-Prover
- Numina: NuminaMath
- DeepSeek: DeepSeek-V2-0628
- h2o: H2O Danube3
- Patronus AI: Lynx, Lynx 1.1
- THUDM: CodeGeeX, CogVLM2
- MMLab: Storm 7B
- Tencent: Hunyuan DiT 1.2
- Snowflake: Arctic embed
- Alibaba: GTE Qwen2-7B-instruct
- Intel: Neural Embedding v1
- Fal: 16ch-VAE, AuraFlow, AuraFlow 0.2
- NasaxIBM: Indus
- Sakana: Sakana Evo
- Kwai: Kolors, LivePortrait
- Misc: Flash Attention 3, Eleuther SAEs, Athene, ColPali, Memex, XEUS, Fish Speech 1.2, Flash-VStream, DolphinVision 72b, WalledGuard, Anole, ControlNet++, PaintsUndo, ChartGemma, TF-ID, Hydra, Make-an-agent, Docmatix, GoldFinch, OCRonos, PhotoMakerv2, Tele-FLM, Cinemo, SeaLLM v3, Zamba2 small
#مقاله #ایده_جذاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
- Mistral: Mathstral, Mamba Codestral, 12B, 123B, Mistral Nemo
- Google: Gemma 2 2B, Gemma Scope, ShieldGemma
- Meta: Chamaleon, Llama 3.1
- NVIDIA: Audio Flamingo, BigVGAN, Minitron, MambaVision
- Apple: DCLM models and datasets
- Microsoft: Phi 3 Mini
- Aarce: Aarce-Agent, Arcee-Nova
- lmsys: RouteLLM
- SnapChat: weights2weights
- StabilityAI: Stable Video 4D
- Salesforce: function calling dataset, xLAM, Mint-1T
- InternLM: LM2.5, VL 2.0, XComposer-2.5, VL2-Llama3-76B, Reward, Step-Prover
- Numina: NuminaMath
- DeepSeek: DeepSeek-V2-0628
- h2o: H2O Danube3
- Patronus AI: Lynx, Lynx 1.1
- THUDM: CodeGeeX, CogVLM2
- MMLab: Storm 7B
- Tencent: Hunyuan DiT 1.2
- Snowflake: Arctic embed
- Alibaba: GTE Qwen2-7B-instruct
- Intel: Neural Embedding v1
- Fal: 16ch-VAE, AuraFlow, AuraFlow 0.2
- NasaxIBM: Indus
- Sakana: Sakana Evo
- Kwai: Kolors, LivePortrait
- Misc: Flash Attention 3, Eleuther SAEs, Athene, ColPali, Memex, XEUS, Fish Speech 1.2, Flash-VStream, DolphinVision 72b, WalledGuard, Anole, ControlNet++, PaintsUndo, ChartGemma, TF-ID, Hydra, Make-an-agent, Docmatix, GoldFinch, OCRonos, PhotoMakerv2, Tele-FLM, Cinemo, SeaLLM v3, Zamba2 small
#مقاله #ایده_جذاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4
PyTorch just released torchchat, making it super easy to run LLMs locally.
- Supports a range of models, including Llama 3.1.
- Can use it on servers, desktops, and even mobile devices.
- pretty straightforward to implement
- offers both Python and native execution modes. It also includes support for eval and quantization.
https://github.com/pytorch/torchchat
#هوش_مصنوعی #پایتورچ #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
- Supports a range of models, including Llama 3.1.
- Can use it on servers, desktops, and even mobile devices.
- pretty straightforward to implement
- offers both Python and native execution modes. It also includes support for eval and quantization.
https://github.com/pytorch/torchchat
#هوش_مصنوعی #پایتورچ #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍10🤣1
Forwarded from DeepMind AI Expert
لیست کانال و گروه های ما :
▪️ گروه هوش مصنوعی: یادگیری عمیق و...
https://xn--r1a.website/DeepLearningAIExperts
▪️ گروه هوش مصنوعی: پردازش زبان طبیعی
https://xn--r1a.website/NLPExperts
▪️ کانال دکتر میثم عسگری
https://xn--r1a.website/ai_person
▪️ گروه لینوکس و پایتون و سایر...
https://xn--r1a.website/PythonLinuxExperts
با اشتراک گذاشتن این پست به دیده شدن و پیشرفت هموطنان خود کمک کنید. جایی برای پرسش و پاسخ و ارتباط با پژوهشگران علوم کامپیوتر و صنعت پیدا کنند.
▪️ گروه هوش مصنوعی: یادگیری عمیق و...
https://xn--r1a.website/DeepLearningAIExperts
▪️ گروه هوش مصنوعی: پردازش زبان طبیعی
https://xn--r1a.website/NLPExperts
▪️ کانال دکتر میثم عسگری
https://xn--r1a.website/ai_person
▪️ گروه لینوکس و پایتون و سایر...
https://xn--r1a.website/PythonLinuxExperts
با اشتراک گذاشتن این پست به دیده شدن و پیشرفت هموطنان خود کمک کنید. جایی برای پرسش و پاسخ و ارتباط با پژوهشگران علوم کامپیوتر و صنعت پیدا کنند.
❤1👍1😍1🤣1
Left: Hierarchical model based RL with a large-scale pre-trained world model, auxiliary tasks and skill-discovery and a model for inverse kinematics.
Right: Proportional-integral-derivative controller, from classic control theory
#متفرقه #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Right: Proportional-integral-derivative controller, from classic control theory
#متفرقه #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🤣10👍1
Forwarded from Recommender system (MehriMah Amiri)
🆒3❤1👍1👎1
دیگه کسی نیاز نیست پایتون یا برنامه دیگه ای یادبگیره
https://llamacoder.together.ai/
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://llamacoder.together.ai/
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🤣12👍3👎1
سلام دوستان میشه لطفا به boost کردن کانال کمک کنین هر کدومتون تلگرام پرمیوم دارید یاری کنید.
https://xn--r1a.website/boost/AI_DeepMind
https://xn--r1a.website/boost/AI_DeepMind
🤣8👎6👍4
دوره خوبی راجب #یادگیری_غیرنظارتی از دانشگاه الینویز
◾️ UIUC STAT 437 Unsupervised Learning spring 2024, by Tori Ellison
#منابع #کلاس_آموزشی #فیلم #یادگیری_ماشین
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ UIUC STAT 437 Unsupervised Learning spring 2024, by Tori Ellison
#منابع #کلاس_آموزشی #فیلم #یادگیری_ماشین
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤3👍2🤣1
امروز با معرفی مدل Biggie-SmoLlm-0.15B-Base قبلتر گفتم که مدلها به سمت کوچکتر شدن و کیفیت بیشتر سوق داده میشوند بعدها میشه چندین میلیارد پارامتر رو در لپ تاپ شخصی عادی اجرا کرد. . در گفتگویی قبلتر که دکتر لکون گفته بود روی مدلهای LLM کار نکنید این تحقیقات رو برای شرکتهای بزرگ بزارید آِیا این کار محقق میشه که هرکسی بتواند روی این تحقیقات پژوهشهای خودش رو جلو ببره ؟!!
So theoretically, with this LLaMa 3 70B can start running on a 12GB GPUs, (which many phone has already)
the Llama 3.1 8B model, which typically requires about 16 GB of memory in full fp16 precision (necessitating a high-end GPU like the RTX 4090), can be compressed to run on just 8 GB of memory using 4-bit quantization.
Even more extreme compression to 1-bit quantization could potentially reduce the model's footprint to around 1 GB, potentially enabling LLM deployment on mobile devices.
◾️ llamagnific-3-87b-gguf
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
So theoretically, with this LLaMa 3 70B can start running on a 12GB GPUs, (which many phone has already)
the Llama 3.1 8B model, which typically requires about 16 GB of memory in full fp16 precision (necessitating a high-end GPU like the RTX 4090), can be compressed to run on just 8 GB of memory using 4-bit quantization.
Even more extreme compression to 1-bit quantization could potentially reduce the model's footprint to around 1 GB, potentially enabling LLM deployment on mobile devices.
◾️ llamagnific-3-87b-gguf
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥4👍3
مقاله بسیار مهمی هستش
◾️ LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders
you can convert any decoder model (such as Llama 3.1 or Gemma into an encoder (such as RoBERTa). Why would you want to do that? Because modern decoders support huge context sizes (128k+ tokens) while the longest context of an encoder is 4K (LongFormer), but encoders excel in such tasks as classification, named entity recognition (NER), and document embedding.
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders
you can convert any decoder model (such as Llama 3.1 or Gemma into an encoder (such as RoBERTa). Why would you want to do that? Because modern decoders support huge context sizes (128k+ tokens) while the longest context of an encoder is 4K (LongFormer), but encoders excel in such tasks as classification, named entity recognition (NER), and document embedding.
#مقاله #ایده_جذاب #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍5❤2👌1
Forwarded from Recommender system (MehriMah Amiri)
AI__Machine_Learning_and_Deep_Learning.pdf
14.9 MB
کتاب "AI, Machine Learning and Deep Learning: A Security Perspective" به بررسی موضوعات زیر میپردازد:
1. مفاهیم پایهای و کاربردها:
- توضیح اصول هوش مصنوعی (AI)، یادگیری ماشین (ML)، و یادگیری عمیق (DL) و کاربردهای آنها در فناوری اطلاعات.
2. مسائل امنیتی:
- تمرکز بر امنیت الگوریتمها و ابزارهای AI/ML/DL.
3.حملات و تهدیدات:
- بررسی آسیبپذیریها و تهدیداتی که میتوانند الگوریتمها و دستگاههای مبتنی بر هوش مصنوعی را تحت تأثیر قرار دهند.
4.چالشهای داخلی و خارجی:
- تأثیر ورودیهای آلوده یا دشمنانه بر مدلهای یادگیری عمیق.
#امنيت
#AI_Security #MachineLearningThreats #DeepLearningRisks #CyberSecurityAI #AI_Threats #ML_SecurityChallenges #DL_Vulnerabilities #AI_Safety
1. مفاهیم پایهای و کاربردها:
- توضیح اصول هوش مصنوعی (AI)، یادگیری ماشین (ML)، و یادگیری عمیق (DL) و کاربردهای آنها در فناوری اطلاعات.
2. مسائل امنیتی:
- تمرکز بر امنیت الگوریتمها و ابزارهای AI/ML/DL.
3.حملات و تهدیدات:
- بررسی آسیبپذیریها و تهدیداتی که میتوانند الگوریتمها و دستگاههای مبتنی بر هوش مصنوعی را تحت تأثیر قرار دهند.
4.چالشهای داخلی و خارجی:
- تأثیر ورودیهای آلوده یا دشمنانه بر مدلهای یادگیری عمیق.
#امنيت
#AI_Security #MachineLearningThreats #DeepLearningRisks #CyberSecurityAI #AI_Threats #ML_SecurityChallenges #DL_Vulnerabilities #AI_Safety
👍4❤1
Forwarded from GPT Ocean (A. Roshan)
Media is too big
VIEW IN TELEGRAM
◀️ایجاد آواتار ویدئویی خودتان | DEEPBRAIN AI
در این راهنمای گام به گام، ما بررسی خواهیم کرد که چقدر آسان است که آواتار ویدئویی AI خود را ایجاد کنید. چه یک وبکم داشته باشید و چه یک تلفن هوشمند، میتوانید بلافاصله شروع کنید.
این ابزار قدرتمند میتواند اسکریپتها را تولید کند و ویدئوهای آواتار AI کامل بسازد، که آن را برای آموزش، شبکههای اجتماعی و اهداف بازاریابی ایدهآل میکند.
ویدئوی اول شما کاملاً رایگان است و تنها چند دقیقه طول میکشد تا ایجاد شود.
https://www.deepbrain.io/
📌ویدیو را با دوستانتان به اشتراک بگذارید
@gptocean
در این راهنمای گام به گام، ما بررسی خواهیم کرد که چقدر آسان است که آواتار ویدئویی AI خود را ایجاد کنید. چه یک وبکم داشته باشید و چه یک تلفن هوشمند، میتوانید بلافاصله شروع کنید.
این ابزار قدرتمند میتواند اسکریپتها را تولید کند و ویدئوهای آواتار AI کامل بسازد، که آن را برای آموزش، شبکههای اجتماعی و اهداف بازاریابی ایدهآل میکند.
ویدئوی اول شما کاملاً رایگان است و تنها چند دقیقه طول میکشد تا ایجاد شود.
https://www.deepbrain.io/
📌ویدیو را با دوستانتان به اشتراک بگذارید
@gptocean
❤1
سلام دوستان
ما دنبال یه همکار میگردیم
عنوان شغلی: متخصص پردازش زبان طبیعی
نوع همکاری: فول تایم (Full-Time)
موقعیت شغلی:
ما به دنبال یک متخصص پردازش زبان طبیعی (NLP) با انگیزه و توانمند هستیم که به تیم ما بپیوندد. اگر روحیه کار تیمی دارید و به یادگیری موضوعات جدید علاقهمند هستید، شما میتوانید گزینه مناسبی برای ما باشید.
ویژگیهای مورد نیاز:
• روحیه کار تیمی: توانایی همکاری و مشارکت موثر در یک تیم.
روحیه کار شخصی: انگیزه و علاقه
• آشنایی با اصول NLP: تسلط بر مبانی پردازش زبان طبیعی (NLP).
• تجربه Fine-tuning مدلهای زبانی بزرگ (LLM): سابقه کار و بهینهسازی مدلهای زبانی بزرگ.
• آشنایی با ابزارهای LangChain و LlamaIndex: تجربه عملی کار با این ابزارها.
• علاقه به یادگیری: تمایل و اشتیاق به یادگیری و بهروزرسانی دانش در موضوعات جدید.
• تحصیلات: فارغالتحصیل یا دانشجوی دانشگاههای معتبر در زمینه NLP (ترجیحاً).
شرایط عمومی:
• نوع همکاری: تماموقت (Full-Time)
• موقعیت مکانی: تهران- سعادت آباد
مزایا:
• همکاری با تیم متخصصین پیشتاز: فرصت همکاری با تیمی از متخصصین برجسته در این حوزه.
• کار روی لبه تکنولوژی: امکان کار روی پروژههای پیشرفته و استفاده از جدیدترین تکنولوژیها در زمینه NLP.
• محیط کاری پویا و دوستانه: فضایی مناسب برای رشد و توسعه فردی و حرفهای.
امکان دورکاری ۱ روز در هفته
شرایط حقوقی عالی
نحوه ارسال درخواست:
لطفاً رزومه خود را به آدرس ایمیل info@modai.fashion ارسال کنید. در عنوان ایمیل “استخدام متخصص پردازش زبان طبیعی” را ذکر نمایید.
ما دنبال یه همکار میگردیم
عنوان شغلی: متخصص پردازش زبان طبیعی
نوع همکاری: فول تایم (Full-Time)
موقعیت شغلی:
ما به دنبال یک متخصص پردازش زبان طبیعی (NLP) با انگیزه و توانمند هستیم که به تیم ما بپیوندد. اگر روحیه کار تیمی دارید و به یادگیری موضوعات جدید علاقهمند هستید، شما میتوانید گزینه مناسبی برای ما باشید.
ویژگیهای مورد نیاز:
• روحیه کار تیمی: توانایی همکاری و مشارکت موثر در یک تیم.
روحیه کار شخصی: انگیزه و علاقه
• آشنایی با اصول NLP: تسلط بر مبانی پردازش زبان طبیعی (NLP).
• تجربه Fine-tuning مدلهای زبانی بزرگ (LLM): سابقه کار و بهینهسازی مدلهای زبانی بزرگ.
• آشنایی با ابزارهای LangChain و LlamaIndex: تجربه عملی کار با این ابزارها.
• علاقه به یادگیری: تمایل و اشتیاق به یادگیری و بهروزرسانی دانش در موضوعات جدید.
• تحصیلات: فارغالتحصیل یا دانشجوی دانشگاههای معتبر در زمینه NLP (ترجیحاً).
شرایط عمومی:
• نوع همکاری: تماموقت (Full-Time)
• موقعیت مکانی: تهران- سعادت آباد
مزایا:
• همکاری با تیم متخصصین پیشتاز: فرصت همکاری با تیمی از متخصصین برجسته در این حوزه.
• کار روی لبه تکنولوژی: امکان کار روی پروژههای پیشرفته و استفاده از جدیدترین تکنولوژیها در زمینه NLP.
• محیط کاری پویا و دوستانه: فضایی مناسب برای رشد و توسعه فردی و حرفهای.
امکان دورکاری ۱ روز در هفته
شرایط حقوقی عالی
نحوه ارسال درخواست:
لطفاً رزومه خود را به آدرس ایمیل info@modai.fashion ارسال کنید. در عنوان ایمیل “استخدام متخصص پردازش زبان طبیعی” را ذکر نمایید.