مرجع دیتاست فارسی
3.2K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
🎯 دیتاست Iranis – دیتاست فارسی برای شناسایی پلاک خودرو! 🚗

رفقا، امروز یه دیتاست فوق‌العاده براتون داریم که شامل بیش از 83,000 تصویر از اعداد و حروف فارسی موجود روی پلاک خودروهاست. این دیتاست برای پروژه‌های تشخیص کاراکتر پلاک خودرو و سیستم‌های بینایی ماشین بسیار کاربردیه!

📊 ویژگی‌ها و مشخصات:
– شامل تصاویر واقعی از پلاک خودروهای فارسی.

– بیش از 83,000 نمونه تصویری از اعداد و حروف فارسی.

– دسته‌بندی شده بر اساس اعداد، حروف و نمادهای خاص (مانند نماد ویلچر برای افراد دارای معلولیت).

💡 کاربردها:
– تشخیص کاراکترهای پلاک خودرو.

– آموزش مدل‌های بینایی ماشین.

– ساخت سیستم‌های هوشمند شناسایی خودرو.

🔗 لینک دانلود دیتاست:

github.com/alitourani/Iranis-dataset

📥 این پست رو برای کسایی که تو حوزه بینایی ماشین کار می‌کنن بفرست تا از این منبع ارزشمند استفاده کنن! 😊

#دیتاست #بینایی_ماشین #پلاک_خودرو #پردازش_تصویر #هوش_مصنوعی #تشخیص_کاراکتر #MachineLearning
👍111
🎯 ابزار مدل‌سازی موضوعات در متن‌های کوتاه فارسی! 📝

اگر با چالش تحلیل و استخراج موضوعات از متن‌های کوتاه فارسی (مثل توییت‌ها یا پیام‌های کوتاه) مواجه هستید، این ابزار می‌تواند نیاز شما را برطرف کند. با استفاده از تکنیک‌های پیشرفته مانند LDA و NMF، می‌توانید موضوعات کلیدی را از داده‌های متنی استخراج کرده و آن‌ها را در پروژه‌های خود به کار ببرید.

📊 ویژگی‌ها و مزایا:

– تمرکز بر متن‌های کوتاه: ابزار بهینه برای داده‌هایی که طول متن در آن‌ها محدود است.

– روش‌های متنوع: پشتیبانی از الگوریتم‌های مختلف مدل‌سازی موضوعات برای مقایسه عملکرد و انتخاب بهترین روش.

– قابلیت اجرا: امکان استفاده آسان در محیط‌هایی مثل Google Colab برای تست سریع و کارآمد.

💡 مناسب برای چه کسانی؟

– تحلیلگران داده و متخصصان NLP که به دنبال استخراج موضوعات از داده‌های فارسی هستند.

– کسانی که روی شبکه‌های اجتماعی، نظرسنجی‌ها یا پیام‌های کوتاه کار می‌کنند.

– پژوهشگران و توسعه‌دهندگانی که نیاز به سازماندهی داده‌های متنی دارند.

🔗 لینک ابزار و نحوه استفاده:

https://github.com/DSInCenter/topicmodel

📥 اگر نیاز به استخراج موضوعات از متن‌های کوتاه دارید، این ابزار را امتحان کنید!

#مدل_سازی_موضوعات #پردازش_زبان #NLP_فارسی #تحلیل_متن #هوش_مصنوعی #متن_کوتاه #MachineLearning
👍41
🎯 تشخیص منظور کاربر از جملات بلند و پیچیده! 🤖

اگر در حال توسعه چت‌بات یا سیستم‌های هوشمند پردازش زبان طبیعی هستید، احتمالاً با چالش تشخیص منظور اصلی کاربر از جملات طولانی و پیچیده روبرو شده‌اید. این پروژه به شما کمک می‌کند تا این چالش را مدیریت کنید و سیستم‌های هوشمندتر و دقیق‌تری طراحی کنید.

📊 ویژگی‌ها و مزایا:

– تمرکز بر تحلیل و استخراج مقصود اصلی از جملات طولانی و همراه با اطلاعات حاشیه‌ای.

– مناسب برای توسعه چت‌بات‌ها و سیستم‌های پاسخ‌گویی هوشمند.

– استفاده از داده‌های دسته‌بندی‌شده با مشخص بودن هدف اصلی کاربر.

💡 کاربردها:

– توسعه چت‌بات‌های پشتیبانی مشتری.

– سیستم‌های پاسخ‌گویی هوشمند برای خدمات تلفن همراه، بانکداری، و سایر سرویس‌ها.

– بهبود تجربه کاربری در اپلیکیشن‌های مبتنی بر مکالمه.

🔗 لینک پروژه و کدها:

https://github.com/MojtabaZarreh/Recognizing-the-user-s-intent-from-long-and-complex-sentences

📥 اگر به دنبال راه‌حلی برای تحلیل دقیق‌تر نیازهای کاربران هستید، این پروژه را بررسی کنید!

#تشخیص_مقصود #پردازش_زبان #NLP_فارسی #چت_بات #هوش_مصنوعی #تحلیل_متن #MachineLearning
3👍2🔥1
🎯 دیتاست Persian Instruct – مجموعه داده‌ای برای تنظیم دستورات به زبان فارسی! 📝

اگر به دنبال یک دیتاست باکیفیت برای انجام تسک‌های مختلف پردازش زبان طبیعی (NLP) به زبان فارسی هستید، دیتاست Semi-Alpaca Instruction Tuning می‌تواند انتخاب بسیار خوبی باشد. این دیتاست برای پروژه‌هایی مثل ترجمه ماشینی، تولید متن، و سایر کاربردها طراحی شده است.

📊 ویژگی‌های دیتاست:

– حاوی مجموعه‌ای از دستورات به زبان فارسی برای تنظیم مدل‌ها.

– مناسب برای تسک‌های متنوع NLP در زبان فارسی.

– گردآوری شده با همکاری دانشجویان دانشگاه تهران.

🔗 لینک دیتاست:

https://github.com/mostafaamiri/Persian_instruct_dataset

💡 اگر در حوزه NLP فارسی فعالیت می‌کنید، این دیتاست را از دست ندهید!

#دیتاست #NLP_فارسی #پردازش_زبان #هوش_مصنوعی #تولید_متن #ترجمه_ماشینی #MachineLearning
👍71🔥1