پردازش زبان فارسی

machinelearning
deeplearning

#1

برای تبدیل گفتار به متن معمولاً از کیبورد گوگل استفاده می کنم، خیلی کنجکاوم که بدونم پشت این نرم‌افزار چه سرویس هایی هستند که دارند با هم کار می کنند تا گفتار فارسی رو به نوشتار تبدیل کنن.

احتمالاً یک سری نرم افزار ها، کتابخانه‌ها، فریم ورک ها و از این دست ابزارها وجود دارند که برای تحلیل و استخراج معنی از گفتار یا نوشتار زبان فارسی ساخته شدند که برای افراد متخصص در حوزه های ماشین لرنینگ و دیپ لرنینگ بسیار آشنا هستند اما برای کسی که در این زمینه ها کار نمیکنه یا خیلی با این مباحث درگیر نیست پیدا کردن این ابزارها کار راحتی به حساب نمیادبه واسطه اینکه کسانی که تحلیل زبان فارسی رو موضوع اصلی کار خودشان قرار دادن با تعداد افرادی که زبان انگلیسی رو موضوع اصلی کار خودشان قرار دادند خیلی اختلاف دارند و این یعنی در مورد این موضوع کمتر در اینترنت مطلب نوشته شده و کمتر گفتگوهایی در معرض عموم قرار داده شده.
سوال من این هست که دوستانی که این دسته از ابزارها را می شناسند لطفاً اونها رو در این پست معرفی کنند تا مرجعی باشه برای کسانی که دنبال ابزارهای تحلیل زبان فارسی هستند.
در نهایت نظر من این هست که شناختن این ابزارها ممکنه باعث بشه از اونها استفاده کنیم و در نهایت سرویس بهتری رو طراحی و ارائه کنیم.


#2

یک جواب خیلی ساده و نچندان کامل اینه که از سامانه های voice recognition و سرورهای پر قدرت برای pattern matching استفاده میکنند.
من از Siri روی Carplay و از Amazon Alexa روی Echo استفاده می کنم. الکسا api خیلی خوبی برای توسعه app داره که میتونید استفاده کنید.

Alexa API:
https://developer.amazon.com/docs/alexa-voice-service/api-overview.html

Google:
https://www.google.com.au/search?q=google+voice+api&rlz=1C9BKJA_enAU812AU812&oq=google+voice+api&aqs=chrome..69i57.4086j0j9&hl=en-GB&sourceid=chrome-mobile&ie=UTF-8

هدفم بیشتر دادن چنتا سرنخ بود🤗


#3

بسیار عالی بود، تشکر


#4

من یک repository در گیت هاب پیدا کردم که لیستی از ابزار ها و داده ها رو معرفی کرده، اولش که دیدمش واقعا از دستچین بودن محتواهاش لذت بردم خلاصه تصمیم گرفتم ترجمش کنم.

اینجا:

ترجمه یک سری کلمات مثل stop word یا Stemmer برام خیلی سخته در نتیجه اونها رو دست نخورده باقی گذاشتم تا معادل فارسیشون رو پیدا کنم.
دوستانی که زبان تخصصیشون قویه لطفا کمک کنید تا این مطلب رو ترجمه کنیم.


#5

پس ادیتور anaconda مختص پردازش متن در پایتونه؟؟


#6

آناکوندا ویرایشگر متن نیست، بسته ایه که داخلش خیلی چیزها وجود داره از جمله، Jupiter notebook و pyweb که احتمالا منظورتون از ادیتور اینها هستند.

باری…

نقل قول از سایت anaconda:

Anaconda is the most popular Python data science platform with 6 million users.


#7

درسته ولی خب بیشتر در چه مواردی استفاده قرار میگیره مثلا ipython که قسمتی از این برنامس؟؟؟


#8

Anaconda روی ماشین Machine Learning و Deep Learning تمرکز داره اما اگر منظور شما فقط iPython هست باید گفت که iPython یک شل قدرتمند برای ساده کردن parallelism هست بیشتر. (این پاسخ کاملا سطحیه و امیدوارم دیگران اگر استفاده کردند بیشتر توضیح بدن)