پردازش داده (عکس، صوت و ...)


#1

سلام دوباره خدمت عزیزان

پردازش داده رو همتون شنیدید! مثلا گوگل موتور تبدیل صوت به نوشتار و بلعکس، جست و جو بر اساس عکسی که براش آپلود میکنیم یا سرویسهای جست و جو موسیقی بر اساس ضبط بخشی از موسیقی مورد نظر و …
چطوری عمل میکنه؟ منظورم اینه که آیا بیت به بیت اطلاعات رو بررسی میکنن؟ با چه زبانهایی کار میکنند؟ و هر اطلاعاتی و منابعی که به فهم بنده و کسانی که مثل بنده براشون سواله کمک میکنه ممنون میشم معرفی کنید ! :rose:


#2

تا جایی که من میدونم تشخیص صدا و عکس با machine learning انجام میشه عکس یا صدا با استفاده از مدل ها و الگوریتم های یادگیری ماشینی
Classifier شبیه ترین داده موجود برمیگردونه
یادگیری ماشینی بحث گسترده ای هستش که خیلی پیچیدگی های خاص خودش داره
در python کتابخانه های
Pandas, Numpy, Scikitlearn, Scipy برای این کارها خوبند


#3

البته بعد از ریلیز tensorflow توسط گوگل . کتابخونه های دیگه تا حد زیادی به حاشیه رفتن … و اولین بار هم این کتابخونه برای پایتون ریلیز شد ( البته با C و Cython نوشته شده. رپر پایتون داره)

اگه به درک خوبی از هوش مصنوعی و شاخه هاش برسید . اینها براتون حل میشن ک چطور انجام میشه .

پایتون زبان نامبر وان هوش مصنوعی هست … بخاطر سادگی و تنوع بی حد و اندازه کتابخونه هاش …

قبل از اوج گرفتن پایتون … بصورت وسیعی از زبان های R , Lisp , Prolog استفاده میشد(هنوزم میشه اما نه به اندازه پایتون … و سادگی هم ندارن اصلا)

کانسپت ها و مفاهیم هوش به هر زبانی قابل پیاده سازی هستن … ولی اختراع دوباره چرخ … اینجا خیلی دردسر و زحمت داره … بنابرین پایتون و کتابخونه هاش تو اولویت همه هستن … اما از اونجایی ک پایتون یکم کنده … با زبان های دیگه ترکیبش میکنن


#4

خیر tensorflow فقط به درد deep learning میخوره


#5

تنسورفلو تو ۴ حیطه : پردازش تصویر . پردازش صدا . پردازش ویدیو . پردازش متن … کاربرد داره (تقریبا برای همه چیز) … مرز بین دیپ و ماشین الان مشخص نیست … و از هم جدا هم نیستن


#6

deep learning یک نوع machine learning ولی خود machine learning هزار شاخه داره


#7

در واقع بهترین نوع ماشین لرنینگ . دیپ هست . سایر روش ها الان کاربرد زیادی ندارن .بخصوص روشای قدیمی و استاتیکال


#8

بستگی داره به نوع داده و خیلی چیزای دیگه
در خیلی موارد مدل های ساده و قابل فهم آسان تر هستن و نتیجه بهتری میدن


#9

من تجربیات یه دکترای هوش رو بیشتر بازگو کردم … خودم اول راهم … و صرفا یه علاقمند …

بله صد در صد مسئله ای ک با نام پای حل میشه … درست نیست تنسورفلو بزنیم روش…

اما دامنه گستردگی تنسرفلو رو گفتم … تقریبا همه نوع هوش و مسئله ای دیدم که با تنس براحتی حل میشن … و بخصوص قسمت “بدون نظارت” … تنس رو از همه متمایز میکنه


#10

Deep learning tensorflow در خیلی موارد عالیه ولی نمیشه گفت با وجودش کتابخانه های دیگه کنار می‌رن هرکدام جای خودشون دارن
این مثل اینه که بگی با وجود java و ruby و … نیازی به C دیگه نداریم و درواقع در اکثر درخواست کار به عنوان دانشمند داده از شما میخواهید که به این کتابخانه ها مسلط باشید


#11

ببخشید ولی مثال تون یکم بی ارتباط بود …
مثلا theano و scikit-learn پیش نیاز یا ایجاد کننده tensorflow نبوده و نیست … و میشه براحتی کنارشون گذاشت …

اما راجبه پانداز و نام پای … و لایبرریای محاسباتی … حق با شماست … اینا بیس و پایه هستن … نه صرفا ابزار …و همیشه بهشون نیازه …


#12

اگر سخن شما صحیح بود تمام شرکت های machine learning فقط tensorflow کار می‌کردند


#13

الان به ندرت شرکتی رو میبینید ک theano شروع کنه !! …
مگر بیزینسی ک قبلن با همین بنا شده …
آمار ها هم اینو میگن . .
البته شاید ابزار های دیگه ای کنار این استفاده کنن …


#14

من از theano حرفی نزدم
یکی از بهترین کتاب های tensorflow همراه با ScikitLearn


#15

scikit-learn , tensorflow کارشون یکیه و البته امکانات scikit کمتر و محدود تره . وقتی یکش میتونه بعنوان general pupose ML lib استفاده بشه با اتوماسیون بالا … چه اصراریه ک دردسر بیشتری متحمل بشن!؟ در ضمن تنسورفلو . قابلیت train روی GPU داره .

https://sebastianraschka.com/faq/docs/tensorflow-vs-scikitlearn.html

از تلفیق این دوتا هم یه کتابخونه به اسم skflow ساخته شده .

اینها مثل زبان های برنامه نویسی نیستن ک هرکدوم آینده به خصوص و حیطه خاص و کاربرد خاص خودشونو داشته باشن( هنوزم میشناسم جاهایی ک کوبول و لیسپ . پرل استفاده میکنن بصورت گسترده) … این ابزارا بیشتر جنبه تکاملی و در طول هم هستن …


#16

همون طور که عرض کردم تنسرفلو بدرد deep learning که یک نوع machine learning میخوره بستگی به نوع کاری که میخواهی انجام بدی تنسورفلو میتونه اصلا بدرد نخوره نمیشه همینطوری جمع بندی کرد بنده در تیمی هستم که شب و روز با data scientist سروکله میزنم
مدل ها هرچه ساده تر باشن راحت تر maintain و optimize میشن تنسرفلو هم در هر neural net stage یکی از الگوریتم های regression و … انجام میده دانستن اینها ملزومه

https://www.quora.com/What-are-the-main-differences-between-TensorFlow-and-SciKit-Learn


#17

میشه یک نمونه از کارها/مدل هایی که تنسورفلو توش بدرد نمیخوره و scikit یا Caffe میتونه انجامش بده … بیان کنید ؟؟

مسئله complexity هم با رپر ها و اینترفیس هایی که براش بوجود اومدن حل شدن مثل keras


#18

عرض کردم در زمینه هایی که deep learning برای سوالی که میخواهی انجام بدی کارایی نداره و بهتر یک مدل ساده تر استفاده کنی تا بتونی درکش کنی و با فهم خودت بهتره بهترش کنی مثلا اگر بخواهی یک مدل درست کنی که collabrative filtering انجام بده روی 2 gig داده و بخواهی این مدل با تنسرفلو شاید نیاز به هزارتا جادو جمبل دیپ لرنینگ باشه که آخرش هم به عنوان data scientist نمیفهمی چطوری به جواب رسیده اما با یک کتابخانه مثل scikit میتونی یک algorithm واضح و استفاده کنی و پارامتر هاش و عوض کنی تا به جواب دلخواه برسی
اکثر دانشمند ها مانند برنامه نویس ها ترجیح میدن قسمت های مدلشون ساده باشه و کاملا درکش کنن تا بتونن راحت بهترش کنن چون یک کتابخانه از گوگل آمده لزوما به همه کار نمیخوره و مشکلات اکثر دانشمند ها مشکل گوگل نیست


#19

اها خب از اول بگید اینو :sweat_smile:
بله . تنها bottleneck تنسورفلو میتونه برای کسی ک از پشت قضایا خبر نداره . .یا دیتاست کوچیکی داره همین باشه …

ولی تا الان بهترین نتایج . روی دیتاست های عظیم . و توی DL بدست اومدن … که به ساختار مغز انسان شباهت زیاد تری داشتن …

من کلا استفاده شخصی و مقیاس کوچیک رو در نظر نگرفتم … :+1:


#20

دوستان نظرتون درباره ی PyTorch چیه؟