مشکل cpu stuck در لپتاپ - دبیان

سلام.
من یه لپتاپ گیمری (asus gl553vw) از یکی از دوستام گرفتم که یه مدت باهاش کار کنم (لپتاپ عزیزم asus b9440 رو باهاش عوض کردم)
روش debian9 نصب بود و کار میکرد. آپدیت کردم به آخرین نسخه و بعد با apt dist-upgrade آپگریدش کردم به buster.
ولی وقتی روشن کردم خیلی خیلی کند شده بود و البته sddm هم بالا نمیومد. شبکه (lan و wifi) هم کار نمیکرد. بی خیالش شدم و تصمیم گرفتم کلا پاک کنم از اول نصب کنم.

از اول debian buster رو نصب کردم ولی همچنان همون مشکل رو داره.
اینقدر کنده که وقتی یوزرنیم رو داخل ttl میزنم، باید یک دقیقه صبر کنم تا ازم پسورد بپرسه!
اینطور که خودش میگه، sddm الآن ران شده ولی محیط گرافیکی نمیبینم! (kde نصب کردم)
موقع روشن شدن، زمانی که پسورد luks رو میپرسه این پیغامها رو میبینم:


بعد از روشن شدن هم اگه اصلا بتونم لاگین کنم (یه وقتایی یوزرنیم رو میگیره و قبل از گرفتن پسورد هنگ میکنه، یه وقتایی پسورد هم میگیره بعدش هنگ میکنه)، این لاگ dmesg هست:

البته این متن مربوط به dmesg نیست و هر چند ثانیه توی ترمینال پرینت میشه:

Message from [email protected] at...
Watchdog bug: soft lookup - cpu2 stuck for 22 second

کسی میدونه مشکل چیه؟
مشکل از buster هست؟ الان میخوام debian9.9 نصب کنم ببینم چی میشه، چون اینو اصلا نمیشه فیکس کرد (همین الان ترمینال کار نمیکنه و فقط همون ارور هر چند ثانیه یک بار پرینت میشه)
یه سرچ زدم یه نفر همچین مشکلی داشت و مربوط به overclock کردن cpu بود. این سیستم overclock نشده و توی ویندوز همه‌چیز خوب کار میکنه. صدای فن هم کمه. (الآن توی همین ترمینال لینوکس صدای فن نسبتا زیاده)

من ۳ تا مشکل می بینم تو لاگ هایی که بهم دادی . اول اینکه ACPI به نظر میاد نمی تونه firmware کارت های گرافیکت رو لود کنه. دوم اینکه به نظر داری lvm استفاده می کنی و یه سری از volume هات وجود ندارن. آخر هم اینکه کرنلت کرش کرده اما تو لاگی مه دادی ننوشته کجا ( احتمالا بالا تر بوده).

اما کار هایی که می تونی انجام بدی. اول از شر LVM خلاص شو. دوم nvdiai رو موقت disable کن و firmware کارت گرافیک intel رو از تو مخازن دبیان نصب کن. و دوباره تست کن. اینجوری راحت تر می تونی مشکل رو پیدا کنی.

در ضمن ورژن کرنلت چنده ؟

1 Like

خوب کارت گرافیک مشکل اصلی نیست. به هر حال nvidia هیچوقت با ما سر سازگاری نداشته و میفته روی intel.
البته من همیشه نسخه‌ی non-free دبیان رو نصب میکنم (که درایور کارت گرافیک و تاچ‌پد و… داشته باشه)

بله. از lvm و luks استفاده میکنم. اشکالی داره؟ چرا باید از شرش خلاص شم؟ (قضیه‌ی شر بودن رو متوجه نمیشم)

ورژن کرنل رو نمیدونم ولی دیفالت buster هست (همون ورژنی که شما دارید :sweat_smile:)

وقتی کرنل نتونه firmware یه هاردور رو لود کنه عملا تلاش می کنه که تا می تونه با هاش کار کنه که خوب در مورد چیپ nvidia کار بیخودیه. بی خوده CPU cycle هدر می دی. از طرف دیگه هم الان دنبال این هستیم که مشکل رو پیدا کینم. هرچی مواردی که ممکن مشکل ساز باشن کمتر شن راحتتر می شه مشکل رو پیدا کرد.

آیا از snapshot استفاده می کنی ؟ چند تا هارد درایو داری ؟ برای چی نیاز داری کل دیسک encrypt شده باشه ؟
lvm مشخصا نصبت به حالتی که مستقیم روی هارد می نویسیم کندتر هست. یه سری قابلیت های خوب داره که برای استفاده های خاص ساخته شده. اگر مورد شما جزئی از اون موارد نباشه overkill هست و مثل این می مونه که پنیر رو با M4 قاچ کنی. از طرفی هم الان lvm ی که استفاده می کنی مشخص هست که تنظیماتش مشکل داره.

خیلی بعید می دونم با ورژن من یکی باشه. احتمالا

4.19.0-5-amd64

باشه. ولی باز uname -r رو ران کن که ورژن رو پیدا کنی

1 Like

موافقم ولی مساله اینه که توی اون وضعیت عملا هیچ کاری با سیستم نمیتونم انجام بدم.
فقط یک بار تونستم dmesg بگیرم! بعدش کلا دسترسیم از ترمینال قطع شد!

خوب برای امنیت بیشتر دیسک، دلم میخواد encryption داشته باشم.
اینکه از lvm استفاده میکنم برای اینه که همه‌ش encrypt بشه بعد داخل اون، / و /home و swap ساخته بشه. اگه از lvm استفاده نکنم، برای هر پارتیشن باید یک بار پسورد بزنم و از طرف دیگه قابلیت hibernate رو از دست میدم (اگه درست فهمیده باشم امکان روشن شدن از hibernate نداره)
پیشنهاد شما برای رمزنگاری سیستم چیه؟ فقط /home رو encrypt کنم بقیش پارتیشن معمولی باشه؟

تقصیر دبیانه :grin: دیفالت اینستالر بود.

خوب من weekly-builds دانلود کردم که ۴روز پیش ساخته شده. برای همین میگم احتمالا با نسخه‌ی آپدیت شده‌ی buster یکی باشه.
خوب uname هم که نمیتونم بگیرم چون هیچ کامندی نمیتونم بزنم!

از تو BIOS باید خاموش کنی.

encryption کلا خیلی کنده. شما نیاز نداری پارتیشن OS رو encrypt کنی. خیلی راه های زیادی وجود داره که دیتایی که حساس هست رو یه جا به صورت encrypted نگه داری. نیازی نیست همه سیستم رو کند کنی بخاطر encryption. مثلا می تونی هر فایل رو با gpg رمزنگاری کنی یا یه فایل چند گیگا بایتی درست کنی که encrypt شده باشه بعد mount کنی یه جا رو سیستمت و مثل یه پارتیشن جدید ازش استفاده کنی و با یه پارتیشن کوچیک رو encrypt کنی. روش دوم امنیتش بیشتر چون اگر نیاز نباشه mount نمی کنی و اگر کسی بشینه پست سیستم بازم نمی تونه کاری کنه.

کلا به نظر من overkill و نمی دونم چرا یه چند وقته که پیش فرض گذاشتن.

اگر می خوای از ورژن های آخر debian استفاده کنی پیشنهاد می کنم بری سراغ testing یا sid. البته مشکل شما چیز دیگه ای هست اما در کل می گم. بلدی chroot کنی ؟

1 Like

آخرین بار که پای plasma نشستم یه نرم‌افزار داشت plasma vault که همچین کاری میکرد. البته gpg نبود و به خاطر اینکه زیاد پایدار نیست، تو ریپازیتوری دبیان نیومده!
خیلی ممنون. حتما اینکارو امتحان میکنم.

این لپتاپ صاحبش یکی دیگست. ایشالا وقتی لپتاپ خودمو گرفتم.

همین الآن روی arch دارم این مطلبو مینویسم، اندازه‌ی موهای سرم chroot کردم :grin: ولی توی دبیان نمیدونم چطوری باید اینکارو انجام بدم؟ isoی لایو داره؟


الآن برم یک بار دیگه بدون lvm و luks نصبش کنم ببینم چی میشه.
ممنون بابت راهنماییها و توضیحات.

با arch یکیه فقط باید توجه کنی که dev/ و proc/ و sys/ رو از روی سیستمی که در حال اجراست bind کنی تو سیستمی که می خوای توش chroot کنی.

1 Like

مشکل حل شد :neutral_face:
تنها کاری که کردم، «خلاص شدن از شر lvm» بود.
الان همه چیز همون سرعتیو داره که باید داشته باشه، دمای cpu نرماله و فن آرومه، dmesg حالش خوبه، حتی کارت گرافیک nvidia هم سلام میرسونه :neutral_face:

مثل همیشه بابت راهنماییها ممنونم؛ اگه به خودم بود، حذف lvm+luks آخرین گزینه توی لیست تستهام بود!


راستی ورژن کرنلی که از روی اون iso نصب شده، مثل ورژن شماست.

خوشحالم که مشکل حل شد. اما به عنوان یه چک لیست همیشه سعی کن مواردی رو که ممکن تولید پیچیدگی کنن از سیستم جذف کنی تا بتونی به دلیل مشکل نزدیکتر شی

1 Like

سلام مجدد.

بازهم همون لپتاپ، بازهم همون مشکل.
فقط اینبار lvm وجود نداره. خود nvidia داره بازی درمیاره.

کرنل رو آپگرید کردم به 5.2.0.2 و درایور nvidia-legacy-390 نصب کردم. بهتر شد یعنی دیگه گیر نمیکرد ولی محیط گرافیکی هم بالا نمیومد.
الآن nvidia-legacy-340 نصب کردم دوباره پیغام cpu stuck میده.

مشکل از این نیست؟

نمیشه کلا بیخیال nvidia بشم با intel graphic کار کنم؟ چطوری میشه خاموشش کرد؟ با acpi=off میدونم که nvidia و خیلی چیزای دیگه خاموش میشن (اگه تا همینجا دووم آوردم و تونستن چندتا چیزو تست کنم، به لطف همین بوده)، ولی اگه بخوام فقط کارت گرافیک رو خاموش کنم باید چیکار کنم؟

لپ تاپت دوتا کارت گرافیک داره ؟

خب یه کارت گرافیک nvidia داره و cpu هم پردازنده ی داخلی داره.
نمیدونم چرا با این سیستم اینقدر مشکل دارم. Gtx1050 هست.
یه pc هم دارم gtx750ti که از نظر نرم افزاری دقیقا مثل همن ولی با اون مشکلی ندارم. البته توی pc هم نمیتونم پردازش گرافیکی انجام بدم. انگار مشکلی توی درایور هست. (توی بلندر نمیتونم با کارت گرافیک رندر بگیرم)

متوجه نشدم.

بنظر میاد یه چیپ گرافیک intel هم داری. از درایور می تونه باشه از تنظیمات X هم می تونه باشه

1 Like

منظورم این بود که «نمیدونم. ولی چون intel i7 هست پس احتمالا کارت گرافیک اینتل هم داره»

آخه چیزی تنظیم نمیکنم که! همه‌چی دیفالته.

اگر دوتا کارت گرافیکی داشته باشی که خیلی فکر می کنم اینجوری باشه سعی کن از تو BIOS اینتل رو خاموش کنی و امتحان کنی

1 Like

توی بخش graphic configuration فقط یه گزینه داره برای تعیین میزان رمی که به گرافیک اینتل اختصاص میدیم (دیفالت رو ۶۴مگابایت)
چیزی برای کنترل nvidia نداره. یعنی اصلا هیچ تنظیم دیگه ای نداره.
برای همین امیدوار بودم توی grub بشه کاریش کرد.

پردازنده ی i7 7700hq پردازنده ی گرافیک داخلی داره. (همه ی سری coreiها دارن)

خوب پس مجبوری از bumblebee استفاده کنی

1 Like

GTX1050 نیاز به پکیج Nvidia-430 هست

1 Like

اینم تست کردم بازم موقع نصب cup stuck میده.

وقتی nvidia-detect میزنم میگه nvidia-390 ولی به هر حال هردوشونو تست کردم. nvidia-driver هم که فکر میکنم اوپن‌سورس باشه هم تست کردم.

فعلا بیخیالش شدم تا بعدا ببینم چیکار میشه کرد. همه‌ی آپشنها توی کرنل 4.19 موجب هنگ کردن سیستم میشه درحالی که توی کرنل 5.2 هنگ نمیکنه ولی محیط گرافیکی بالا نمیاد.
البته bumblebee توی هردوتا کرنل هنگ میکنه.