ویکی‌پدیا:گزیدن مقاله‌های خوب/رگرسیون خطی

از ویکی‌پدیا، دانشنامهٔ آزاد

رگرسیون خطی[ویرایش]

مشکلات مقاله مرتفع شد و شرایط خوبیدگی را دارد. — حجت/بحث ‏۱۹ سپتامبر ۲۰۱۹، ساعت ۲۳:۴۹ (UTC)[پاسخ]

بحث زیر بسته شده است. لطفاً آن را تغییر ندهید. ادامهٔ دیدگاه‌ها باید در صفحهٔ بحث مناسب ثبت شوند. نباید ویرایش دیگری در این ریسه انجام شود.

پیشاخوبیدگی رگرسیون خطی
ویرایش ورودی‌ها
اندازهٔ مقاله ۱۱۲٬۸۴۶
آیا مقاله ترجمه از ویکی‌های دیگر است؟ تا حدودی
املا و انشای خوب انجام شد
دیباچهٔ مناسب انجام شد
منبع‌دارکردن همهٔ مطالب انجام شد
یادکرد صحیح منابع انجام شد
جایگزینی منابع نامعتبر (به‌خصوص منابع ویکیایی) با منابع معتبر انجام شد
بررسی حق نشر (متن و پرونده‌ها) انجام شد
جعبهٔ اطلاعات و/یا جعبهٔ گشتن مناسب انجام شد
رده و میان‌ویکی مناسب انجام شد
تصویر(های) مناسب انجام شد
پیوند به محتوا(ها)ی مرتبط در پروژه‌های خواهر انجام شد
پیوند پایدار منابع برخط به‌زودی انجام می‌شود
هنوز ناظر وپ:گمخ صحت ورودی‌ها را تأیید نکرده‌است.
 رگرسیون خطی (ویرایش | تاریخچه) • بحثپی‌گیری


نامزدکننده: Tarikhejtemai (بحثمشارکت‌ها) ‏۱۸ مهٔ ۲۰۱۹، ساعت ۲۳:۴۷ (UTC)[پاسخ]

خسته نباشید. چند نکته در بررسی اولیه:

  • قبل از معرفی رگرسیون خطی لازم است در بخشی همهٔ مفاهیم توضیح داده شوند (مدل آماری، رگرسیون، ضریب همبستگی، چرا اسمش رگرسیون خطی است و..) بخش تاریخچه را هم از پایین مقاله بردارید و در این بخش ادغام کنید. تفاوت رگرسیون و همبستگی هم جایش این جاست.
  • به پیش‌فرض‌های بنیادین تحلیل رگرسیون خطی اشاره‌ای نشده. بخشی با این عنوان بعد از بخش مفاهیم بسازید.
  • جای بخشی برای کاربردها خالی است. (در آمار، علوم کامپیوتر، اقتصاد، پزشکی و ...)
  • لید هم خیلی کوتاه است و موضوع را معرفی نمی‌کند. فکر کنید در این بخش قرار است کل مقاله را برای یک دانش‌آموز دبیرستانی خلاصه کنید. سعی کنید دستکم دو بند باشد. معمولا نیازی به منبع گذاشتن در این بخش هم نیست. برای نمونه مقالهٔ انگلیسی en:Linear regression را نگاه کنید.
  • عنوان بخش‌ها را لینک نکنید، به جایش می‌توانید زیر آن‌ها از الگوهای {{اصلی}} و {{مرتبط}} استفاده کنید.
  • فرمول‌ها درازند و از صفحه بیرون می‌زنند. هر کدام را در دو سه خط بشکنید. برای شکستن اول بعد از تگ math بنویسید \begin{align} و قبل از بستن تگ math بنویسید \end{align} و در جای مناسب (مثلا قبل از علامت مساوی) با گذاشتن \\ فرمول را بشکنید.
  • به تجربهٔ من بهترین شکل گذاشتن فرمول‌ها در وب فارسی به شکل {{وسط‌چین}} شده است. برای مثال بیضی را ببینید.
  • معادل انگلیسی عبارات را در {{یاد}} بگذارید، بعد پایین صفحه قبل یک بخش یادداشت‌ها درست کنید و الگوی {{یادداشت}} را زیرش بگذارید.
  • منابع انگلیسی را چپ‌چین کنید (برای این‌کار تگ ref منابع انگلیسی را به صورت <ref dir='ltr'> بنویسید)
  • منبع شماره ۴ (کریمی فر، ۱۳۸۷) به صورت کوتاه آمده، این کار مال وقتی است که در انتهای مقاله فهرست منابعی باشد.
اگر مورد دیگری به ذهنم رسید خدمتان عرض می‌کنم.‏—NightD ‏۲۰ مهٔ ۲۰۱۹، ساعت ۱۵:۵۵ (UTC)[پاسخ]
@Nightdevil: عزیز، خیلی ممنون برای توضیحات مفیدی که در بالا فرمودید، در عرض چند روز آینده همه را در مقاله اعمال میکنم. با سپاس فراوان Tarikhejtemai (بحث) ‏۲۱ مهٔ ۲۰۱۹، ساعت ۰۳:۴۶ (UTC)[پاسخ]
@Nightdevil: ، مواردی که در بالا فرموده بودید را اعمال کردم، خوشحال میشوم اگر دوباره یک نگاهی بیاندازید، با سپاس فراوان Tarikhejtemai (بحث) ‏۲۲ مهٔ ۲۰۱۹، ساعت ۰۵:۱۲ (UTC)[پاسخ]
@Tarikhejtemai: دستتان درد نکند. به‌نظرم از نظر ساختاری مشکل دیگری ندارد. تا چند روز آینده از نظر املایی و انشایی بررسی می‌کنم.‏—NightD ‏۲۴ مهٔ ۲۰۱۹، ساعت ۱۶:۰۹ (UTC)[پاسخ]
نظر حجت

من راستش نظر راجع به این مقاله زیاد دارم؛ خواهشمندم که کم صبر کنید تا دسته‌بندی‌اش کنم و ثبت کنم. به نظر من مقاله کمی کار دارد تا خوبیده بشود.

عجالتاً تغییراتی که در دیباچه دادم را ببینید (چند ویرایش اخیر)؛ پیوند کردن واژه‌های تخصصی به مقالهٔ مرتبط یکی از کارهای مهمی است که به قدر کفایت انجام نشده. رسم بر این است که در دیباچه یک بار پیوند صورت بگیرد، و در باقی مقاله هم در اولین کاربردش باز پیوند صورت بگیرد (مثلاً «مدل آماری» یکبار در دیباچه و یکبار در بخش مفاهیم پیوند بشود). این را لطفاً در باقی مقاله انجام بدهید تا من به بررسی خودم ادامه می‌دهم — حجت/بحث ‏۲۵ مهٔ ۲۰۱۹، ساعت ۱۶:۳۰ (UTC)[پاسخ]

  • اشاره‌ای به مفهوم رگرسیون خطی ساده (en:simple linear regression) و رگرسیون خطی چندگانه (multiple linear regression) نشده‌است و تفاوت آن با رگرسیون چندمتغیره نیز بحث نشده‌است. این تفاوت یکی از رایج‌ترین سردرگمی‌های افرادی است که با رگرسیون تازه آشنا شده‌اند یا درست آن را فرانگرفته‌اند. ✓
  • مفهوم «خطی» بودن رگرسیون به خوبی شرح داده نشده‌است. شایسته است که مقالهٔ en:Linear predictor function هم ساخته بشود و به آن ارجاع بشود. به رابطه خطی هم ارجاع شده اما به نظر من آن پیوند مناسبی نیست و این که معرفی کردم مناسب‌تر خواهد بود. کلاً هم یکی دو جمله راجع به این که «رابطه خطی» یعنی چه در مقاله باید شرح داده بشود. اشاره‌ای به این که خط در ابعاد بالاتر به صورت صفحه و فراصفحه (هایپر پلین) نمایش می‌یابد هم مفید است.✓
  • مفهوم‌های «پارامتر» و «داده» نیاز به پیوند شدن دارند.✓
  • رگرسیون خطی فقط این چیزی که در مقاله شرح داده شده (و متمرکز بر تخمین «میانگین» متغیر وابسته است) نیست؛ رگرسیون‌های متمرکز بر تخمین میانه و غیره هم داریم.✓
  • جملهٔ آخر پاراگراف دوم لید مقالهٔ ویکی‌پدیای انگلیسی به نظر من خیلی مهم است (این که همهٔ مدل‌های رگرسیونی روی توزیع احتمال شرطی کار می‌کنند و نه توزیع احتمال توأم). پیوندهایی به این توزیع‌ها هم در جای مناسب باید اضافه بشود.✓
  • بخش تاریخچه به شوخی شبیه است :) این و خیلی منابع دیگر به راحتی در دسترس هستند تا تاریخچه را کامل کنید.✓
  • روش‌های محاسبه‌ای که در مقاله آمده، در دیباچه خوب معرفی نشده‌اند. من باز روشی که در پاراگراف آخر نسخهٔ ویکی‌پدیای انگلیسی آمده را بیشتر می‌پسندم.✓
  • بخش‌هایی با نام «تفاوت رگرسیون و همبستگی براساس هدف:» و «تفاوت رگرسیون و همبستگی براساس روش:» هست که باید تبدیل به یک زیربخش (با دستور === تفاوت رگرسیون و همبستگی براساس هدف ===) بشوند؛ شاید بد نباشد که هر دو تبدیل به یک بخش بشوند با نام «تفاوت رگرسیون و همبستگی».✓
  • این که «خطی» به معنای خط راست نیست باز یکی از کج‌فهمی‌های رایج است. من مثالی که در ویکی‌پدیای انگلیسی برای روابط خطی از نوع چندجمله‌ای درجهٔ سوم (cubic polynomial) زده و تصویر هم گذاشته که خواننده ببیند خط مذکور خط راست نیست را دوست دارم و به نظرم اینجا باید اضافه بشود.✓
  • پیش‌فرض‌ها فقط بر شمرده شده اما توضیح داده نشده. هر پیش‌فرض باید توضیح داده بشود (امیدوارم از مثال زدن از مقالهٔ ویکی‌پدیای انگلیسی خسته نشده باشید؛ در این زمینه هم بهتر عمل کرده!) ✓
  • بخشی برای تحلیل نتایج مدل رگرسیون (interpretation) باید اختصاص یابد.✓
  • بخش سوم و چهارم مقاله در حالت فعلی، باید برود ذیل یک عنوان «تخمین پارامترها». روش‌های تخمین دیگری نیز رایج است (مثل Least-angle regression یا Quantile regression که برایشان مقاله نداریم) که باید اشاره بشوند.✓
  • اشاره‌ای به تعمیمات رگرسیون خطی (و طبعاً مدل خطی تعمیم‌یافته) باید بشود.✓
  • بخش کاربردها به شدت کوتاه است.✓
  • محدودیت‌های روش رگرسیون خطی شرح داده نشده. همان پیوند قبلی شروع خوبی است.✓

موضوع خوبی را انتخاب کردید، اما مقاله هنوز خیلی کار دارد. — حجت/بحث ‏۲۵ مهٔ ۲۰۱۹، ساعت ۱۸:۰۸ (UTC)[پاسخ]

@Huji: ، خیلی ممنون برای نظرات بالا و تغییر بعضی اصطلاحات در دیباچه. بسیاری از قسمتهای مقاله از دید یادگیری ماشین نوشته شده‌اند نه مباحث سنتی آماری، مانند گرادیان کاهشی تصادفی، یا تنظیم مدل که نسبتا مباحث جدیدی هستند. از این رو برای انسجام بیشتر مقاله سعی کردم که تمام مقاله بیشتر با اصطلاحات یادگیری ماشین پیش برود ولی شاید بشود که هر دو را در مقاله گنجاند. در مورد تاریخچه یک منبع پیدا کردم که اولین استفاده از رگرسیون خطی را به دو قرن پیش نسبت می‌داد، آیا شما منابع دیگری سراغ دارید که اطلاعات بیشتری در این زمینه ارائه بدهد؟ در زمینه کاربردها هم به علت فراوانی و گستردگی‌شان نمی‌دانم کدامیک را در مقاله ذکر کنم. بزودی بر روی سایر موارد بالا کار می‌کنیم. با سپاس Tarikhejtemai (بحث) ‏۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۳۹ (UTC)[پاسخ]
@Tarikhejtemai: یادگیری ماشینی فقط یکی از کاربردهای رگرسیون خطی است و اساساً هم یک علم کاربردی است (در حالی که علم آمار، علمی که در آن رگرسیون خطی شکل گرفت، یک علم پایه‌ای است. برای تکمیل این مقاله بهتر است از کتاب‌های آمار استفاده کنید، نه کتاب‌های یادگیری ماشینی.
منبعی که گفته تاریخچهٔ رگرسیون خطی به دو دهه قبل بر می‌گردد را همانجا دور بیندازید! سابقهٔ خود یادگیری ماشینی بیش از دو دهه است، رگرسیون که به کنار! اولین تلاش‌ها در راستای ایجاد مدل‌های رگرسیون خطی را به فرانسیس گالتون (درگذشتهٔ ۱۹۱۱ میلادی) نسبت می‌دهند (مثالی از یک منبع در همین خصوص) که یعنی قدمت این روش آماری به بالای صد سال می‌رسد. — حجت/بحث ‏۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۴۸ (UTC)[پاسخ]
@Huji: در مورد تاریخچه منظورم دو قرن بود، اشتباها دودهه نوشتم (پیش‌بینی حرکت سیارات توسط گاوس)، ممنون برای منبع بالاTarikhejtemai (بحث) ‏۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۵۳ (UTC)[پاسخ]
@Tarikhejtemai: دو قرن منطقی‌تر است (اگر چه کمی از آن طرف پشت بام افتاده). — حجت/بحث ‏۲۷ مهٔ ۲۰۱۹، ساعت ۱۹:۱۱ (UTC)[پاسخ]
وضعیت مقاله
بررسی دور دوم

چندین اشکال انشایی را خودم برایتان حل کردم چون زحمتش کمتر از این بود که اینجا بنویسم و شما حل کنید. با توجه به میزان دخالتی که در مقاله داشته‌ام خوب است که شخص ثالثی هم این گمخ را بررسی کند و توسط من بسته نشود.

این موارد را هم حتماً در نظر بگیرید:

  • برای رگرسیون چندک، رگرسیون لارس و رگرسیون خطی تعمیم‌یافته در انتهای بخش مربوط به هر کدام یکی دو جمله اضافه کنید که کاربردشان چیست. اگر فقط کاربرد را در چارچوب مفاهیم شرح بدهید (مثلاً «رگرسیون خطی تعمیم‌یافته را می‌توان زمانی به کار برد که رابطهٔ بین متغیر وابسته و مستقل یک خط راست نباشد اما بتوان از طریق یک انگاشت آن را به خطی راست تبدیل کرد؛ مثلاً اگر رابطهٔ بین متغیر وابسته با یک متغیر مستقل رابطهٔ نمایی باشد می‌توان با کمک یک چندجمله‌ای درجهٔ دوم این رابطه را خطی کرد») کافی است اما اگر مثال واقعی از دنیای بیرون ارائه کنید بهتر هم هست (مثلاً در مورد روابط نمایی، سرعت رشد و تقسیم باکتری‌ها مثال خوبی است). بدیهی است که منبع هم باید بیاورید.✓
  • یک برچسب {{مدرک}} و یک برچسب {{کدام}} در مقاله زدم که باید اصلاح کنید.✓
  • فرمول‌ها را در حد سواد خودم چک کردم و درست به نظر می‌رسند اما اگر یک نفر دیگر هم بررسی کند عالی می‌شود. متوجهم که پیدا کردن شخص ثالث ممکن است دشوار باشد.
  • تصویری که برای رگرسیون لارس گذاشتید، توضیح بیشتری می‌طلبد. خط‌ها چه چیزی را نشان می‌دهند؟ بد نیست که تصویر را کمی بزرگتر کنید که خواناتر بشود و لازم است که توضیحات زیرش هم را گسترش بدهید.✓
  • تنها بخشی که هنوز جایش خالی است بحث «عیب‌یابی مدل رگرسیونی» است (en:Regression diagnostic که شامل بررسی q-q plot و شاخص‌هایی مثل Cook's D و این‌ها می‌شود). این را می‌شود گذاشت برای برگزیدگی اما اگر به صورت مختصر اشاره کنید ایدئال خواهد بود.✓

در کل مقاله را خیلی دوست دارم. — حجت/بحث ‏۱۴ اوت ۲۰۱۹، ساعت ۲۳:۳۳ (UTC)[پاسخ]

خیلی ممنون برای فیدبکهای بالا، تا چند روز آینده روی این چند مورد کار خواهم کرد. Tarikhejtemai (بحث) ‏۱۵ اوت ۲۰۱۹، ساعت ۲۱:۵۱ (UTC)[پاسخ]
@Huji: جان این چند مورد بالا را هم انجام دادم. برای چک کردن نهائی فرمول‌ها آیا خود شما شخصی را در نظر دارید؟ Tarikhejtemai (بحث) ‏۱۸ اوت ۲۰۱۹، ساعت ۲۳:۴۰ (UTC)[پاسخ]
@Nightdevil: شما می‌توانید فرمول‌ها را بررسی کنید؟ — حجت/بحث ‏۱۸ اوت ۲۰۱۹، ساعت ۲۳:۴۸ (UTC)[پاسخ]
با عرض معذرت از تاخیر، تا فردا بررسی می‌کنم.‏—NightD ‏۲۵ اوت ۲۰۱۹، ساعت ۱۷:۲۱ (UTC)[پاسخ]

@Huji و Nightdevil: سلام. کار بررسی این مقاله به کجا رسید؟--سید (بحث) ‏۳۰ اوت ۲۰۱۹، ساعت ۰۴:۰۳ (UTC)[پاسخ]

@Nightdevil: عزیز، می‌خواستم بپرسم فرصت کردید فرمول‌ها را چک کنید؟ پیشاپیش ممنون از وقت و زحمتتان. Tarikhejtemai (بحث) ‏۸ سپتامبر ۲۰۱۹، ساعت ۲۱:۰۵ (UTC)[پاسخ]

باز هم شرمنده از تاخیر، روش تنظیم را متاسفانه هرچه خواندم نفهمیدم، ولی فرمول‌های بخش‌های دیگر را چک کردم و مشکلی ندیدم جز این چند نکته:

تخمین پارامترها> رگرسیون خطی ساده
  • «در این روش پارامترها را با کمینه‌کردن تابع زیر به دست می‌آورند:» بنویسید «تابع زیر» چیست (مجموع مربعات خطا) ✓
  • «در مورد رگرسیون ساده، پارامترها با این روش برابر خواهند بود با:» بازهٔ عملگرهای سیگمای صورت و مخرج را بنویسید (i=1 تا N) ✓
  • در عبارت دوم (y-b1xb1) یک b1 زیادی است. ✓
رگرسیون خطی چندگانه>صورت مسئله
  • «ورودی چند متغیره هست» > چند متغیره است✓
  • «ترکیبی خطی از بردارد ورودی» > بردار✓
رگرسیون خطی چندگانه>کمترین مربعات
@Huji و Nightdevil: خیلی ممنون بابت فیدبکهای بالا، همه موارد اصلاح شد. Tarikhejtemai (بحث) ‏۱۹ سپتامبر ۲۰۱۹، ساعت ۱۹:۴۰ (UTC)[پاسخ]

خوب شد


بحث بسته شده است. لطفاً آن را تغییر ندهید. ادامهٔ دیدگاه‌ها باید در صفحهٔ بحث مناسب ثبت شوند. نباید ویرایش دیگری در این ریسه انجام شود.