بحث ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۰: تفاوت میان نسخه‌ها

Page contents not supported in other languages.
از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
بدون خلاصۀ ویرایش
خط ۴۲: خط ۴۲:
:طبق آنچه گفتید کاربردش را گسترده می‌کنم که ببینیم چه‌طور عمل می‌کند. — [[کاربر:Huji|حجت]]/[[بحث_کاربر:Huji|<sup>بحث</sup>]] ‏۲۱ اوت ۲۰۲۱، ساعت ۰۰:۰۷ (UTC)
:طبق آنچه گفتید کاربردش را گسترده می‌کنم که ببینیم چه‌طور عمل می‌کند. — [[کاربر:Huji|حجت]]/[[بحث_کاربر:Huji|<sup>بحث</sup>]] ‏۲۱ اوت ۲۰۲۱، ساعت ۰۰:۰۷ (UTC)
::{{پ|Huji}}بنظرم از دستور (start:آ) به جای (!:start) استفاده کنید چون رده‌های جدید اکثراً با حروف ساخته می‌شوند و کلی رده هم قبل از حروف داریم که خیلی استفاده ای ندارد. یکی هم (start:س) موازی کار کند که سرعت دوبرابر شود.(یواشکی بذارید صدای بنیادی ها درنیاید:)) خود رده‌ها را هم می‌توانید بدهید رده دهی کند. توی کرون تب هم می‌توانید با فواصل کم و تعداد رده‌های کمتر بگذارید چون تعداد بالا ممکن است توقف کند. --'''<font face="mistral">[[User:Mahdiz|<font color="#00ccff">M A H D I</font>]]</font>''' [[User_talk:Mahdiz|<big><big><font color="#990000">✍</font></big></big>]] ‏۲۱ اوت ۲۰۲۱، ساعت ۰۶:۲۷ (UTC)
::{{پ|Huji}}بنظرم از دستور (start:آ) به جای (!:start) استفاده کنید چون رده‌های جدید اکثراً با حروف ساخته می‌شوند و کلی رده هم قبل از حروف داریم که خیلی استفاده ای ندارد. یکی هم (start:س) موازی کار کند که سرعت دوبرابر شود.(یواشکی بذارید صدای بنیادی ها درنیاید:)) خود رده‌ها را هم می‌توانید بدهید رده دهی کند. توی کرون تب هم می‌توانید با فواصل کم و تعداد رده‌های کمتر بگذارید چون تعداد بالا ممکن است توقف کند. --'''<font face="mistral">[[User:Mahdiz|<font color="#00ccff">M A H D I</font>]]</font>''' [[User_talk:Mahdiz|<big><big><font color="#990000">✍</font></big></big>]] ‏۲۱ اوت ۲۰۲۱، ساعت ۰۶:۲۷ (UTC)
:::{{پینگ|Mahdiz}} نیت‌تان خوب است اما ایده‌ای که دادید نه! :) پای‌ویکی‌بات روش خیلی بهتری برای چیزی که گفتید دارد: استفاده از پارامتر random که به کمک آن هر بار تعداد مشخصی صفحه به طور تصادفی گرفته می‌شوند و ربات رویشان رانده می‌شود.
:::فعلاً سپردم که هر ساعت هم صفحه‌های جدید را بررسی کند و هم ۵۰۰ صفحه را به طور تصادفی بررسی کند. در این خلال یک اشکال هم کشف کردم (اگر صفحهٔ نظیر در ویکی‌پدیای انگلیسی تغییرمسیر باشد رده‌هایش معمولاً نامربوط هستند و نباید به نسخهٔ ویکی‌پدیای فارسی اضافه شوند) که در کد ربات رفعش کردم. — [[کاربر:Huji|حجت]]/[[بحث_کاربر:Huji|<sup>بحث</sup>]] ‏۲۳ اوت ۲۰۲۱، ساعت ۲۲:۱۳ (UTC)

نسخهٔ ‏۲۳ اوت ۲۰۲۱، ساعت ۲۲:۱۳

حداقل‌ها

در بحث کاربر:Mahdiz بحث مرتبطی رخ داد که در اینجا می‌توان آن را دید. بخش انتهایی بحث در زیر کپی شده‌است. هدف آن است که کاربر:Huji این موارد را در کد لحاظ کند تا کاربر:Yamaha5 رباتش را ملزم کند که این نسخهٔ جدید کد را اجرا کند.

@Yamaha5: پس لطفاً حداقل‌ها را دقیق مشخص کنید که مسیر پیش رو هم مشخص باشد. می‌دانم ممکن است به نظرتان «زحمت تکراری» بیاید. اما اگر یک مجموعه‌ای از حداقل‌ها را تعریف کنید و قبول کنید که فقط همان‌ها را انتظار دارید، تکلیف من و شما و بقیه مشخص خواهد شد. دوست ندارم ده‌ها ساعت روی کد وقت بگذارم و آخرش به این برسیم که باز از نظر شما حداقل‌های بیشتری را باید رعایت کند. — حجت/بحث ‏۲۰ ژوئیهٔ ۲۰۲۱، ساعت ۱۰:۳۲ (UTC)پاسخ

@Huji: حداقل‌ها را جامعه ویکی‌فا به مرور زمان درخواست کرد و خواست من نیست. شما کد را شروع کنید نهایتاً اگر موردی باشد افزوده می‌شود چیزی از تلاش شما کم نمی‌کند. موارد زیر را حضور ذهن دارم مابقی را از موارد ذکر شده در وپ:ردا همسنگ و خود کد می‌توانید پیدا کنید.
  1. ربات الگو:رده همسنگ نه و الگو:رده میلادی نه را بشناسد و مقاله را رده‌دار نکند.
  2. رده پنهان، رده نگهدار، رده حذف شده در ویکی انگلیسی، رده ناموجود در انگلیسی، رده‌ای که میان‌ویکی فارسی به فضای نام غیر رده وصل باشد، رده بهتر، رده تغییرمسیر، رده پدر/مادر، رده تراگنجایش شده در انگلیسی، رده زبان‌شناسی را به مقاله نیافزاید
  3. روی فضای نام بحث‌ها و پودمان و مدیاویکی و کاربر و… کار نکند
  4. رده تکراری نیافزاید
فعلا این موارد به ذهنم رسید یاماها۵ / ب ‏۲۱ ژوئیهٔ ۲۰۲۱، ساعت ۰۳:۳۰ (UTC)پاسخ

@Yamaha5: پیرو بحث بالا، من کد را به روز کردم.

  • امکان استفاده از fa_cosmetic_changes_core را به صورت اختیاری افزودم. آیا نسخه‌ای از این کد دارید که با پایتون ۳ سازگار باشد؟
  • مورد اول انجام شد؛ به جای این که ربات در متن صفحه به دنبال الگو بگردد، با کمک رده‌های صفحه تشخیص می‌دهد که آیا از ردهٔ همسنگ مستثنی شده‌اند یا نه.
  • مورد دوم انجام شد؛ به جای این که دستی این رده‌ها را مستثنی کنم، یا حتی به جای این که در متن صفحهٔ رده‌ها دنبال دستوری بگردم که آن‌ها را به ردهٔ پنهان تبدیل کند، از قابلیت‌های pywikibot استفاده کردم تا رده‌هایی که خود رده در آن قرار دارد را بررسی کنم؛ اگر رده در رده:رده‌های پنهان بود، نادیده گرفته می‌شود. یک میانگیر (cache) هم به کار گرفتم تا سرعت تشخیص این مسئله کند نباشد.
  • مورد سوم از پیش انجام شده بود؛ در کد دنبال allowednamespaces بگردید.
  • مورد چهارم انجام شد؛ به جای این که در متن صفحه دنبال دستورهای رده بگردد، از قابلیت‌های pywikibot استفاده می‌کند تا فهرست رده‌های فعلی صفحه را بگیرد؛ ردهٔ همسنگی که از پیش موجود باشد، دیگر اضافه نخواهد شد.

برای آزمایش، من ربات را روی صفحهٔ .ir راندم که ربات افزودن هیچ رده‌ای را پیشنهاد نکرد. سپس یکی از رده‌هایش را حذف کردم و ربات را دوباره راندم؛ به درستی رده را شناسایی کرد و افزود.

لطفاً کد را بررسی کنید و بگویید که برای قدم بعد چه چیزی لازم است؟ از نظر من غیر از مستندسازی کد، تنها چیزی که لازم است وجود یک نسخه از کد زیباسازی است که با پایتون ۳ کار کند. — حجت/بحث ‏۱۲ اوت ۲۰۲۱، ساعت ۰۲:۴۹ (UTC)پاسخ

@Huji: برای ۱۰۰۰ ویرایش به مسئولیت خودتان مجوز دارد یاماها۵ / ب ‏۱۵ اوت ۲۰۲۱، ساعت ۱۵:۴۱ (UTC)پاسخ
@Yamaha5: بسیار خوب می‌رانمش و خبر می‌دهم. توجه کنید که فعلاً ربات از کد زیباسازی استفاده نخواهد کرد. مسؤولیت سازگار سازی آن با پایتون ۳ را در این لحظه نمی‌توان قبول کنم. آن کد هم یک فاجعهٔ دیگری است برای خودش :) — حجت/بحث ‏۱۵ اوت ۲۰۲۱، ساعت ۲۱:۱۷ (UTC)پاسخ
@Yamaha5: سپردم تحت نظارت خودم، جدیدترین ۵۰۰ صفحهٔ ویکی را بررسی کند. بیشترشان نیازی به ردهٔ همسنگ نداشتند. در یکی دو مورد ربات پیشنهاد کرد رده‌ای ردیابی را بیفزاید که جلویش را گرفتم. اساساً رده‌های ردیابی باید همگی پنهان باشند اما حدود ۸۰تاشان هنوز نیستند که این را دستی درست خواهم کرد. با توجه به موارد بالا، فقط ۲ ویرایش توانست بکند: ویژه:تفاوت/32853657 و ویژه:تفاوت/32853658.
نظرتان چیست که بگذارم هر روز ۵۰۰ صفحه را بررسی کند؟ این‌طوری ظرف یکی دو هفته احتمالاً تعداد کافی ویرایش خواهد کرد که بتوانیم کیفیت کارش را قضاوت کنیم. — حجت/بحث ‏۱۷ اوت ۲۰۲۱، ساعت ۲۲:۵۳ (UTC)پاسخ
@Yamaha5: بیشتر که راندمش ویرایش‌های بیشتری کرد. اینجا فهرستی از آن‌ها را می‌بینید. نظرتان چیست؟ — حجت/بحث ‏۱۸ اوت ۲۰۲۱، ساعت ۰۲:۱۵ (UTC)پاسخ

چند مدت بگذارید کار کند تا به ۱۰۰۰ ویرایش برسد و قابل قضاوت و بررسی باشد یاماها۵ / ب ‏۱۸ اوت ۲۰۲۱، ساعت ۰۲:۲۱ (UTC)پاسخ

@Yamaha5: بسیار خوب. فعلاً می‌سپارم که روزی چند بار اجرا شود. ضمناً کد را هم تمیزکاری کردم و مستنداتی به آن افزودم. — حجت/بحث ‏۱۸ اوت ۲۰۲۱، ساعت ۰۲:۳۱ (UTC)پاسخ
@Yamaha5: سپرده‌ام که ربات ساعتی یک بار از خواب بیدار شود و به ۵۰۰ صفحهٔ تازه ساخته‌شده نگاه کند و تلاش کند ردهٔ همسنگ بیفزاید. این گزارش را ببینید. علی‌رغم تلاش بالا، روزی ۲۰ تا ۳۰ مورد بیشتر نمی‌تواند ویرایش کند. حالا یا دلیلش است که صفحه‌های تازه‌ساز، رده‌های مناسب را از پیش دارند (مثلاً اگر توسط به‌ویکی‌فا ساخته شده باشند معمولاً چنین است) یا این که ربات دیگری (ربات شما؟) هم در حال افزودن رده‌های همسنگ است و فرصت به ربات من نمی‌رسد.
مقصود این که اگر شرط ۱۰۰۰ ویرایش را (که متداول هم نیست، معمولاً ۱۰۰ ویرایش طلب می‌کنیم نه ۱۰۰۰) بخواهم اجابت کنم، ربات احتمالاً باید نزدیک ۴۰ روز ویرایش کند. بنده البته عجله‌ای ندارم اما گفتم در جریان باشید که فعلاً تا یک ماهی این بحث در آب نمک می‌ماند. مگر این که با بررسی همین پنجاه خرده‌ای ویرایش فعلی (یا با تغییر حدنصابتان به ۱۰۰ یا ۲۰۰) بخواهید زودتر تکلیف را روشن کنید.
یک ایدهٔ دیگر هم این است که به ربات بسپارم که فقط دنبال صفحه‌های جدید نباشد، بلکه به رده‌های جدید هم گیر بدهد؛ هر بار رده‌ای ساخته شد که میان‌ویکی داشت، به ردهٔ نظیر در ویکی‌پدیای انگلیسی برود و برای هر مقاله در آنجا، مقالهٔ نظیر در ویکی‌پدیای فارسی را (اگر وجود داشت) باید و رده‌افزایی کند. تغییر کد دشوار نخواهد بود و درخواستش را هم پیشتر در صفحهٔ بحثم داده‌اند. می‌خواهید این را بیفزایم تا سرعت کار کمی بالا برود؟ — حجت/بحث ‏۲۰ اوت ۲۰۲۱، ساعت ۰۴:۰۳ (UTC)پاسخ

درخواست ۱۰۰۰ ویرایش برای ربلتی که ۲۴/۷ قرار به فعالیت است نامعقول نیست بعداً متوجه می‌شوید که موارد استثنا بعد از چند ماه پیدا می‌شوند. ربات را بر روی تغییرات اخیر هم برانید یعنی هر مقاله که در ۲۴ ساعت اخیر ویرایش شده را حداقل یک بار بررسی کند. همچنین اجرای ربات بر روی کل ویکی با start:! هم ایده خوبی هست تا هرچه رده نگرفته را رده دهد یاماها۵ / ب ‏۲۰ اوت ۲۰۲۱، ساعت ۱۳:۱۸ (UTC)پاسخ

@Yamaha5: مطمئن نبودم که می‌خواهید ربات را این قدر گسترده برانم. فکر می‌کردم «آزمایشی» یعنی ابعادش محدود باشد. اگر نه که این چه فرقی با مجوز داشتن دارد
طبق آنچه گفتید کاربردش را گسترده می‌کنم که ببینیم چه‌طور عمل می‌کند. — حجت/بحث ‏۲۱ اوت ۲۰۲۱، ساعت ۰۰:۰۷ (UTC)پاسخ
@Huji: بنظرم از دستور (start:آ) به جای (!:start) استفاده کنید چون رده‌های جدید اکثراً با حروف ساخته می‌شوند و کلی رده هم قبل از حروف داریم که خیلی استفاده ای ندارد. یکی هم (start:س) موازی کار کند که سرعت دوبرابر شود.(یواشکی بذارید صدای بنیادی ها درنیاید:)) خود رده‌ها را هم می‌توانید بدهید رده دهی کند. توی کرون تب هم می‌توانید با فواصل کم و تعداد رده‌های کمتر بگذارید چون تعداد بالا ممکن است توقف کند. --M A H D I ‏۲۱ اوت ۲۰۲۱، ساعت ۰۶:۲۷ (UTC)پاسخ
@Mahdiz: نیت‌تان خوب است اما ایده‌ای که دادید نه! :) پای‌ویکی‌بات روش خیلی بهتری برای چیزی که گفتید دارد: استفاده از پارامتر random که به کمک آن هر بار تعداد مشخصی صفحه به طور تصادفی گرفته می‌شوند و ربات رویشان رانده می‌شود.
فعلاً سپردم که هر ساعت هم صفحه‌های جدید را بررسی کند و هم ۵۰۰ صفحه را به طور تصادفی بررسی کند. در این خلال یک اشکال هم کشف کردم (اگر صفحهٔ نظیر در ویکی‌پدیای انگلیسی تغییرمسیر باشد رده‌هایش معمولاً نامربوط هستند و نباید به نسخهٔ ویکی‌پدیای فارسی اضافه شوند) که در کد ربات رفعش کردم. — حجت/بحث ‏۲۳ اوت ۲۰۲۱، ساعت ۲۲:۱۳ (UTC)پاسخ