قانون زیف

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
قانون زیف
پارامترها s>0\, (حقیقی)
N \in \{1,2,3\ldots\} (طبیعی)
‫تکیه‌گاه k \in \{1,2,\ldots,N\}
تابع چگالی احتمال \frac{1/k^s}{H_{N,s}}
تابع توزیع تجمعی‫ (سی‌دی‌اف) \frac{H_{k,s}}{H_{N,s}}
میانگین \frac{H_{N,s-1}}{H_{N,s}}
میانه
مُد 1\,
واریانس
چولگی
کشیدگی
انتروپی \frac{s}{H_{N,s}}\sum_{k=1}^N\frac{\ln(k)}{k^s}
+\ln(H_{N,s})
‫تابع مولد گشتاور (ام‌جی‌اف) \frac{1}{H_{N,s}}\sum_{n=1}^N \frac{e^{nt}}{n^s}
تابع مشخصه \frac{1}{H_{N,s}}\sum_{n=1}^N \frac{e^{int}}{n^s}

جورج کینگزلی زیف استاد زبان شناسی دانشگاه هاروارد، در سال ۱۹۴۹ با آزمایش کلمات کتاب اولیسس جیمز جویس به نتایجی در مورد کلمات و میزان تکرار آنها در متن رسید. نتایج او به این صورت بود که: اگر تمام کلمات یک کتاب را بشماریم و از زیاد به کم مرتب کنبم به این نتیجه می‌رسیم که رتبهٔ هر کلمه با فراوانی(بسامد) همان کلمه نسبت عکس دارد، یعنی تعداد بارهایی که هر کلمه در متن ظاهر می‌شود با رتبهٔ همان کلمه در متن رابطه معکوس دارد. این نسبت در کلمات کل متن برقرار است. که به قانون زیف معروف شده‌است. بر طبق زیف کلمه‌ای که در رتبهٔ ۱ قرار دارد دوبرابر بیشتر از کلمه‌ای در متن ظاهر می‌شود که در رتبهٔ ۲ قرار دارد و ۳ برابر بیشتر از کلمه‌ای ظاهر می‌شود که در رتبهٔ ۳ قرار دارد و همینطور تا آخر.

او این قضیه را با اصل کمترین کوشش توجیه کرد. انسانها بر اساس این اصل تمایل دارند کارهای خود را به گونه‌ای ساده تر انجام دهند و در نوشتن متنی سعی دارند بیشتر از کلمات تکراری استفاده کنند. و به همچنین در هنگام صحبت کردن و سخنرانی سعی دارند کلمات کمتری را بیشتر تکرار کنند.

این رابطه بین فراوانی f و رتبه r برقرار است که: r * f = k حاصل ضرب فراوانی(بسامد) واژه در رتبهٔ آن در کل هر متن عددی (تقریباً) ثابت است.

رابطه لگاریتمی آن شناخته شده تر است و کاربرد بیشتر دارد: log r +log f = log c

این رابطه به جز کلمات در بسیاری از دیگر محیطها از جمله جمعیت شهرها، میزان بازدید از صفحات اینترنت، شرکت‌ها و کارکنان آن و نیز در نمایه سازی خودکار و... استفاده می‌شود. از نظر محققان بسیار عجیب است که چطور و چرا همچنین رابطهٔ ساده ای در بسیاری محیطهای پیچیده اتفاق می‌افتد.
اما به هرحال قانون زیف بسیار ساده‌است چراکه خود زیف زبان شناس بود و به مسائل ریاضی چندان علاقه نداشت. و این فرمول نتوانست محیطهای خیلی پر تکرار را به درستی نشان دهد. بعد از زیف سه عدد ثابت به این فرمول اضافه شد و کمی محاسبهٔ آن را انعطاف پذیرتر کرد. که به زیف مندلبرت معروف است.
ƒ=(r+m)^B