Распределение Zipf
Распределения Zipf используются для выборки данных на основе закона Zipf.
Закон Ципфа: в коллекции n-й общий термин в 1/n раз больше самого распространенного термина. Например, 5-е общеупотребительное слово в английском языке встречается почти 1/5 раза по сравнению с наиболее часто используемым словом.
Он имеет два параметра:
a
- параметр распределения.
size
- Форма возвращаемого массива.
Пример
Нарисуйте пример дистрибутива zipf с параметром дистрибутива 2 размером 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Визуализация дистрибутива Zipf
Возьмите 1000 точек, но нанесите на график только те, у которых значение < 10, чтобы получить более содержательную диаграмму.
Пример
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()