coiby的头脑风暴
注册日期:
2011-6-1
上次登录:
邮件地址:
coibyxqx@gmail.com
兴趣领域:
数学,物理,系统科学,地球科学
  coiby的头脑风暴
coiby的更多标签
coibyHeaps精华目录
   原文地址:blog.sciencenet.cn/home.php?mod=space&uid=3075&do=blog&id=392985 
Zipf定律是Zipf在1949年的一本关于人类定位的最小作用原理的书中首先提出的,其中最令人难忘的例子是在人类语言中,如果以单词出现的频次将所有单词排序,用横坐标表示序号,纵坐标表示对应的频次,可以得到一条幂函数曲线。这个定律被发现适用于大量复杂系统。Heaps定律是Heaps在1978年一本关于信息挖掘的专著中提出的。事实上,他观察到在语言系统中,不同单词的数目与文本篇幅(所有出现的单词累积数目)之间存在幂函数的关系,其幂指数小于1。
 
很多复杂系统同时满足Zipf定律和Heaps定律,但是对于两者关系,学术界存在长期争论。通过一些随机过程模型,有些学者(Baeza-Yates, Navarro, Leijenhorst, Weide, Serrano, Flammini, Menczer)认为Zipf定律是本质的,Heaps定律是衍生的,可以从Zipf定律推出;有些学者(Zanette, Moutemurro)认为Heaps定律是本质的,Zipf定律是衍生的;有的学者认为这两种定律相互独立。我们不依赖于任何随机过程,证明了Zipf定律更本质,而Heaps定律是衍生律。进一步地,我们证明了以前的两个定律指数之间的解析关系,只是在Zipf指数远大于1或远小于1或系统规模无穷大的时候的一种渐进解。遗憾的是,真实系统不满足三种条件中的任何一种。我们提出了新的解析方法,得到了更精确的解析结果,在35个真实数据中进行验证,发现有34个数...
Heaps 
阅读(3454) | 评论(2) | 收藏(0)
2012-2022 www.swarma.org, all rights reserved