使用shell统计出出现次数排名top10的网址(在博客园中没找到,特转一下)

转自:http://blog.csdn.net/guaguastd/article/details/8332757
使用shell统计出出现次数排名top10的网址
分类: Shell脚本
[plain] view plaincopy技术分享技术分享
 
  1. #!/bin/sh  
  2.   
  3.   
  4. foo()  
  5. {  
  6.     if [ $# -ne 1 ];  
  7.     then  
  8.         echo "Usage:$0 filename";   
  9.         exit -1  
  10.     fi  
  11.   
  12.   
  13. egrep -o "http://[a-zA-Z0-9.]+\.[a-zA-Z]{2,3}" website | awk ‘{ count[$0]++ } END { printf("%-30s %s\n","wensite","count"); for(ind in count) { printf("%-30s %d\n",ind,count[ind]); } }‘ | sort -nrk 2 | head -n 10 >websorted2.txt;  
  14.   
  15.   
  16. }  
  17.   
  18.   
  19. foo website   

 

例子:

文件website中的内容:

http://www.google.com
http://www.baidu.com
http://www.sina.com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.qq.com
http://www.hao123.com
http://www.163.com
http://youku.com
http://taobao/com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.qq.com
http://www.hao123.com
http://www.163.com
http://youku.com
http://taobao/com

生成的文件内容为(即结果)

http://www.yahoo.com           5
http://www.sohu.com            5
http://www.csdn.com            5
http://www.codeproject.com     5
http://mail.163.com            5
http://www.bjtu.edu.cn         3
http://youku.com               2
http://www.qq.com              2
http://www.hao123.com          2
http://www.163.com             2

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。