poj1002

现在的位置: 首页 > 综合 > 正文

2013年10月14日 ⁄ 综合 ⁄ 共 921字 ⁄ 字号小中大 ⁄ 评论关闭

统计重复个数，很容易想到hash，建立一个int数组，把电话号码的数字形式作为hashcode，数组记录出现的次数。

当有海量数据计算重复次数的时候，我们经常这么做，因为数据量相对于hashcode的范围来说是很大的，所以利用hash数组保存出现次数是划算的。

但是这道题hashcode的范围是0~1000000，而n与hashcode相当或更小，这时候hash数组平均下来就会有很多空间被浪费了。

不如反过来，利用一个int[n]的数组，保存的是hashcode，这样空间是全部充分利用的。如果要计算出现次数，那么最后把数组sort一下，相同hashcode的必然在一起，遍历一遍数组就可以知道哪些hashcode出现了多少次了。合计一下，多了个sort，少了很多空间。

以下是discuss里Pcz 童鞋的代码

#include <cstdio>
#include <algorithm>
using namespace std;
char s[31];

int Hash()
{
    int sum=0;
    for(int i=0,k=0;k<7;i++)
    {
        if(s[i]>='0'&&s[i]<='9')
        {
            sum*=10;k++;
            sum+=(s[i]-'0');
        }
        else if(s[i]>='A'&&s[i]<'Z')
        {
            sum*=10;k++;
            sum+=((s[i]-'A'-(s[i]>'Q'))/3+2);
        }
    }
    return sum;
}

int main()
{

    int n;scanf("%d",&n);
    int data[n];getchar();
    for(int tmp=0;tmp<n;tmp++)
    {
        gets(s);
        data[tmp]=Hash();
    }
    sort(data,data+n);
    bool p=false;n--;
    for(int i=0,num=1;i<n;i+=num=1)
    {
        while(data[i]==data[i+1])
        {
            num++;
            i++;
        }
        if(num>1)
        {
            printf("%03d-%04d %d\n",data[i]/10000,data[i]%10000,num);
            p=true;
        }
    }
    if(!p)printf("No duplicates.\n");
    return 0;
}

【上篇】自动化测试工具之 selenium
【下篇】Linux下关于环境变量的一些心得

作者:

该日志由于11年前发表在综合分类下，最后更新于 2013年10月14日.
转载请注明: poj1002 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

poj1002

作者:

书签

最新文章New

本站推荐

返回首页